Gerico HTML Parser.

Parser HTML gratuito e open source per il tuo Mac
Scarica ora

Gerico HTML Parser. Classifica e riepilogo

Annuncio pubblicitario

  • Rating:
  • Licenza:
  • GPL
  • Prezzo:
  • FREE
  • Nome editore:
  • M Jericho
  • Sito web dell'editore:
  • http://jericho.htmlparser.net/doc/index.html
  • Sistemi operativi:
  • Mac OS X
  • Dimensione del file:
  • 1.7 MB

Gerico HTML Parser. Tag


Gerico HTML Parser. Descrizione

Parser HTML gratuito e open source per il tuo Mac Gerico HTML Parser è una libreria Java open source che consente l'analisi e la manipolazione di parti di un documento HTML, inclusi i tag sul lato server, mentre si riproducono verbatim qualsiasi html non valido o non riconosciuto. Gerico HTML Parser fornisce anche funzioni di manipolazione del modulo HTML di alto livello. Ecco alcune caratteristiche chiave di "Gerico HTML Parser": · · La presenza di html gravemente formattato non interferisce con l'analisi del resto del documento, il che rende la biblioteca ideale per l'utilizzo con HTML "Real-World" che soffoca altri parser. · · I tag del server PHP, JSP, ASP, PSP e MASON Server sono esplicitamente riconosciuti dal parser. Ciò significa che l'HTML normale è ancora analizzato correttamente anche se ci sono tag del server all'interno di loro, che è comune ad esempio quando impostare dinamicamente gli attributi degli elementi. · · Non è né un evento né un parser basato su un albero, ma utilizza piuttosto una combinazione di semplice ricerca testo, riconoscimento efficiente del tag e una cache di posizione del tag. Il testo dell'intero documento di origine viene prima caricato in memoria, quindi solo i segmenti pertinenti hanno cercato i caratteri pertinenti di ciascuna operazione di ricerca. · · Rispetto a un parser a base di albero come DOM, la memoria e i requisiti delle risorse possono essere molto meglio se solo piccole sezioni del documento devono essere analizzate o modificate. HTML errato o gravemente formattato può essere facilmente ignorato, a differenza dei parser a base degli alberi che devono identificare ogni nodo nel documento dall'alto verso il basso. · · Rispetto a un parser basato su eventi come sax, l'interfaccia è su un livello molto più alto e più intuitivo, e una rappresentazione dell'albero della gerarchia dell'elemento del documento è facilmente creabile se necessario. · · Le posizioni iniziali e finali nel documento sorgente di tutti i segmenti analizzati sono accessibili, consentendo la modifica di solo segmenti selezionati del documento senza dover ricostruire l'intero documento da un albero. · · Il numero di riga e colonna di ciascuna posizione nel documento di origine è facilmente accessibile. · · Fornisce un'interfaccia semplice ma completa per l'analisi e la manipolazione dei controlli del modulo HTML, compresa l'estrazione e la popolazione dei valori iniziali e la conversione alle modalità di visualizzazione dei sola lettura o dei dati. L'analisi dei controlli del modulo consente inoltre ai dati ricevuti dal modulo da conservare e presentato in modo appropriato. · · I tipi di tag personalizzati possono essere facilmente definiti e registrati per il riconoscimento da parte del parser. · · Funzionalità integrata per estrarre tutto il testo da HTML Markup, adatto per l'alimentazione in un motore di ricerca del testo come Apache Lucene. · Funzionalità integrata per rendere il markup HTML con una formattazione semplice del testo. · Funzionalità integrata per formattare il codice sorgente HTML che trattiene elementi in base alla loro profondità nella gerarchia dell'elemento del documento. · · Funzionalità integrata al codice sorgente HTML compatto rimuovendo tutti gli inutili spazi bianchi.


Gerico HTML Parser. Software correlato

Rage WebDesign.

Crea pagine Web, testarli su tutti i browser e li pubblicano con questo fantastico software ...

608 17.4 MB

Scarica

Enkoder

Enkoder - nasconde gli indirizzi e-mail pubblicati sui siti dei raccoglitori spam ...

166 147 KB

Scarica

Bygga.

Byggra è uno strumento potente e flessibile per la creazione di siti Web di piccole e medie dimensioni ...

209 747 KB

Scarica