Gerico HTML Parser.Parser HTML gratuito e open source per il tuo Mac | |
Scarica ora |
Gerico HTML Parser. Classifica e riepilogo
Annuncio pubblicitario
- Licenza:
- GPL
- Prezzo:
- FREE
- Nome editore:
- M Jericho
- Sito web dell'editore:
- http://jericho.htmlparser.net/doc/index.html
- Sistemi operativi:
- Mac OS X
- Dimensione del file:
- 1.7 MB
Gerico HTML Parser. Tag
Gerico HTML Parser. Descrizione
Parser HTML gratuito e open source per il tuo Mac Gerico HTML Parser è una libreria Java open source che consente l'analisi e la manipolazione di parti di un documento HTML, inclusi i tag sul lato server, mentre si riproducono verbatim qualsiasi html non valido o non riconosciuto. Gerico HTML Parser fornisce anche funzioni di manipolazione del modulo HTML di alto livello. Ecco alcune caratteristiche chiave di "Gerico HTML Parser": · · La presenza di html gravemente formattato non interferisce con l'analisi del resto del documento, il che rende la biblioteca ideale per l'utilizzo con HTML "Real-World" che soffoca altri parser. · · I tag del server PHP, JSP, ASP, PSP e MASON Server sono esplicitamente riconosciuti dal parser. Ciò significa che l'HTML normale è ancora analizzato correttamente anche se ci sono tag del server all'interno di loro, che è comune ad esempio quando impostare dinamicamente gli attributi degli elementi. · · Non è né un evento né un parser basato su un albero, ma utilizza piuttosto una combinazione di semplice ricerca testo, riconoscimento efficiente del tag e una cache di posizione del tag. Il testo dell'intero documento di origine viene prima caricato in memoria, quindi solo i segmenti pertinenti hanno cercato i caratteri pertinenti di ciascuna operazione di ricerca. · · Rispetto a un parser a base di albero come DOM, la memoria e i requisiti delle risorse possono essere molto meglio se solo piccole sezioni del documento devono essere analizzate o modificate. HTML errato o gravemente formattato può essere facilmente ignorato, a differenza dei parser a base degli alberi che devono identificare ogni nodo nel documento dall'alto verso il basso. · · Rispetto a un parser basato su eventi come sax, l'interfaccia è su un livello molto più alto e più intuitivo, e una rappresentazione dell'albero della gerarchia dell'elemento del documento è facilmente creabile se necessario. · · Le posizioni iniziali e finali nel documento sorgente di tutti i segmenti analizzati sono accessibili, consentendo la modifica di solo segmenti selezionati del documento senza dover ricostruire l'intero documento da un albero. · · Il numero di riga e colonna di ciascuna posizione nel documento di origine è facilmente accessibile. · · Fornisce un'interfaccia semplice ma completa per l'analisi e la manipolazione dei controlli del modulo HTML, compresa l'estrazione e la popolazione dei valori iniziali e la conversione alle modalità di visualizzazione dei sola lettura o dei dati. L'analisi dei controlli del modulo consente inoltre ai dati ricevuti dal modulo da conservare e presentato in modo appropriato. · · I tipi di tag personalizzati possono essere facilmente definiti e registrati per il riconoscimento da parte del parser. · · Funzionalità integrata per estrarre tutto il testo da HTML Markup, adatto per l'alimentazione in un motore di ricerca del testo come Apache Lucene. · Funzionalità integrata per rendere il markup HTML con una formattazione semplice del testo. · Funzionalità integrata per formattare il codice sorgente HTML che trattiene elementi in base alla loro profondità nella gerarchia dell'elemento del documento. · · Funzionalità integrata al codice sorgente HTML compatto rimuovendo tutti gli inutili spazi bianchi.
Gerico HTML Parser. Software correlato
Rage WebDesign.
Crea pagine Web, testarli su tutti i browser e li pubblicano con questo fantastico software ...
608 17.4 MB
Enkoder
Enkoder - nasconde gli indirizzi e-mail pubblicati sui siti dei raccoglitori spam ...
166 147 KB
Bygga.
Byggra è uno strumento potente e flessibile per la creazione di siti Web di piccole e medie dimensioni ...
209 747 KB