Gerico HTML Parser.

Una libreria Java semplice ma potente che consente l'analisi e la manipolazione di parti di un documento HTML.
Scarica ora

Gerico HTML Parser. Classifica e riepilogo

Annuncio pubblicitario

  • Rating:
  • Licenza:
  • LGPL
  • Prezzo:
  • FREE
  • Nome editore:
  • Martin Jericho
  • Sito web dell'editore:

Gerico HTML Parser. Tag


Gerico HTML Parser. Descrizione

Una biblioteca Java semplice ma potente che consente l'analisi e la manipolazione di parti di un documento HTML. Jerich HTML Parser è una biblioteca Java semplice ma potente che consente l'analisi e la manipolazione di parti di un documento HTML, compresi alcuni elementi comuni del server del server, mentre si riproducono verbatim qualsiasi HTML non riconosciuto o non valido. Fornisce inoltre funzioni di manipolazione del modulo HTML di alto livello. Il progetto HTML Parserjericho è una libreria open source rilasciata nell'ambito della Licenza General Public GNU Lesser (LGPL). È quindi libero di usarlo nelle applicazioni commerciali soggette ai termini dettagliati nel documento della licenza. Ecco alcune caratteristiche chiave di "Gerico HTML Parser": · Nessun albero antigas dell'intero documento è mai generato. Il testo della sorgente del documento viene cercato solo per il markup rilevante per il funzionamento corrente. Ciò consente alla biblioteca di analizzare e modificare i documenti contenenti html errati o gravemente formattati o qualsiasi altro server o codice laterale client, script, macro o markup del client. La maggior parte degli altri parser non può gestire il contenuto che non sono esplicitamente programmati per accettare. · Le posizioni iniziali e finali nel testo sorgente di tutti i segmenti analizzati sono accessibili, consentendo la modifica di solo segmenti selezionati del documento senza dover ricostruire l'intero documento da un albero antigas. Questa funzione, in combinazione con quella sopra, rende il toolkit estremamente potente nella sua semplicità. · Fornisce un'interfaccia semplice ma completa per l'analisi e la manipolazione dei controlli del modulo HTML, compresa l'estrazione e la popolazione dei valori iniziali e la conversione alle modalità di visualizzazione dei sola lettura o dei dati. L'analisi dei controlli del modulo consente inoltre ai dati ricevuti dal modulo da conservare e presentato in modo appropriato. · I tag del server ASP, JSP, PSP, PHP e MASON possono essere registrati per il riconoscimento da parte del parser, e sono riconosciuti in modo accurato possibile senza incorporare parser reali per queste lingue nella libreria. La biblioteca consente quindi che uno di questi segmenti venga ignorato quando si analizza il resto del documento in modo che non interferiscano con la sintassi HTML. (vedi segment.ignorewhenparsing ()) · I tipi di tag personalizzati possono essere facilmente definiti e registrati per il riconoscimento da parte del parser. Cosa c'è di nuovo in questa versione: Correzioni di bug: · Loop infinito su segment.getallstartttags () · Loop infinito su segment.getallelements () · Segment.getFirst * Metodi restituiti segmenti al di fuori del segmento di delimitazione. · I metodi di segmento.getallements non hanno restituito tutti gli elementi chiusi in alcune circostanze. · Risolti errori di documentazione nei metodi Segment.Gagliale. · Aggiunta classe Streamedsource. Modifiche che potrebbero influire sul comportamento dei programmi esistenti: · Modificato PARSETEXT da Class to Interface. · Segmento.GetNodeiterator () Ora restituisce i riferimenti dei caratteri come nodi separati. · Aggiunti metodi di ricerca del tag in base al valore dell'attributo Espressioni regolari. · Aggiunti metodi di ricerca tag basati sull'attributo di classe HTML. · Aggiunta la fonte statica.LegacynodeiteratorCompatabilityMode Proprietà temporaneamente per ripristinare Segment.Getnodeiterator () funzionalità a quella delle versioni precedenti. · Rimosso char [] Metodi di ricerca basati su PARSETEXT. · Aggiunto il metodo di baseference.appendcharto (appendice). · Aggiunto costruttore outputDocument (Segmento). · Aggiunto il programma di campionamento in streamedsourcecopy.


Gerico HTML Parser. Software correlato

Rxp.

RXP è un parser XML convalidatore scritto in C. ...

189

Scarica

Latex2ps.

LaTeX2PS è un'interfaccia grafica per il compito di documenti in lattice. ...

188

Scarica

Latex2html.

LateX2HTML è un convertitore scritto in Perl che converte i documenti in lattice in HTML. ...

333

Scarica

Simplexml.

simplexml è un'applicazione e una libreria di comando per la manipolazione di file XML molto semplicemente. ...

171

Scarica