| Tag zuppa TagSoup è un parser sax2 scritto in Java. |
Scarica ora |
Tag zuppa Classifica e riepilogo
- Sito web dell'editore:
- http://mercury.ccil.org/~cowan/XML/tagsoup/
Tag zuppa Tag
Tag zuppa Descrizione
Tagsoup è un parser sax2 scritto in Java. TagSoup è un parser SAX2 scritto in Java che, invece di analizzare XML ben formato o valido. Tag Minestra Parses HTML come si trova nella natura selvaggia: brutale e brutale, anche se abbastanza spesso da breve. Fornendo un'interfaccia sax, consente di applicare gli strumenti XML standard al peggior html. È un parser, non un'intera applicazione; Non è destinato a ripulire in modo permanente il cattivo HTML BAD, poiché HTML Tidy fa, solo per analizzarlo al volo. Le seguenti opzioni sono comprese: - I file in uscita in singoli file, con estensioni HTML modificate in XHTML. Altrimenti, tutte le uscite vengono inviate all'uscita standard. - L'outputHTML è in HTML pulito: la dichiarazione XML è soppressa, come sono end-tag per gli elementi vuoti noti. - Dichiarazione -omita-XML-Dichiarazione La dichiarazione XML è soppressa. --Method = End-tag HTML per gli elementi HTML vuoti noti sono soppressi. L'output di hypyx è in formato PYX. L'ingresso di hypyxin è in formato Pyxoid (non è necessario essere ben formati). - non sono soppressi dei namespazi. Normalmente, tutti gli elementi sono nello spazio dei nomi XHTML 1.x e tutti gli attributi non sono in nessun spazio dei nomi. - Nobogons Bogons (elementi sconosciuti) sono soppressi. Normalmente, sono trattati come vuoti. --Nodefauls Sosprimere i valori di attributo predefiniti --Nocolons Cambia i coloni espliciti in elementi e nomi di attributi a Underscores --norestart Non riavviare alcun elemento normalmente riavvibile --any Bogons viene assegnato un modello di contenuto di qualsiasi vuoto. - PASSARE PRESENTE ATTRAVERSO I commenti HTML. Non ha alcun effetto quando l'output è in formato PYX. - - Riutilizzare una singola istanza del parser tagsoup in tutto. Normalmente, uno nuovo è istanziato per ciascun file di input. --Nocdata cambia i modelli di contenuto degli elementi di script e di stile per trattarli come elementi ordinari #pcdata (solo testo), come in XHTML, piuttosto che con il modello di contenuto CDATA speciale. --encoding = Codifica Specificare la codifica dell'ingresso. L'impostazione predefinita è la piattaforma Java predefinita. - Help di stampahelp. --version Stampa il numero di versione.requirements: · Java 1.4.2 o laurerewhat è nuovo in questa versione: · Il problema principale era con commenti HTML, che erano molto gravemente rotti: qualsiasi> il personaggio terminerà uno, quindi commentare gli elementi no funziona correttamente. · Tutto dovrebbe ora essere corretto. · Tutti dovrebbero aggiornare chi è possibile. · Inoltre, #xnnnn (con capitale x) ora funziona, un codice di debug è stato rimosso dal PyxWriter, viene saltato un BOM Unicode all'inizio di un documento viene saltato e la nuova versione di Saxon è supportata come processore XSLT. · La documentazione è stata aggiunta su funzionalità sax e proprietà specifiche per taggsoup.
Tag zuppa Software correlato