| Pdftextstream. Un testo PDF e la libreria di estrazione dei metadati disponibili per Java, Python e .NET. |
Scarica ora |
Pdftextstream. Classifica e riepilogo
- Licenza:
- Other/Proprietary Li...
- Prezzo:
- USD 1900.00 | BUY the full version
- Nome editore:
- Snowtide Informatics Systems, Inc.
- Sito web dell'editore:
- http://snowtide.com/
Pdftextstream. Tag
Pdftextstream. Descrizione
Una libreria di estrazione del testo e dei metadati PDF disponibile per Java, Python e .NET. PDFTextStream Project è un testo PDF e una libreria di estrazione dei metadati disponibili per Java, Python e .Net.it supporta tutte le versioni delle specifiche del documento PDF, (incluso V1.6, utilizzato da Acrobat 7), l'estrazione del testo codificata utilizzando il doppio byte Set di caratteri (compresi i cinesi, giapponesi e coreani), la decrittografia di documenti crittografati a 40 bit e 128 bit e l'estrazione di tutti i metadati del documento forniti dai documenti PDF (compresi i dati del modulo, i segnalibri e le annotazioni). L'integrazione facile con Jakarta Lucene è inclusa. Requisiti: · Apache Lucene Cosa c'è di nuovo in questa versione: · Aggiunto un metodo .isstruckthrough () a com.snowttide.pdf.textunit, indicando se un personaggio ha uno strakethrough tirato attraverso di esso. · Miglioramento del supporto di PDFTextStream per mappature dei caratteri incorporati. · Il calcolo dello spazio bianco tra le parole è stato risolto per tenere correttamente l'account di spazi bianchi che è esplicitamente codificato nei documenti PDF di origine. · Miglioramento della gestione delle codifiche del contenuto dei contenuti compositi, che in precedenza potrebbe non riuscire a determinare alcuni intervalli di contenuti PDF "ignorato" durante l'estrazione. · Risolto un bug in VisualiutputtarttartTarget in cui il testo da una singola riga sarebbe suddiviso su più righe · Migliore allineamento verticale del testo estratto utilizzando Visualiutputtarttart · Miglioramento degli estratti di prodotti di visualizzazione di VisualitTarget per eliminare lo spazio bianco aggiuntivo spurio tra parole strettamente adiacenti
Pdftextstream. Software correlato