Pdftextstream.

Un testo PDF e la libreria di estrazione dei metadati disponibili per Java, Python e .NET.
Scarica ora

Pdftextstream. Classifica e riepilogo

Annuncio pubblicitario

  • Rating:
  • Licenza:
  • Other/Proprietary Li...
  • Prezzo:
  • USD 1900.00 | BUY the full version
  • Nome editore:
  • Snowtide Informatics Systems, Inc.
  • Sito web dell'editore:
  • http://snowtide.com/

Pdftextstream. Tag


Pdftextstream. Descrizione

Una libreria di estrazione del testo e dei metadati PDF disponibile per Java, Python e .NET. PDFTextStream Project è un testo PDF e una libreria di estrazione dei metadati disponibili per Java, Python e .Net.it supporta tutte le versioni delle specifiche del documento PDF, (incluso V1.6, utilizzato da Acrobat 7), l'estrazione del testo codificata utilizzando il doppio byte Set di caratteri (compresi i cinesi, giapponesi e coreani), la decrittografia di documenti crittografati a 40 bit e 128 bit e l'estrazione di tutti i metadati del documento forniti dai documenti PDF (compresi i dati del modulo, i segnalibri e le annotazioni). L'integrazione facile con Jakarta Lucene è inclusa. Requisiti: · Apache Lucene Cosa c'è di nuovo in questa versione: · Aggiunto un metodo .isstruckthrough () a com.snowttide.pdf.textunit, indicando se un personaggio ha uno strakethrough tirato attraverso di esso. · Miglioramento del supporto di PDFTextStream per mappature dei caratteri incorporati. · Il calcolo dello spazio bianco tra le parole è stato risolto per tenere correttamente l'account di spazi bianchi che è esplicitamente codificato nei documenti PDF di origine. · Miglioramento della gestione delle codifiche del contenuto dei contenuti compositi, che in precedenza potrebbe non riuscire a determinare alcuni intervalli di contenuti PDF "ignorato" durante l'estrazione. · Risolto un bug in VisualiutputtarttartTarget in cui il testo da una singola riga sarebbe suddiviso su più righe · Migliore allineamento verticale del testo estratto utilizzando Visualiutputtarttart · Miglioramento degli estratti di prodotti di visualizzazione di VisualitTarget per eliminare lo spazio bianco aggiuntivo spurio tra parole strettamente adiacenti


Pdftextstream. Software correlato

Pilincido

Pylucid è un sistema di gestione dei contenuti leggeri scritti in Pure Python CGI. ...

128

Scarica

Impresscms.

ImpressCMS è un sistema di gestione dei contenuti sviluppato dalla comunità. ...

118

Scarica

Occhiata

Un potente sistema di indicizzazione e query all'interno del webglimpse. ...

244

Scarica