Lingua :: en :: Riassumi

Uno strumento semplice per riassumere gli organismi di testo inglese.
Scarica ora

Lingua :: en :: Riassumi Classifica e riepilogo

Annuncio pubblicitario

  • Rating:
  • Licenza:
  • Perl Artistic License
  • Prezzo:
  • FREE
  • Nome editore:
  • Dennis Taylor
  • Sito web dell'editore:
  • http://www.funkplanet.com/spellcast/

Lingua :: en :: Riassumi Tag


Lingua :: en :: Riassumi Descrizione

Uno strumento semplice per riassumere gli organismi di testo inglese. LINGUA :: IT :: Riepilogo è un semplice strumento Perl per riassumere gli organismi di inglese .synopsis Utilizzare Lingua :: en :: Riepilogo; My $ Sommario = riassumare ($ testo); # Facile, no? :-) My $ Sommario = Riepilogo ($ testo, maxLength => 500); Sommario # 500-byte My $ Sommario = Riepilogo ($ testo, filtro => 'html'); # Striscia HTML Formattazione My $ Sommario = Riassumo ($ testo, wrap => 75); # Avvolgere l'uscita a 75 col.Questo è un modulo semplice che rende uno sforzo non scientifico per riassumere il testo inglese. Riconosce i modelli semplici che sembrano affermazioni, li abbracciano e li concatenano in qualcosa di vagamente simile a un riassunto. Ha bisogno di più lavoro su grandi corpi di testo, ma sembra avere un effetto decente su piccoli input al momento.lingua :: en :: riepiloga le esportazioni una funzione, riassumare (), che prende il testo per riassumere come primo argomento e qualsiasi numero di direttive opzionali in nome => modulo valore. Le opzioni che prenderranno: MaxLength Specifica la lunghezza massima, in byte, del riepilogo generato. Prettyprints generato l'output di riepilogo, avvolgendolo al numero di colonne che specifichi.Filter passa il testo attraverso un filtro prima di consegnarlo a un filtro il riassuntore. Attualmente, sono implementati solo due filtri: "HTML", che utilizza HTML :: Treebuilder e HTML :: Formattext per spogliare tutte le formattazione HTML da un documento e "easyhtml", che rapidamente (e meno accuratamente) si spoglia tutto HTML da un documento Usando una semplice espressione regolare, se non si dispone dei moduli sopra menzionati. Un filtro "Email", per la conversione dei messaggi di posta e notizie per il testo facilmente riassumobile, è nei lavori per la prossima versione.Unificare il modulo HTML :: Riassunto (che è abbastanza interessante, e merita un'occhiata), questo modulo considera il suo Input per essere semplice testo inglese e non tenta di raccogliere alcuna informazione dalla formattazione. Pertanto, senza spunti dal formato del documento, lo schema che HTML :: Riassunto Usi non è applicabile qui. Lo schema attuale va come questo: "Filtra il testo in base all'opzione del filtro dell'utente. Dividere il testo in frasi discrete con il testo :: Modulo frasele, quindi dividerli ulteriormente in clausole su virgole e virgola. Tieni solo quelli che hanno A Struttura (soggetto molto semplice-Verb object). Costruisci il riepilogo delle prime frasi nell'elenco, rimanendo entro il limite massima, o meno del 30% della dimensione del testo originale, a seconda di quale è più piccolo. "Inutile dire , questo è uno schema molto semplice e non terribilmente universalmente efficace, ma è abbastanza buono per una prima bozza e ne sbatterò più tardi. Come ho detto, non è un approccio scientifico al problema, ma è meglio di niente (e spesso meglio di HTML :: Riassunto!), E non ho davvero bisogno di A.I. output di qualità da esso. Requisiti: · Perl.


Lingua :: en :: Riassumi Software correlato