Cerca :: freetExt.

Cerca :: freetExt è un modulo di indicizzazione del testo gratuito per corponi di testo a medio-grande.
Scarica ora

Cerca :: freetExt. Classifica e riepilogo

Annuncio pubblicitario

  • Rating:
  • Licenza:
  • Perl Artistic License
  • Prezzo:
  • FREE
  • Nome editore:
  • Stuart Watt
  • Sito web dell'editore:
  • http://search.cpan.org/~snkwatt/Search-FreeText-0.05/FreeText.pm

Cerca :: freetExt. Tag


Cerca :: freetExt. Descrizione

Cerca :: FREETEXT è un modulo di indicizzazione a testo libero di medio-grandi corpus di testo. Cerca :: FREETEXT è un modulo di indicizzazione a testo libero di medio-grandi dimensioni del testo corpuses.SYNOPSIS mio $ test = new Cerca :: FREETEXT (-db => ); $ Testo-> open_index (); $ Testo-> clear_index (); $ Testo-> index_document (1, "Ciao mondo"); $ Testo-> index_document (2, "World in movimento"); $ Testo-> index_document (3, "Cruel Crazy Beautiful world"); $ Testo-> index_document (4, "Hey pazzo"); $ Testo-> close_index (); $ Testo-> open_index (); foreach ($ testo-> ricerca ( "Crazy", 10)) {print "$ _-> , $ _-> n"; }; $ Testo-> close_index (); Questo modulo fornisce la ricerca di testo libero in un modo relativamente aperta. Esso consente un indice di inverted file persistente per essere costruito e gestito (entro certi limiti), e quindi da ricercare piuttosto efficiente. Il modulo dipende da un modulo DBM di qualche tipo per gestire il file invertita (DB_File di solito è la scelta migliore, in quanto è abbastanza veloce, molto scalabile, e accetta i valori lunghi che sono necessari per Is performance.The testo libero algoritmo di ricerca utilizzati il sistema di ponderazione BM25 descritto nel Robertson, SE, Walker, S., Beaulieu, MM, Gatford, M., e Payne, A. (1995). Okapi a TREC-4, in NIST Special pubblicazione 500-236, la Quarta di testo Retrieval Conference (TREC-4), pagine 73-96.Much del modulo dipende da un sistema di analisi lessicale aperta, che viene realizzato tramite Cerca :: :: FREETEXT LexicalAnalysis. Qui è dove tutti la suddivisione delle parole e DERIVANTI viene gestita (Lingua :: Stem viene utilizzato per la arginare) .using il modulo è abbastanza semplice:. è possibile aprire un indice e vicino, e mentre è aperto si aggiungere documenti come stringhe, ciascuna con una chiave di propria scelta è possibile cercare il corpus utilizzando una stringa, e si ottiene di nuovo un elenco di partite, ciascuna di una serie di vostra chiave documento e un relevanc e misurare. Così, ad esempio, le chiavi potrebbero essere le chiavi di tabella di database, URL, nomi di file, niente del genere farà. Questo rende Cerca :: FREETEXT un pacchetto molto utile per implementare sistemi di ricerca di qualità abbastanza efficiente e di alta. Requisiti: · Perl.


Cerca :: freetExt. Software correlato

Java :: Swing.

Java :: Swing fornisce un'estensione perl che fornisce accesso diretto all'API Swing Java. ...

242

Scarica