The Lemur Toolkit.

Free Language Modeler per Mac OS X
Scarica ora

The Lemur Toolkit. Classifica e riepilogo

Annuncio pubblicitario

  • Rating:
  • Licenza:
  • Freeware
  • Prezzo:
  • FREE
  • Nome editore:
  • The Lemur Team
  • Sito web dell'editore:
  • http://www.lemurproject.org/
  • Sistemi operativi:
  • Mac OS X
  • Dimensione del file:
  • 63.2 MB

The Lemur Toolkit. Tag


The Lemur Toolkit. Descrizione

Modello di lingua libera per Mac OS X Il Lemur Toolkit è stato progettato per facilitare la ricerca nella modellizzazione della lingua e il recupero delle informazioni, comprese tali tecnologie come ad hoc e distribuito recupero, riepilogo, riassunto, IR del linguaggio cross-lingua, filtraggio e classificazione. Cosa c'è di nuovo in questa versione: · 4.9 Corregge vari problemi nel pacchetto di distribuzione 4.8, fornisce un nuovo · FileClassenvironment per l'ingresso del file WARC, varie velocità di indicizzazione · Ottimizzazioni per INDRI; e altro ancora. · Le applicazioni compilate con il TOOLKIT Lemur richiedono quanto segue · Biblioteche: z, iberty, pthread e m su Linux e inoltre socket · E NSL su Solaris. Le applicazioni integrate in studio visivo richiedono il · Biblioteca aggiuntiva wsock32.lib. I file Jara Java sono stati costruiti con · Java 5 (JDK 1.5.0). L'UIS Java richiede Java 5. Abbiamo testato usando GCC · 3.2 (Solaris), 3.2.2 (Linux), 3.4 (Linux), 3.4.3 (Linux X86_64), 4.0.2 (Linux), · 4.3.1 (OS / X), VC ++ .NET 7.1 (Windows XP) e Visual Studio 2005 (Windows · XP). Miglioramenti: · I vincoli layoutmanager sono stati modificati per migliorare il ridimensionamento · Comportamento dei componenti. · La barra degli strumenti del registro della query e il server supporta il caricamento automatico del registro · File su una base pianificata. Questa preferenza può essere impostata dall'utente del · Barra degli strumenti per completamente automatica, automatica con conferma richiesta · Prima del caricamento o del caricamento manuale solo. · Un nuovo fileclassenvironment, Warc, è stato aggiunto a INDRI. Questo ambiente · Abilita l'indicizzazione del corpus clueweb09, · Http: //boston.lti.cs.cmu.edudata/clueweb09/ · Ottimizzazioni di velocità di indicizzazione INDRI, che forniscono il 5-15% di velocità per Gov2 (25 Million Documents) Collezioni di dimensioni: · 1) Ridurre il numero di allocazioni di memoria / deallocations in · Indexwriter :: _ lookuptermid. · 2) Utilizzare l'opzione delle tabelle complete, -cf, di flex. · 3) Non fare la normalizzazione del caso ASCII in · UTF8CasenormalizationTransformation, come è ridondante. · 4) Utilizzare Hash_Set dallo STL anziché Stringa_Set per Stopwords. · 5) Se il conteggio cancellato è 0 in DeletedDocumentList, non acquisire la lettura · Blocco prima di tornare falso. · 6) Utilizzare il rivestimento, piuttosto che unire, nel repositorymaintenancethread, a · Ridurre gli indici temporanei dei tempi numerici vengono copiati. Smettere di raccogliere il taglio · Candidati quando un indice due volte la dimensione dell'indice precedente è · Incontrato. · 7) Prendi in considerazione la dimensione dei diskindexes durante la stima della memoria · Uso. · 8) Limitare la quantità totale di memoria utilizzata per la cache Lunghezze del documento a 20 MB · (5.000.000 di documenti).


The Lemur Toolkit. Software correlato

WebICONCM.

consente di aggiungere "icone di scelta rapida" ai file di posizioni Web. ...

130 285 KB

Scarica