Il progetto Lemur download gratuito, Il progetto Lemur download sul download del software

Applicazione per la modellazione della lingua e l'applicazione di recupero delle informazioni Il Lemur Toolkit è un'applicazione gratuita e open source progettata per facilitare la ricerca nella modellizzazione della lingua e il recupero delle informazioni. Il TOOLKIT Lemur include tecnologie come ad hoc e recupero distribuito, recupero di cross-lingua, riepilogamento, filtraggio e classificazione. Ecco alcune caratteristiche chiave di "The Lemur Project": · Lingue di query strutturate sofisticate (utilizzando incoraria e INDRI) · Supporto per il recupero del documento XML e strutturato · Utilizzato comunemente con una vasta gamma di collezioni di test di ricerca (ad esempio, Trec CDS 1-5, WT10G, RCV1, Gov, Gov2) · Indice le tue pagine Web con una capacità di ricerca del sito "out-of-the-box" · Interfacce interattive per Windows, Linux e Web · Applicazioni di recupero delle informazioni distribuite e applicazioni del clustering del documento · Codice multipiattaforma, rapido e modulare scritto in C ++ · API di C ++, Java e C # · Software gratuito e open source · In uso da oltre 6 anni da una grande e crescita della comunità degli utenti Indicizzazione: · Metodi di indicizzazione multipli per raccolte piccole, medie e su larga scala (terabyte) · Supporto integrato per il testo inglese, cinese e arabo · Porter e Krovetz Word stemming · Indicizzazione incrementale · Supporto per indicizzazione out-of-the-box per TREC Text, Trec Web, Text Trec Text, HTML, XML, PDF, MBOX, Microsoft Word e Microsoft PowerPoint · Indici Inline e offset annotazioni di testo (ad es., Parte di part-of-discorso e entità nominate) · Attributi dei documenti degli indici Recupero: · Supporta approcci di modellazione delle lingue principali come INDRI e KL-Divergence, oltre a spazio vettoriale, TF.IDF, OKAPI e Inquisty · Rilevanza - e feedback per rilevanza pseudo · Espansione del termine jolly (usando INDRI) · Passaggio e recupero dell'elemento XML · Recupero cross-lingual · Levigatura tramite priori di Dirichlet e catene Markov · Supporta i priori del documento arbitrario (ad esempio, page rank, profondità dell'URL) Cosa c'è di nuovo in questa versione: · 2799440 Terminfo restituito da indriterminfolist non ha posizioni · 2794361 HarvestLinks non riesce a creare directory di raccolta · 2788507 Krovetzstemmertransformation può traboccare un buffer · 2788504 ANCHORTESTORNOTORNOTOSNOTATOR può traboccare un buffer · 2787935 Dumps PageRank Core se il percorso dei collegamenti è cattivo · 2784994 Articolo errato · 2783665 TextTokenizer Termina prematuramente Attributi tag quotati · 2782954 INDRI :: Parse :: HTMLParser :: La handletag può traboccare un buffer · 2772914 IREVALGUI.JAR dà risultati folli · 2772846 BIN / IREVAL.JAR è un file .jar non valido (Lemur V48) · 2770916 Corruzione del buffer di DocumentLength con thread multipli · 2747981 Warcdocumenterator manca i documenti nel file WARC · 2747707 TextTokenizer non riconosce alcuni attributi di tag quotati

Il progetto Lemur Software correlato

Log4cocoa.

Porto di Log4j basato su obiettivi-c ...

N/A 168 81 KB

Scarica

Rakun.

Un quadro di sviluppo dell'applicazione del database open source ...

N/A 292 227 KB

Scarica

Tardiff.

Utility di patching di archivio gratuito e open source ...

N/A 186 40 KB

Scarica

Pyhttp.

Server HTTP basato su Python gratuito e open source ...

N/A 158 36 KB

Scarica

XCCDF2PDF.

Utility della riga di comando che converte i documenti XCCDF in documenti PDF ...

N/A 200 8.1 MB

Scarica

Chi siamo

softwaresea.com fornisce l'ultimo centro di download gratuito di software verde in patria e all'estero, inclusi software per computer, applicazioni Apple, applicazioni Android e altri download gratuiti di software mobili per computer. Se vuoi saperne di più sul software gratuito verde, scaricalo su softwaresea.com!