Terrier

terrier - motore di ricerca altamente flessibile, efficiente e robusto, facilmente dispiegabile su collezioni su larga scala di documenti
Scarica ora

Terrier Classifica e riepilogo

Annuncio pubblicitario

  • Rating:
  • Licenza:
  • Freeware
  • Prezzo:
  • FREE
  • Nome editore:
  • University of Glasgow
  • Sito web dell'editore:
  • http://ir.dcs.gla.ac.uk/terrier/index.html
  • Sistemi operativi:
  • Mac OS X
  • Dimensione del file:
  • 5.8 MB

Terrier Tag


Terrier Descrizione

Terrier - motore di ricerca altamente flessibile, efficiente e robusto, facilmente dispiegabile su collezioni su larga scala di documenti Terrier è un motore di ricerca altamente flessibile, efficiente, efficace e robusto, facilmente dispiegabile su collezioni su larga scala di documenti. Terrier implementa le funzionalità di indicizzazione e recupero di indicizzazione all'avanguardia. Terrier fornisce una piattaforma ideale per il rapido sviluppo di applicazioni di recupero su larga scala. La versione open source di Terrier offre una piattaforma flessibile, completa, trasparente e robusta per la ricerca e la sperimentazione nel recupero del testo. La ricerca messa in Terrier si espande costantemente nuove I rami del più ampio campo di recupero delle informazioni, rendendo terrier una piattaforma ideale, forte, modulare e all'avanguardia per lo sviluppo, la valutazione e la valutazione di nuovi concetti e idee. Tirerier è scritto in Java ed è stato utilizzato per il web e Ricerca aziendale, Desktop, Intranet e motori di ricerca verticale, oltre a sviluppare e valutare nuove tecniche e applicazioni di recupero delle informazioni di testo su larga scala. Citerrier è in fase di sviluppo nel Dipartimento di Computing Science, presso l'Università di Glasgow.Hhere sono alcune caratteristiche chiave Di "Terrier": Generale: · Supporto indicizzante per i formati di file desktop comuni e per le raccolte di ricerca TREC comunemente utilizzate (ad esempio Trec CDS 1-5, WT2G, WT10G, GOV, Gov2, Blogs06). · Molti modelli di ponderazione del documento, come molte divergenze senza parametri da modelli di ponderazione a caso, okapi BM25 e modellazione della lingua. · Lingua della query convenzionale supportata, comprese le frasi e i termini che si verificano nei tag. · Gestione Indicizzazione completa del testo delle collezioni di documenti su larga scala, in un'architettura centralizzata ad almeno 25 milioni di documenti. · API modulari e aperte di indicizzazione e interrogazione, per consentire un'estensione facile per le proprie applicazioni e ricerche. · Ricerche di recupero delle informazioni attive alimentate Piattaforma open source. · Open source (Mozilla Public License). · Scritto in Java multipiattaforma - Lavori su Windows, Mac OS X, Linux e Unix. · Grande base utente oltre 3 anni di pubblicazione: · Indicizzazione della scatola delle collezioni di documenti taggate, come le collezioni TRIC Test. · Indicizzazione della scatola per documenti di vari formati, come HTML, PDF o Microsoft Word, file di Excel e PowerPoint. · Indicizzazione del campo informazioni, tali Come titolo, H1, HTML Tag Informazioni · Indicizzazione delle informazioni sulla posizione su una parola o un blocco (ad es. una finestra di termini a distanza) livello. · Supporto per varie codifiche di documenti (UTF), per facilitare il recupero multi-linguale. · Strutture dati del disco di indice altamente compresso. · File diretto altamente compresso per espansione di query efficiente. · Singolo più veloce alternativo -Passare l'indicizzazione. · Varie tecniche stemming supportate, incluso il teste di neve per la palla di neve per le lingue europee .Retrievale: · Fornisce strutture di interrogazione standard, nonché l'espansione della query (feedback per rilevanza pseudo) · Può essere applicato in applicazioni interattive, come il desktop incluso Cerca o in un'impostazione batch per la ricerca e la sperimentazione. · Fornisce molti modelli di ponderazione dei documenti standard, inclusa fino a 126 divergenza dei modelli di classificazione dei documenti di casualità (DFR) e altri modelli come Okapi BM25, modellazione della lingua e TF-IDF. È incluso anche il nuovo modello di ponderazione DFRE DFR, che fornisce prestazioni robuste su una gamma di raccolte di test senza la necessità di alcuna sintonizzazione o formazione di parametri. · Linguaggio avanzato della query che supporta operatori booleani, +/- operatori, frase e ricerca di prossimità, e campi. · Fornisce un numero di modelli di ponderazione a termine DFR senza parametri per l'espansione automatica della query, oltre all'espansione della query di Rocchio. · Elaborazione flessibile dei termini attraverso una pipeline di componenti, come le parole di stop-words e stemmers.experimentation: · Maniglie Tutte le collezioni TRIC TEST Attualmente disponibili - vedere Esempi di sperimentazione Trec per esempi e impostazioni note. · Scriptabile facilmente per valutare molte impostazioni dei parametri o molti modelli di ponderazione in forma batch. · Strumenti di valutazione in integrato per l'uso con Trec ad-hoc e noto- Risultati del recupero della ricerca dell'articolo, per produrre varie misure di precisione e richiamo.Nota: Terrier viene rilasciato sotto la licenza pubblica di Mozilla.


Terrier Software correlato

Primavera

Spring - Desktop-Browser Hybrid per persone, luoghi, prodotti, ecc ...

200 5.2 MB

Scarica

Gaudi.

Gaudi - Connettiti a qualsiasi DBMS e manipola visivamente il suo layout e il suo contenuto ...

205 1.8 MB

Scarica

Editor Python di Stani

Editor Python STANI - Python IDE con indentazione automatica, completamento automatico, suggerimenti di chiamata, colorazione sintassi e evidenziazione della sintassi ...

153 1.3 MB

Scarica