Elogon.

ELLOGON è un ambiente di ingegneria del linguaggio multilingue multilingue, multilingue
Scarica ora

Elogon. Classifica e riepilogo

Annuncio pubblicitario

  • Rating:
  • Licenza:
  • GPL
  • Nome editore:
  • Georgios Petasis
  • Sistemi operativi:
  • Windows All
  • Dimensione del file:
  • 10.6 MB

Elogon. Tag


Elogon. Descrizione

Ellogon è un ambiente di ingegneria del linguaggio multipiattaforma, multilingue e generico, sviluppato per aiutare entrambi i ricercatori che stanno facendo ricerche nella linguistica computazionale, nonché alle aziende che producono e offrono ingegneria linguistica Ellogon come piattaforma di ingegneria linguistica offre una vasta piattaforma di ingegneria, compresi gli strumenti per l'elaborazione e la visualizzazione dei dati testuali / html / XML e le informazioni linguistiche associate, il supporto per le risorse lessicali (come la creazione e l'incorporamento dei lessico), strumenti per la creazione di corpora annotata, accessi ai database , confrontando i dati annotati o trasformare le informazioni linguistiche nei vettori da utilizzare con vari algoritmi di apprendimento della macchina. Durante l'ultimo decennio, è stato presentato un gran numero di infrastrutture software che mirano a facilitare il RD nel campo dell'elaborazione della lingua naturale. Alcune di queste infrastrutture, come strumenti LT-NSL / LT-XML o cancello, sono diventate estremamente popolari come sono state applicate a una vasta gamma di compiti da parte di molte istituzioni in tutto il mondo. ELLOGON appartiene alla categoria di piattaforme basate su referenziali o annotative, in cui le informazioni linguistiche vengono memorizzate separatamente dai dati testuali, avendo riferimenti al testo originale. Sulla base del modello di dati Tipster, Ellogon fornisce infrastrutture per: · Gestire, memorizzare e scambiare dati testuali nonché le informazioni linguistiche associate. · Creare, incorporare e gestire i componenti di elaborazione linguistici. · Facilitare la comunicazione tra diversi componenti linguistici definendo un'interfaccia di programmazione adeguata (API). · Visualizzazione dei dati testuali e informazioni linguistiche associate. ELLOGON condivide lo stesso modello di dati dell'architettura tipster. A causa di ciò, condivide alcune funzionalità di base con altre infrastrutture basate su tipster, come il cancello. Tuttavia, offre anche un gran numero di funzionalità che lo differenziano da tali infrastrutture. L'elemento centrale per la memorizzazione dei dati in Ellogon è la collezione. Una collezione è una serie finita di documenti. Un documento ELLOGON è costituito da dati testuali e informazioni linguistiche sui dati testuali. Questa informazione linguistica è memorizzata sotto forma di attributi e annotazioni. Un attributo associa un tipo specifico di informazioni con un valore digitato. Un'annotazione associa informazioni arbitrarie (sotto forma di attributi) con porzioni di dati testuali. Ogni porzione di questo tipo, denominata estensione, è composta da due disordini di caratteri che denotano i caratteri iniziali e i caratteri finali della porzione, misurati dal primo carattere di alcuni dati testuali. Le annotazioni tipicamente consistono in quattro elementi: · Un identificatore numerico. Questo identificatore è unico per ogni annotazione all'interno di un documento e può essere utilizzato per identificare in modo non ambiguo l'annotazione. · Un tipo. I tipi di annotazione sono valori testuali utilizzati per classificare annotazioni in categorie. · Un set di campate che indicano la gamma dei dati testuali annotati. · Un insieme di attributi. Questi attributi di solito codificano le informazioni linguistiche necessarie. Ellogon nella sua forma attuale soddisfa tutti questi requisiti. Poiché Ellogon si basa sull'architettura del Tipster, condivide molte proprietà di base con altre infrastrutture basate su tipster come il cancello. Tuttavia, Ellogon offre diverse caratteristiche importanti che lo differenziano da infrastrutture simili: · Easy Component Development È abbastanza facile capire il processo di sviluppo di nuovi componenti e svilupparli usando le funzionalità fornite da ELLOGON. Inoltre, è supportata una vasta gamma di lingue di programmazione per lo sviluppo dei componenti, tra cui C, C ++, Java, TCL, Perl e Python. · Ambiente di sviluppo integrato Ellogon funziona come un ambiente di sviluppo integrato, in quanto fornisce il supporto completo al ciclo di sviluppo di un componente. I componenti possono essere creati, modificati, compilati e collegati (se applicabili) dall'interno ELLOGON. Inoltre, i componenti C / C ++ / Java possono essere scaricati, modificati, compilati e ricaricati in Elogon senza dover smettere da ELLOGON. La capacità di scaricare o ricaricare tutti i componenti è essenziale in quanto può ridurre significativamente il ciclo di sviluppo, poiché le modifiche dei componenti possono essere immediatamente valutate. · Un componente pronto per l'uso "Toolbox" Ellogon è dotato di un gran numero di strumenti pronti all'uso per l'esecuzione di attività come la creazione di corpora annotata, la generazione di vettore o il confronto dei dati. Inoltre, vengono forniti diversi componenti campione che possono essere adattati a vari domini e lingue, che eseguono alcuni compiti di base come il tokenizzazione, il tagging part-of-parlato o la ricerca dell'elenco di gazetteer. Infine, Ellogon offre diversi strumenti di visualizzazione dei dati, che vanno da semplici spettatori per il database di annotazione agli spettatori in grado di visualizzare informazioni gerarchiche, come gli alberi di sintassi. · Easy Deployment Poiché ELogon implementa un'architettura decomponibile, è estremamente facile creare un prodotto facile da usare da un insieme di componenti che eseguono un compito specifico. Tutti i componenti insieme alle parti ELALGON necessari possono essere confezionati in un unico eseguibile (che non ha bisogno di installazione) o come applicazione (che può essere eseguito non modificato sotto sistemi multiplo). Queste applicazioni specializzate possono essere distribuite e utilizzate in qualsiasi sistema, anche se ELLOGON non è stata installata sul sistema. Requisiti: · TCL / TK 8.4 (o più recente), · Java JDK / JRE 1.4.1 (opzionale), · Perl 5.8.1 (opzionale), · Python 2.2 (opzionale).


Elogon. Software correlato

Showmail.

Un'applicazione compatta che monitora la cassetta postale POP3, ti avviene quando la posta arriva e inizia a iniziare opzionalmente il tuo programma di posta. Showmail si siede sul vassoio di sistema mentre inattivo, in attesa di connettersi a ...

167 350K

Scarica