CMU SPHINX 4.

Sistema di riconoscimento vocale all'avanguardia scritto interamente nel linguaggio di programmazione Java
Scarica ora

CMU SPHINX 4. Classifica e riepilogo

Annuncio pubblicitario

  • Rating:
  • Licenza:
  • BSD
  • Prezzo:
  • FREE
  • Nome editore:
  • Sphinx 4 Team
  • Sito web dell'editore:
  • Sistemi operativi:
  • Mac OS X
  • Dimensione del file:
  • 33.6 MB

CMU SPHINX 4. Tag


CMU SPHINX 4. Descrizione

State-of-the-art sistema di riconoscimento vocale scritto interamente nel linguaggio di programmazione Java Sfinge è un ampio vocabolario di riconoscimento vocale continuo indipendente dal parlante rilasciato sotto una licenza stile BSD. E 'anche una raccolta di risorse open source e strumenti che consente agli sviluppatori e ricercatori per il riconoscimento vocale accumulo systems.Sphinx-4 è un sistema state-of-the-art di riconoscimento vocale scritto interamente nel linguaggio di programmazione Java. E 'stato creato attraverso una collaborazione congiunta tra il gruppo Sfinge presso la Carnegie Mellon University, Sun Microsystems Laboratories, Mitsubishi Electric Research Labs (MERL), e Hewlett Packard (HP), con il contributo dell'Università della California a Santa Cruz (UCSC) e la Massachusetts Institute of Technology (MIT) .Sphinx-4 era iniziato come un porto di Sphinx-3 al linguaggio di programmazione Java, ma si è evoluto in un sistema di riconoscimento progettato per essere molto più flessibile di Sphinx-3, diventando così una piattaforma eccellente per la ricerca vocale . CMU Sphinx Gruppo sta rilasciando sono un insieme di ragionevolmente maturo, componenti di classe mondiale discorso che forniscono un livello base di tecnologia per chiunque sia interessato a creare applicazioni vocali utilizzando senza il costo di investimento, una volta proibitivo iniziale nella ricerca e sviluppo; gli stessi componenti sono aperti a peer review da parte di tutti i ricercatori del settore, e sono utilizzati per la ricerca linguistica come well.Note, tuttavia, che Sfinge non è un prodotto finale. Quelli con un certo livello di esperienza possono ottenere grandi risultati con le versioni di Sfinge disponibili qui, ma un utente ingenuo certamente bisogno di ulteriore aiuto. In altre parole, il software disponibile qui non è pensato per gli utenti che non hanno esperienza nel discorso, ma per gli utenti esperti. Qui sono alcune caratteristiche chiave di "CMU Sphinx 4": · Modalità Live e in modalità batch di riconoscimento vocale, in grado di riconoscere il discorso discreta e continua. · Generalizzata dell'architettura front end pluggable. Comprende implementazioni pluggable di preenfasi, finestra Hamming, FFT, Mel banco di filtri di frequenza, trasformata coseno discreta, cepstrale normalizzazione medio, e estrazione delle caratteristiche di cepstra, delta cepstra, caratteristiche doppie delta cepstra. · Generalizzata pluggable architettura modello di linguaggio. Include il supporto plug modello di linguaggio per ASCII e le versioni binarie di unigram, bigram, trigramma, API Java Speech Grammar Format (JSGF) e ARPA formato grammatiche FST. · Generalizzata modello di architettura acustica. Include il supporto per i plug Sphinx-3 modelli acustici. · Generalizzata gestione di ricerca. Include il supporto per plug ampiezza prima e la parola ricerche potatura. · Utilità per i risultati del riconoscimento post-processing, tra cui l'ottenimento di punteggi di confidenza, la generazione di reticoli e l'incorporamento di ECMAScript in tag JSGF. · Strumenti autonomi. Include strumenti per la visualizzazione delle forme d'onda e gli spettrogrammi e la generazione di caratteristiche da audio Requisiti: · Java 2 SDK, Standard Edition 5.0 o versione successiva · Ant 1.6.0 o successivo · Subversion (SVN), ma solo se si desidera interagire direttamente con l'albero svn (che è raccomandato). Cosa c'è di nuovo in questa versione: Nuove funzionalità e miglioramenti: · Componente frontend BatchAGC · La transizione Completato ai valori di default nelle annotazioni · ConcatFeatureExtrator di cooperare con i modelli cepwin · Fine di segnali di flusso vengono passati al decoder per la cancellazione correzione · Miglioramento API Timer · La politica Threading viene modificato in TAS Correzioni di bug: · Lettura Correzioni UTF-8 dal deposito modello di linguaggio. · Ottimizzazione della memoria enorme della compressione reticolo · Più stabile il lavoro fronend con DataStart e DataEnd e facoltativo SpeechStart / SpeechEnd


CMU SPHINX 4. Software correlato

Solera

Progettato principalmente per mastering e re-mastering applicazioni ...

59 0 KB

Scarica

Stereoberano

Posizionamento stereo preciso nelle singole bande di frequenza, difficile da raggiungere da qualsiasi altro metodo ...

156 3.8 MB

Scarica

Typecast.

consente di copiare regolari file audio dal tuo Mac o Internet nella playlist di iTunes Podcast. ...

162 259 KB

Scarica