| minuscolo Tokenizer giapponese molto compatto |
Scarica ora |
minuscolo Classifica e riepilogo
- Sito web dell'editore:
- http://lilyx.net/
minuscolo Tag
minuscolo Descrizione
Tinyserener è un porto di Python di Tinysegremener (che è un tokenizer giapponese estremamente compatto (23 KB) originariamente scritto in JavaScript da Mr. Taku Kudo. Funziona su Python 2.5 o superiore ..Installazione e installazione di file.USAgeeXample Code per Utilizzo diretto:> Importa Tinysegisemer> Segmenter = Tinyserener.tinysegnerer ()> Stampa '|'. Join (Segmenter.Tokenize (U " ")) | | | | | | | | "Tinysegisemer in Python" è l'interfaccia Compatibile con il tokenizeri di NLTK, sebbene il file di distribuzione di seguito non dipenda direttamente da NLTK. Se desideri usarlo come un tokenizer in NLTK, devi modificare le prime righe del codice come di seguito (quindi non puoi Utilizza la versione del repository PYPI per ora, se si desidera eseguire questa operazione. Ottieni le fonti.): Importa nltkimport friggrom nltk.tooks.api.api import * class tinysegressioner (Tokenizeri): Homepage del prodotto
minuscolo Software correlato