stemming.

implementazioni Python di vari algoritmi stemming
Scarica ora

stemming. Classifica e riepilogo

Annuncio pubblicitario

  • Rating:
  • Licenza:
  • Public Domain
  • Prezzo:
  • FREE
  • Nome editore:
  • Matt Chaput
  • Sito web dell'editore:
  • http://whoosh.ca

stemming. Tag


stemming. Descrizione

Implementazioni Python di vari algoritmi stemming stemming è un'implementazione di Python del portiere, Paice-Husk, Porter2 e Lovins stemming Algoritmi per l'inglese. Queste implementazioni sono semplici ed efficienti, a differenza di alcune versioni Python degli stessi algoritmi disponibili sul web. Questo pacchetto è un'estrazione del codice stemming incluso nel motore di ricerca Whoosh.Nota che queste sono implementazioni pura Python. Python wrapper per, ad es. Gli snoball stemmers e l'implementazione C del portiere sono disponibili su Pypi e saranno più veloci se l'utilizzo del codice compilato è un'opzione per te. L'algoritmi di texing si tenta di rimuovere automaticamente i suffissi (e in alcuni casi prefissi) per trovare la "radice parola "o gambo di una determinata parola. Questo è utile in vari scenari di elaborazione del linguaggio naturale, come search.in General Porter2 è il miglior algoritmo di stemming generale, ma non necessariamente il più veloce o il più aggressivo. Il pacchetto stemming contiene moduli per ogni algoritmo (Lovini, Paicehusk, Porter e Porter2 ). Ogni modulo contiene una funzione STEM (): >> Da Stemming.Porter2 Import Stem Stem >> Stelo ("Factionally") Fazione (l'algoritmo Paice-Husk consente set di regole di stemming personalizzato, quindi il modulo PaiceHUSK include anche una classe PaiceHUSKSemmeMer che è possibile istanziare con regole personalizzate.) Il codice sorgente per questo pacchetto è disponibile su BitBucket: http: //bitbucket.org/mchaput/stemmingsplease Utilizzare BitBucket per file Bug Reports o richieste di funzionalità: http: //bitbucket.org/mchaput/stemming/issues / Requisiti: · Python.


stemming. Software correlato

bifilo

Modulo per la lettura / scrittura di un numero arbitrario di bit da un file ...

144

Scarica