Gamera

Un quadro di programmazione del riconoscimento dei documenti.
Scarica ora

Gamera Classifica e riepilogo

Annuncio pubblicitario

  • Rating:
  • Licenza:
  • GPL
  • Prezzo:
  • FREE
  • Nome editore:
  • Michael Droettboom
  • Sito web dell'editore:
  • http://ldp.library.jhu.edu/projects/gamera/

Gamera Tag


Gamera Descrizione

Un quadro di programmazione del riconoscimento dei documenti. Gamera Project è un framework per la creazione di applicazioni di analisi dei documenti strutturate da esperti di dominio. Gli esperti del dominio sono individui che hanno una forte conoscenza dei documenti in una collezione, ma potrebbero non avere uno sfondo tecnico formale. L'obiettivo è creare uno strumento che sfrutta la loro conoscenza dei documenti di destinazione per creare applicazioni personalizzate piuttosto che tentare di incontrarsi diversi Requisiti con un'applicazione monolitica. Questo documento offre una panoramica dei principi dell'architettura e del design dei sistemi di riconoscimento di Gamera.Developing per documenti storici difficili richiedono sperimentazione poiché la soluzione è spesso non ovvia. Pertanto, l'obiettivo principale di Gamera è quello di supportare un efficiente ciclo di sviluppo di test e di raffinato. Virtualmente ogni dettaglio di implementazione è guidato da questo obiettivo. Ad esempio, Python è stato scelto come linguaggio principale a causa delle sue capacità di introspezione, della digitazione dinamica e della facilità d'uso. È stato utilizzato come prima lingua di programmazione con un notevole successo .c ++ viene utilizzato per scrivere plugin in cui le prestazioni di runtime sono una priorità, ma anche in tal caso, il sistema Gamera Plugin è progettato per effettuare le estensioni di scrittura il più semplice possibile. Gamera include un'interfaccia utente grafica a pieno titolo che fornisce una serie di scorciatoie per la formazione, nonché l'ispezione dei risultati degli algoritmi ad ogni passo. Migliorare la facilità di sperimentazione, speriamo di mettere il potere di sviluppare sistemi di riconoscimento con quelli che capiscono meglio i documenti. Ci aspettiamo almeno due tipi di sviluppatori di lavorare con il sistema: quelli con uno sfondo tecnico aggiungendo algoritmi al sistema e coloro che lavorano sull'aggregazione a livello superiore di quei pezzi. È importante notare questa distinzione, poiché quei gruppi rappresentano diversi set di abilità e requisiti. Inoltre al suo sostegno allo sviluppo del test e di raffinato, Gamera ha anche molti altri vantaggi che sono importanti per progetti di digitalizzazione su larga scala in generale. Questi sono: · Open Source Code e Standards-Compliance in modo che il software possa interagire bene con altre parti di un quadro di digitalizzazione · Indipendenza della piattaforma, in esecuzione su una varietà di sistemi operativi tra cui Linux, Microsoft Windows e Mac OS-X · Un sistema di flusso di lavoro Per combinare attività di alto livello · Elaborazione del lotto · Un quadro batch test per garantire la correttezza ed evitare la regressione · Componenti dell'interfaccia utente per lo sviluppo e la formazione di classificatore · Uscita di confidenza del riconoscimento in modo che i gestori di raccolta possano facilmente indirizzare i documenti che necessitano di correzione o di diverse strategie di riconoscimento. Gamera ha un'architettura di plugin modulare. Questi moduli eseguono in genere una delle cinque attività di riconoscimento dei documenti: 1. Pre-elaborazione2. Segmentazione e analisi del documento33. Segmentazione e classificazione del simbolo4. Analisi sintattica o strutturale5. La produzione di questi compiti può essere complessa arbitrariamente, coinvolgere più strategie o moduli o rimuovere interamente a seconda del problema di riconoscimento specifico a portata di mano. I passaggi effettivi che costituiscono un sistema di riconoscimento completo sono completamente controllati dall'utente. L'elaborazione dell'utente comporta operazioni standard di elaborazione delle immagini come rimozione del rumore, sfocatura, deacking, regolazione del contrasto, affilatura, binarizzazione e morfologia. Attenzione particolare e raffinamento di questi passaggi è particolarmente importante quando si lavora con documenti storici degradati. Cosa c'è di nuovo in questa versione: · Plugins to_numumy e from_numumy aggiunto per il supporto di Numpy; I moduli numerici o numerati deprecati sono stati sostituiti con polpastrello · Evidenziare anche funziona con GreyScale e immagini Onebit · Funzione di ridimensionamento corretta in VIGRA · Il classificatore KNN può ora restituire diverse misure di confidenza per l'ID principale selezionabile dall'utente. Vedere la documentazione API classificatore per i dettagli. · Classificatore KNN ora funziona come previsto quando K> 1; Fino ad ora, id_name è stato ordinato per sicurezza, il che significava che sempre il più lontano tra i vicini più vicini è stato restituito come Main_id · Ora compila con Python 2.6 (grazie a Prapat Surriyaphol)


Gamera Software correlato

rpcalc.

rpcalc è una calcolatrice semplice rpn (notazione polacca inverso) per X. ...

166

Scarica