Menù Principale

Cerca
Login
Registrati
Link
<< Discussione precedente | Discussione successiva >>   
OCR via batch + GOCR-Gui

Vai a pagina   <<      
Autore Messaggio
alchimista
lun 28 gen 2008 - 23:51
online
Utente registrato #3875
Registrato il: ven 06 apr 2007 - 09:34
Messaggi: 1299
Ottimo lavoro Ice appena posso faccio alcune prove, intanto bravo
Torna ad inizio pagina
ZioZione
mar 29 gen 2008 - 08:40
online

Utente registrato #74
Registrato il: dom 21 gen 2007 - 11:31
Provenienza: Tradate (VA)
Messaggi: 3821
Ciao Ice,
bel programma, complimenti... Interfaccia pulita e funzionale (a parte i soliti beep... ma sono io che ho le orecchie sensibili... )
Ho sempre, invece, qualche piccola riserva su GOcr stesso, in quanto il riconoscimento dei testi, almeno sul mio PC, lascia un po' a desiderare. C'è modo, eventualmente, di aumentare la risoluzione delle immagini? Risolverebbe?
Cordialmente
ZioZione
Torna ad inizio pagina
icemax
mar 29 gen 2008 - 09:49

online
Utente registrato #194
Registrato il: dom 21 gen 2007 - 22:27
Messaggi: 1371
ZioZione ha scritto ...

Ciao Ice,
bel programma, complimenti... Interfaccia pulita e funzionale (a parte i soliti beep... ma sono io che ho le orecchie sensibili... )
Ho sempre, invece, qualche piccola riserva su GOcr stesso, in quanto il riconoscimento dei testi, almeno sul mio PC, lascia un po' a desiderare. C'è modo, eventualmente, di aumentare la risoluzione delle immagini? Risolverebbe?
Cordialmente
ZioZione


intanto grazie a tutti ,

per quanto riguarda la funzionalità ,
- le opzioni per la scansione OCR di GOCR sono "infinite" e per questo
sto lavorando sul pannello di configurazione dei settaggi di GOCR di prossima
implementazione a .. presto sui vostri schermi

Il risultato dell'ocr dipende sia dalla risoluzione ma soprattutto dalla formattazione del
carattere stampato sull'immagine, oltre alla spaziatura fra i vari caratteri.

Volevo anche precisare che alcune impostazioni di GOCR permettono lo scan di
codice a barre .. con risultati fantastici.

Inoltre un'opzione particolare è quella di specificare le lettere e i numeri da controllare
durante l'elaborazione.

ecco alcuni dei parametri di gocr, che personalizzati .. diventano praticamente infiniti



gocr [options] pnm_file_name # use - for stdin
options:
-h - get this help
-i name - input image file (pnm,pgm,pbm,ppm,pcx,...)
-i - - read PNM from stdin (djpeg -gray a.jpg | gocr -)
-o name - output file (redirection of stdout)
-e name - logging file (redirection of stderr)
-x name - progress output (file or fifo)
-p name - database path (including final slash, default is ./db/)
-f fmt - output format (ISO8859_1 TeX HTML XML UTF8 ASCII)
-l num - threshold grey level 0<160<=255 (0 = autodetect)
-d num - dust_size (remove smaller clusters, -1 = autodetect)
-s num - spacewidth/dots (0 = autodetect)

-v num - verbose [summed]
1 print more info
2 list shapes of boxes (see -c)
4 list pattern of boxes (see -c)
8 print pattern after recognition
16 print line infos
32 debug outXX.pgm
-c string - list of chars (_ = not recognized chars, debug)
-C string - char filter (ex. hexdigits: 0-9A-Fx, only ASCII)

-m num - operation modes, ~ = switch off
2 use database (early development)
4 layout analysis, zoning (development)
8 ~ compare non recognized chars
16 ~ divide overlapping chars
32 ~ context correction
64 char packing (development)
130 extend database, prompts user (128+2, early development)
256 switch off the OCR engine (makes sense together with -m 2)
-n 1 only numbers





se il programma vi piace e volete che sia
distribuito con copyright : "made by Winpenpack Team" allora ditelo

ciao a presto.

Torna ad inizio pagina
Lupalberto
mar 29 gen 2008 - 10:50
online
Utente registrato #3564
Registrato il: gio 22 mar 2007 - 10:45
Messaggi: 66
Mi aggiungo ai complimenti, davvero meritati, ice!!

Il progetto prende una forma decisamente interessante: non vedo l'ora di vedere la prossima release. 2 domande:
1. la funzione acquisisci non è ancora disponibile, o sono io che non ho capito come si usa?
2. è possibile aumentare la risoluzione della cattura in qualche modo; sulle prove che avevo fatto nel post precedente aumentando la risoluzione da 72 a 300dpi, si notava un netto cambiamento nel riconoscimento di GOCR (pari al tesseract di google)
Infine, voto a favore del "made in wpp", ma dovrebbe essere una versione con launcher (lo so che il programma è portatile, ma semplificherebbe la sua installazione --> al limite nel launcher puoi scrivere "lupalberto è un pigrone )
Torna ad inizio pagina
ZioZione
mar 29 gen 2008 - 10:56
online

Utente registrato #74
Registrato il: dom 21 gen 2007 - 11:31
Provenienza: Tradate (VA)
Messaggi: 3821
Ciao Ice,
se riuscissimo a "quagliare" direi che non potresti trovarmi più d'accordo...
Un'unica cosa: a Cesare quello che è di Cesare. Quindi sarei più propenso per un copyright del tipo "made by Icemax for Winpenpack". Ovviamente, una volta finito...
Cordialmente
ZioZione
Torna ad inizio pagina
MAXPC72
mar 29 gen 2008 - 11:21
online
Utente registrato #4454
Registrato il: lun 30 apr 2007 - 16:35
Messaggi: 88
anch'io ti faccio i miei + vivi complimenti, belissimo e semplicissmo!
i miei consigli sono:
unica cosa aggiungerei una "X" x la chiusura del programma direttamente dalla finestra principale.
complimenti ancora
Torna ad inizio pagina
Danix
mar 29 gen 2008 - 11:21

online

Utente registrato #1
Registrato il: ven 29 dic 2006 - 05:38
Provenienza: Sassari
Messaggi: 12956
Carino, icemax
Solo che il riconoscimento dei caratteri da immagine (quindi dopo aver scannerizzato) è completamente errato, non riconosce quasi nulla..
Torna ad inizio pagina
Sito Web
icemax
mar 29 gen 2008 - 16:19

online
Utente registrato #194
Registrato il: dom 21 gen 2007 - 22:27
Messaggi: 1371
Thanks ..


questa in allegato è la versione 1.0.8 (ancora beta)

- aggiunta funzione salvataggio immagine intera (nessuna compressione)

nella main troverete 2 opzioni (in basso)

(-) JPEG (compressione di circa 1:10 dell'immagine reale )
.. e la nuova ...
(-) BMP nessuna compressione (dovrebbe sistemare qcosina )

è stato utilizzato il componente GNU bmptopnm per la conversione in formato
raster "PNM"


a presto la nuova versione con personalizzazione dei parametri AVANZATI
per il dettaglio elaborazione OCR e la risoluzione dell'immagine


"ps : il tasto SCAN per lo scanner momentaneamente è disabilitato"

eccola qui in allegato :




gocr-gui.rar
Torna ad inizio pagina
marktwain
gio 26 giu 2008 - 16:33
online
Utente registrato #7315
Registrato il: mer 28 nov 2007 - 12:26
Messaggi: 1
Salve Icemax

Oltre a farti i complimentissimi, ti chiedo se attualmente l'ultima versione è sempre la 1.0.8 beta.
Su winpenpack.com ho infatti trovato questa come ultima versione, ma come dicesti a gennaio ancora qualche ritocco avrebbe notevolemente migliorato il rendimento di scansione.
Ancora complimenti e buon weekend.


Marktwain

Torna ad inizio pagina
zandet2
gio 26 giu 2008 - 16:59

online

Utente registrato #3184
Registrato il: mar 06 mar 2007 - 11:52
Provenienza: Busto Arsizio
Messaggi: 3301
Ciao marktwain,
benvenuto

Chissà che magari qualche "spronatura" non invogli il caro icemax a regalarci (finalmente) una bella chicca ....

Ciao!
Torna ad inizio pagina

Vai a pagina   <<      
Moderatori: Danix, Taf, Rcs, Energy, zandet2, ZioZione, Admin, LordJim60

Salta:     Torna ad inizio pagina

RSS discussione: rss 0.92 RSS discussione: rss 2.0 RSS discussione: RDF
Powered by e107 Forum System