Main menu

Search
Login
Signup
Links
<< Previous thread | Next thread >>   
OCR via batch + GOCR-Gui

Go to page   <<      
Author Post
alchimista
Mon 28 Jan 2008 - 23:51
online
Registered Member #3875
Joined: Fri 06 Apr 2007 - 09:34
Posts: 1299
Ottimo lavoro Ice appena posso faccio alcune prove, intanto bravo
Back to top
ZioZione
Tue 29 Jan 2008 - 08:40
online

Registered Member #74
Joined: Sun 21 Jan 2007 - 11:31
Location: Tradate (VA)
Posts: 3821
Ciao Ice,
bel programma, complimenti... Interfaccia pulita e funzionale (a parte i soliti beep... ma sono io che ho le orecchie sensibili... )
Ho sempre, invece, qualche piccola riserva su GOcr stesso, in quanto il riconoscimento dei testi, almeno sul mio PC, lascia un po' a desiderare. C'è modo, eventualmente, di aumentare la risoluzione delle immagini? Risolverebbe?
Cordialmente
ZioZione
Back to top
icemax
Tue 29 Jan 2008 - 09:49

online
Registered Member #194
Joined: Sun 21 Jan 2007 - 22:27
Posts: 1371
ZioZione wrote ...

Ciao Ice,
bel programma, complimenti... Interfaccia pulita e funzionale (a parte i soliti beep... ma sono io che ho le orecchie sensibili... )
Ho sempre, invece, qualche piccola riserva su GOcr stesso, in quanto il riconoscimento dei testi, almeno sul mio PC, lascia un po' a desiderare. C'è modo, eventualmente, di aumentare la risoluzione delle immagini? Risolverebbe?
Cordialmente
ZioZione


intanto grazie a tutti ,

per quanto riguarda la funzionalità ,
- le opzioni per la scansione OCR di GOCR sono "infinite" e per questo
sto lavorando sul pannello di configurazione dei settaggi di GOCR di prossima
implementazione a .. presto sui vostri schermi

Il risultato dell'ocr dipende sia dalla risoluzione ma soprattutto dalla formattazione del
carattere stampato sull'immagine, oltre alla spaziatura fra i vari caratteri.

Volevo anche precisare che alcune impostazioni di GOCR permettono lo scan di
codice a barre .. con risultati fantastici.

Inoltre un'opzione particolare è quella di specificare le lettere e i numeri da controllare
durante l'elaborazione.

ecco alcuni dei parametri di gocr, che personalizzati .. diventano praticamente infiniti



gocr [options] pnm_file_name # use - for stdin
options:
-h - get this help
-i name - input image file (pnm,pgm,pbm,ppm,pcx,...)
-i - - read PNM from stdin (djpeg -gray a.jpg | gocr -)
-o name - output file (redirection of stdout)
-e name - logging file (redirection of stderr)
-x name - progress output (file or fifo)
-p name - database path (including final slash, default is ./db/)
-f fmt - output format (ISO8859_1 TeX HTML XML UTF8 ASCII)
-l num - threshold grey level 0<160<=255 (0 = autodetect)
-d num - dust_size (remove smaller clusters, -1 = autodetect)
-s num - spacewidth/dots (0 = autodetect)

-v num - verbose [summed]
1 print more info
2 list shapes of boxes (see -c)
4 list pattern of boxes (see -c)
8 print pattern after recognition
16 print line infos
32 debug outXX.pgm
-c string - list of chars (_ = not recognized chars, debug)
-C string - char filter (ex. hexdigits: 0-9A-Fx, only ASCII)

-m num - operation modes, ~ = switch off
2 use database (early development)
4 layout analysis, zoning (development)
8 ~ compare non recognized chars
16 ~ divide overlapping chars
32 ~ context correction
64 char packing (development)
130 extend database, prompts user (128+2, early development)
256 switch off the OCR engine (makes sense together with -m 2)
-n 1 only numbers





se il programma vi piace e volete che sia
distribuito con copyright : "made by Winpenpack Team" allora ditelo

ciao a presto.

Back to top
Lupalberto
Tue 29 Jan 2008 - 10:50
online
Registered Member #3564
Joined: Thu 22 Mar 2007 - 10:45
Posts: 66
Mi aggiungo ai complimenti, davvero meritati, ice!!

Il progetto prende una forma decisamente interessante: non vedo l'ora di vedere la prossima release. 2 domande:
1. la funzione acquisisci non è ancora disponibile, o sono io che non ho capito come si usa?
2. è possibile aumentare la risoluzione della cattura in qualche modo; sulle prove che avevo fatto nel post precedente aumentando la risoluzione da 72 a 300dpi, si notava un netto cambiamento nel riconoscimento di GOCR (pari al tesseract di google)
Infine, voto a favore del "made in wpp", ma dovrebbe essere una versione con launcher (lo so che il programma è portatile, ma semplificherebbe la sua installazione --> al limite nel launcher puoi scrivere "lupalberto è un pigrone )
Back to top
ZioZione
Tue 29 Jan 2008 - 10:56
online

Registered Member #74
Joined: Sun 21 Jan 2007 - 11:31
Location: Tradate (VA)
Posts: 3821
Ciao Ice,
se riuscissimo a "quagliare" direi che non potresti trovarmi più d'accordo...
Un'unica cosa: a Cesare quello che è di Cesare. Quindi sarei più propenso per un copyright del tipo "made by Icemax for Winpenpack". Ovviamente, una volta finito...
Cordialmente
ZioZione
Back to top
MAXPC72
Tue 29 Jan 2008 - 11:21
online
Registered Member #4454
Joined: Mon 30 Apr 2007 - 16:35
Posts: 88
anch'io ti faccio i miei + vivi complimenti, belissimo e semplicissmo!
i miei consigli sono:
unica cosa aggiungerei una "X" x la chiusura del programma direttamente dalla finestra principale.
complimenti ancora
Back to top
Danix
Tue 29 Jan 2008 - 11:21

online

Registered Member #1
Joined: Fri 29 Dec 2006 - 05:38
Location: Sassari
Posts: 12956
Carino, icemax
Solo che il riconoscimento dei caratteri da immagine (quindi dopo aver scannerizzato) è completamente errato, non riconosce quasi nulla..
Back to top
Website
icemax
Tue 29 Jan 2008 - 16:19

online
Registered Member #194
Joined: Sun 21 Jan 2007 - 22:27
Posts: 1371
Thanks ..


questa in allegato è la versione 1.0.8 (ancora beta)

- aggiunta funzione salvataggio immagine intera (nessuna compressione)

nella main troverete 2 opzioni (in basso)

(-) JPEG (compressione di circa 1:10 dell'immagine reale )
.. e la nuova ...
(-) BMP nessuna compressione (dovrebbe sistemare qcosina )

è stato utilizzato il componente GNU bmptopnm per la conversione in formato
raster "PNM"


a presto la nuova versione con personalizzazione dei parametri AVANZATI
per il dettaglio elaborazione OCR e la risoluzione dell'immagine


"ps : il tasto SCAN per lo scanner momentaneamente è disabilitato"

eccola qui in allegato :




gocr-gui.rar
Back to top
marktwain
Thu 26 Jun 2008 - 16:33
online
Registered Member #7315
Joined: Wed 28 Nov 2007 - 12:26
Posts: 1
Salve Icemax

Oltre a farti i complimentissimi, ti chiedo se attualmente l'ultima versione è sempre la 1.0.8 beta.
Su winpenpack.com ho infatti trovato questa come ultima versione, ma come dicesti a gennaio ancora qualche ritocco avrebbe notevolemente migliorato il rendimento di scansione.
Ancora complimenti e buon weekend.


Marktwain

Back to top
zandet2
Thu 26 Jun 2008 - 16:59

online

Registered Member #3184
Joined: Tue 06 Mar 2007 - 11:52
Location: Busto Arsizio
Posts: 3301
Ciao marktwain,
benvenuto

Chissà che magari qualche "spronatura" non invogli il caro icemax a regalarci (finalmente) una bella chicca ....

Ciao!
Back to top

Go to page   <<      
Moderators: Danix, Taf, Rcs, Energy, zandet2, ZioZione, Admin, LordJim60

Jump:     Back to top

Syndicate this thread: rss 0.92 Syndicate this thread: rss 2.0 Syndicate this thread: RDF
Powered by e107 Forum System