Menù Principale

Cerca
Login
Registrati
Link
<< Discussione precedente | Discussione successiva >>   
[PDF Converter] PDF2HTML+Gui

Autore Messaggio
domino
lun 29 set 2008 - 18:38

online
Utente registrato #9897
Registrato il: ven 21 mar 2008 - 17:57
Provenienza: Milano
Messaggi: 600

Lo stesso software è stato segnalato, con delle modifiche da parte di Icemax, anche in Questa Discussione, se l'ho riproposto è stato per avere le info complete e poi perché ho avuto dei problemi nelle conversioni con quelle gui, se il Team ritiene questa discussione un doppione, può eliminarla.

Nome del software: PDF2HTML+Gui
Direct Link al download: -Link-
Dimensione File: pdftohtmlgui 889KB (910336 bytes)-PDFtoHTML v.0.39 266KB (272384bytes)-Ghostscript 10 MB (10485760 bytes)
Nome autore: Guiguy
eMail autore: n/d
Sito Web Autore: n/d
Descrizione: PDF2Html Gui è l'interfaccia grafica per PDF2HTML che permette la conversione da .pdf a .html
Portable tips how-to: Scaricare PDF2Html Gui, decomprimere in una cartella a piacere, scaricare la versione 0.39 di PDFtoHTML, copiare i file nella cartella pdftohtmlgui, infine scaricare Ghostscript 8.63 mettendo anche questo file nella cartella pdftohtmlgui, avviare il programma dal file pdf2htmlgui.exe
Versione: PDF2Html Gui 1.3 pdftohtml 0.39
Licenza: GNU General Public License (GPL)

MOLTO IMPORTANTE

Al primo avvio il programma chiederà, tramite un finestra browse, la posizione del file gswin32c.exe, bisogna cliccare su gs863w32.exe e poi su apri.


Nota Personale: Ho segnalato questo software, principalmente, per avere a disposizione uno strumento che permetta di avere i PDF in modalità testo, quindi editabile.

[ Modificato lun 29 set 2008 - 18:51 ]
Torna ad inizio pagina
rbon
lun 29 set 2008 - 19:14
online
Utente registrato #4134
Registrato il: sab 14 apr 2007 - 11:42
Messaggi: 910
Ciao Domino,
io utilizzo normalmente tale programma ed ho un piccolo dubbio sulla tua descrizione.
Perchè scrivi che è necessario Ghostscript? a cosa serve?
a quanto ne so, si ha:
1. pdf2html = è il 'motore' che esegue il lavoro di conversione da pdf a html
2. pdf2htmlgui = è l'interfaccia grafica per eseguire detta conversione: ricordare, dopo averla lanciata, di scegliere 'More Options' e in tale videata mettere in segno di spunta su:
- exchange .pdf links by .html
- generate complex document
....
a questo punto si ottengono diversi files .html (che non sono ancora ascii puri)
3. scaricare il programmino di Matteo Baccan 'html2txt201.zip' e ricordare che funziona da linea di comando (oppure usare i tools che ha presentato icemax)

Il vantaggio di html2txt201 è che ripulisce perfettamente i files html e puoi, dopo, importarli in Excel.
rbon

html2txt201.zip

PS
puoi anche usare un editor Html come PsPad oppure, meglio perchè non scrive sul registro, RJ TextEd ed eseguire la conversione da html a testo (ascii).
Torna ad inizio pagina
domino
lun 29 set 2008 - 19:20

online
Utente registrato #9897
Registrato il: ven 21 mar 2008 - 17:57
Provenienza: Milano
Messaggi: 600
rbon ha scritto ...

Ciao Domino,
io utilizzo normalmente tale programma ed ho un piccolo dubbio sulla tua descrizione.
Perchè scrivi che è necessario Ghostscript? a cosa serve?


Ghostscript serve a processare le immagini
Torna ad inizio pagina
domino
lun 29 set 2008 - 22:11

online
Utente registrato #9897
Registrato il: ven 21 mar 2008 - 17:57
Provenienza: Milano
Messaggi: 600
rbon ha scritto ...

Ciao Domino,
io utilizzo normalmente tale programma ed ho un piccolo dubbio sulla tua descrizione.
Perchè scrivi che è necessario Ghostscript? a cosa serve?
a quanto ne so, si ha:
1. pdf2html = è il 'motore' che esegue il lavoro di conversione da pdf a html
2. pdf2htmlgui = è l'interfaccia grafica per eseguire detta conversione: ricordare, dopo averla lanciata, di scegliere 'More Options' e in tale videata mettere in segno di spunta su:
- exchange .pdf links by .html
- generate complex document
....
a questo punto si ottengono diversi files .html (che non sono ancora ascii puri)
3. scaricare il programmino di Matteo Baccan 'html2txt201.zip' e ricordare che funziona da linea di comando (oppure usare i tools che ha presentato icemax)

Il vantaggio di html2txt201 è che ripulisce perfettamente i files html e puoi, dopo, importarli in Excel.
rbon

html2txt201.zip

PS
puoi anche usare un editor Html come PsPad oppure, meglio perchè non scrive sul registro, RJ TextEd ed eseguire la conversione da html a testo (ascii).



Ciao rbon, ho provato ad usare le due gui di Icemax ma mi restituisce l'errore che riporto nell'immagine, l'errore è sia con P2H Pdf to html che con P2T Pdf to Text, per quanto riguarda html2txt201 non vedo alcuna gui e senza di quella non so usare i programmi a linea di comando, se puoi darmi qualche delucidazione ti ringrazio in anticipo, così mi chiarisco un po le idee.


Torna ad inizio pagina
icemax
mar 30 set 2008 - 08:18

online
Utente registrato #194
Registrato il: dom 21 gen 2007 - 22:27
Messaggi: 1371
Rbon .. intanto ti ringrazio per aver segnalato P2T P2H

Domino :
Ciao rbon, ho provato ad usare le due gui di Icemax ma mi restituisce l'errore che riporto nell'immagine, l'errore è sia con P2H Pdf to html che con P2T Pdf to Text, per quanto riguarda html2txt201 non vedo alcuna gui e senza di quella non so usare i programmi a linea di comando, se puoi darmi qualche delucidazione ti ringrazio in anticipo, così mi chiarisco un po le idee.


assicurati di :

- eseguire il programma con privilegi alti
- eseguire il programma da disco scrivibile (e non da supporti protetti da scrittura).

in ogni caso antrambi sono in versione beta Ma perfettamente funzionanti.

fammi sapere

ciao

[ Modificato mar 30 set 2008 - 08:21 ]
Torna ad inizio pagina
domino
mar 30 set 2008 - 08:28

online
Utente registrato #9897
Registrato il: ven 21 mar 2008 - 17:57
Provenienza: Milano
Messaggi: 600
icemax ha scritto ...

assicurati di :

- eseguire il programma con privilegi alti
- eseguire il programma da disco scrivibile (e non da supporti protetti da scrittura).

in ogni caso antrambi sono in versione beta Ma perfettamente funzionanti.

fammi sapere

ciao


Ciao icemax, grazie per la risposta, sul Pc Xp Pro sp2 sono amministratore, il disco dal quale cerco di eseguire i due programmi è C. Spero di riuscire a risolvere
Torna ad inizio pagina
rbon
mar 30 set 2008 - 08:32
online
Utente registrato #4134
Registrato il: sab 14 apr 2007 - 11:42
Messaggi: 910
Domino scrisse....
Ghostscript serve a processare le immagini

penso che intendi dire: estrarre le immagini da un file .pdf.

A quanto ne so, un file .pdf si può ottenere:
1. compilando files di testo
2. compilando immagini (a loro volta ottenute compilando del testo)
Io utilizzo pdf2html + gui per estrarre, dal pdf, files Html che dovrò poi convertire in testo.

Se dovessi estrarre le immagini penso che userei:
1. Some PDF Image Extract 1.4 (non ne ho testato la portabilità) -Link- , direct download -Link- .
2. una volta ottenute le immagini dovrei però decompilarle utilizzando un programma OCR per ottenere il testo contenuto nelle stesse.

Domino scrisse...
(come utilizzare) html2txt201

purtroppo non credo esista nessuna gui ed io utilizzo un file batch.. in pratica
1. Start - Esegui si digita CMD.exe
2. si 'naviga' con i comandi dos fino alla directory che contiene sia i files html che html2txt già scompattato
3. ci si può aiutare con un file batch (i files html hanno nome progressivo e cioè, per esempio, 1.html, 2.html ecc.)

Domino scrisse...
P2H Pdf to html e P2T Pdf to Text

non posso aiutarti perchè non li ho (ancora) provati a fondo ma mi sembra che funzionassero (ero dubbioso sul risultato ottenuto): in pratica si avvia l'eseguibile e con drag-n'-drop si trascina il file da 'trattare' nella videata del programma scelto.

Spero di non averti fatto confusione.
Ciao


File batch per html2txt

htmltotxt_bat.zip
Torna ad inizio pagina
rbon
mar 30 set 2008 - 08:41
online
Utente registrato #4134
Registrato il: sab 14 apr 2007 - 11:42
Messaggi: 910
@icemax
Rbon .. intanto ti ringrazio per aver segnalato P2T P2H

scusa, scusa, scusa .
Anche se non ho ancora utilizzato questi programmi, ti rigrazio molto per la tua disponibilità: ho usato gli altri programmi che gentilmente mi hai messo a disposizione
ciao

Torna ad inizio pagina
domino
ven 03 ott 2008 - 22:44

online
Utente registrato #9897
Registrato il: ven 21 mar 2008 - 17:57
Provenienza: Milano
Messaggi: 600
domino ha scritto ...

Ciao rbon, ho provato ad usare le due gui di Icemax ma mi restituisce l'errore che riporto nell'immagine, l'errore è sia con P2H Pdf to html che con P2T Pdf to Text, per quanto riguarda html2txt201 non vedo alcuna gui e senza di quella non so usare i programmi a linea di comando, se puoi darmi qualche delucidazione ti ringrazio in anticipo, così mi chiarisco un po le idee.





Ciao a tutti, @icemax, non so dirti il motivo, ma ora i due programmi funzionano e l'errore è svanito, non chiedermi il perché, misteri dell'informatica...
Torna ad inizio pagina

Moderatori: Danix, Taf, Rcs, Energy, zandet2, ZioZione, Admin, LordJim60

Salta:     Torna ad inizio pagina

RSS discussione: rss 0.92 RSS discussione: rss 2.0 RSS discussione: RDF
Powered by e107 Forum System