Main menu

Search
Login
Signup
Links
<< Previous thread | Next thread >>   
[PDF Converter] PDF2HTML+Gui

Author Post
domino
Mon 29 Sep 2008 - 18:38

online
Registered Member #9897
Joined: Fri 21 Mar 2008 - 17:57
Location: Milano
Posts: 600

Lo stesso software è stato segnalato, con delle modifiche da parte di Icemax, anche in Questa Discussione, se l'ho riproposto è stato per avere le info complete e poi perché ho avuto dei problemi nelle conversioni con quelle gui, se il Team ritiene questa discussione un doppione, può eliminarla.

Nome del software: PDF2HTML+Gui
Direct Link al download: -Link-
Dimensione File: pdftohtmlgui 889KB (910336 bytes)-PDFtoHTML v.0.39 266KB (272384bytes)-Ghostscript 10 MB (10485760 bytes)
Nome autore: Guiguy
eMail autore: n/d
Sito Web Autore: n/d
Descrizione: PDF2Html Gui è l'interfaccia grafica per PDF2HTML che permette la conversione da .pdf a .html
Portable tips how-to: Scaricare PDF2Html Gui, decomprimere in una cartella a piacere, scaricare la versione 0.39 di PDFtoHTML, copiare i file nella cartella pdftohtmlgui, infine scaricare Ghostscript 8.63 mettendo anche questo file nella cartella pdftohtmlgui, avviare il programma dal file pdf2htmlgui.exe
Versione: PDF2Html Gui 1.3 pdftohtml 0.39
Licenza: GNU General Public License (GPL)

MOLTO IMPORTANTE

Al primo avvio il programma chiederà, tramite un finestra browse, la posizione del file gswin32c.exe, bisogna cliccare su gs863w32.exe e poi su apri.


Nota Personale: Ho segnalato questo software, principalmente, per avere a disposizione uno strumento che permetta di avere i PDF in modalità testo, quindi editabile.

[ Edited Mon 29 Sep 2008 - 18:51 ]
Back to top
rbon
Mon 29 Sep 2008 - 19:14
online
Registered Member #4134
Joined: Sat 14 Apr 2007 - 11:42
Posts: 752
Ciao Domino,
io utilizzo normalmente tale programma ed ho un piccolo dubbio sulla tua descrizione.
Perchè scrivi che è necessario Ghostscript? a cosa serve?
a quanto ne so, si ha:
1. pdf2html = è il 'motore' che esegue il lavoro di conversione da pdf a html
2. pdf2htmlgui = è l'interfaccia grafica per eseguire detta conversione: ricordare, dopo averla lanciata, di scegliere 'More Options' e in tale videata mettere in segno di spunta su:
- exchange .pdf links by .html
- generate complex document
....
a questo punto si ottengono diversi files .html (che non sono ancora ascii puri)
3. scaricare il programmino di Matteo Baccan 'html2txt201.zip' e ricordare che funziona da linea di comando (oppure usare i tools che ha presentato icemax)

Il vantaggio di html2txt201 è che ripulisce perfettamente i files html e puoi, dopo, importarli in Excel.
rbon

html2txt201.zip

PS
puoi anche usare un editor Html come PsPad oppure, meglio perchè non scrive sul registro, RJ TextEd ed eseguire la conversione da html a testo (ascii).
Back to top
domino
Mon 29 Sep 2008 - 19:20

online
Registered Member #9897
Joined: Fri 21 Mar 2008 - 17:57
Location: Milano
Posts: 600
rbon wrote ...

Ciao Domino,
io utilizzo normalmente tale programma ed ho un piccolo dubbio sulla tua descrizione.
Perchè scrivi che è necessario Ghostscript? a cosa serve?


Ghostscript serve a processare le immagini
Back to top
domino
Mon 29 Sep 2008 - 22:11

online
Registered Member #9897
Joined: Fri 21 Mar 2008 - 17:57
Location: Milano
Posts: 600
rbon wrote ...

Ciao Domino,
io utilizzo normalmente tale programma ed ho un piccolo dubbio sulla tua descrizione.
Perchè scrivi che è necessario Ghostscript? a cosa serve?
a quanto ne so, si ha:
1. pdf2html = è il 'motore' che esegue il lavoro di conversione da pdf a html
2. pdf2htmlgui = è l'interfaccia grafica per eseguire detta conversione: ricordare, dopo averla lanciata, di scegliere 'More Options' e in tale videata mettere in segno di spunta su:
- exchange .pdf links by .html
- generate complex document
....
a questo punto si ottengono diversi files .html (che non sono ancora ascii puri)
3. scaricare il programmino di Matteo Baccan 'html2txt201.zip' e ricordare che funziona da linea di comando (oppure usare i tools che ha presentato icemax)

Il vantaggio di html2txt201 è che ripulisce perfettamente i files html e puoi, dopo, importarli in Excel.
rbon

html2txt201.zip

PS
puoi anche usare un editor Html come PsPad oppure, meglio perchè non scrive sul registro, RJ TextEd ed eseguire la conversione da html a testo (ascii).



Ciao rbon, ho provato ad usare le due gui di Icemax ma mi restituisce l'errore che riporto nell'immagine, l'errore è sia con P2H Pdf to html che con P2T Pdf to Text, per quanto riguarda html2txt201 non vedo alcuna gui e senza di quella non so usare i programmi a linea di comando, se puoi darmi qualche delucidazione ti ringrazio in anticipo, così mi chiarisco un po le idee.


Back to top
icemax
Tue 30 Sep 2008 - 08:18

online
Registered Member #194
Joined: Sun 21 Jan 2007 - 22:27
Posts: 1371
Rbon .. intanto ti ringrazio per aver segnalato P2T P2H

Domino :
Ciao rbon, ho provato ad usare le due gui di Icemax ma mi restituisce l'errore che riporto nell'immagine, l'errore è sia con P2H Pdf to html che con P2T Pdf to Text, per quanto riguarda html2txt201 non vedo alcuna gui e senza di quella non so usare i programmi a linea di comando, se puoi darmi qualche delucidazione ti ringrazio in anticipo, così mi chiarisco un po le idee.


assicurati di :

- eseguire il programma con privilegi alti
- eseguire il programma da disco scrivibile (e non da supporti protetti da scrittura).

in ogni caso antrambi sono in versione beta Ma perfettamente funzionanti.

fammi sapere

ciao

[ Edited Tue 30 Sep 2008 - 08:21 ]
Back to top
domino
Tue 30 Sep 2008 - 08:28

online
Registered Member #9897
Joined: Fri 21 Mar 2008 - 17:57
Location: Milano
Posts: 600
icemax wrote ...

assicurati di :

- eseguire il programma con privilegi alti
- eseguire il programma da disco scrivibile (e non da supporti protetti da scrittura).

in ogni caso antrambi sono in versione beta Ma perfettamente funzionanti.

fammi sapere

ciao


Ciao icemax, grazie per la risposta, sul Pc Xp Pro sp2 sono amministratore, il disco dal quale cerco di eseguire i due programmi è C. Spero di riuscire a risolvere
Back to top
rbon
Tue 30 Sep 2008 - 08:32
online
Registered Member #4134
Joined: Sat 14 Apr 2007 - 11:42
Posts: 752
Domino scrisse....
Ghostscript serve a processare le immagini

penso che intendi dire: estrarre le immagini da un file .pdf.

A quanto ne so, un file .pdf si può ottenere:
1. compilando files di testo
2. compilando immagini (a loro volta ottenute compilando del testo)
Io utilizzo pdf2html + gui per estrarre, dal pdf, files Html che dovrò poi convertire in testo.

Se dovessi estrarre le immagini penso che userei:
1. Some PDF Image Extract 1.4 (non ne ho testato la portabilità) -Link- , direct download -Link- .
2. una volta ottenute le immagini dovrei però decompilarle utilizzando un programma OCR per ottenere il testo contenuto nelle stesse.

Domino scrisse...
(come utilizzare) html2txt201

purtroppo non credo esista nessuna gui ed io utilizzo un file batch.. in pratica
1. Start - Esegui si digita CMD.exe
2. si 'naviga' con i comandi dos fino alla directory che contiene sia i files html che html2txt già scompattato
3. ci si può aiutare con un file batch (i files html hanno nome progressivo e cioè, per esempio, 1.html, 2.html ecc.)

Domino scrisse...
P2H Pdf to html e P2T Pdf to Text

non posso aiutarti perchè non li ho (ancora) provati a fondo ma mi sembra che funzionassero (ero dubbioso sul risultato ottenuto): in pratica si avvia l'eseguibile e con drag-n'-drop si trascina il file da 'trattare' nella videata del programma scelto.

Spero di non averti fatto confusione.
Ciao


File batch per html2txt

htmltotxt_bat.zip
Back to top
rbon
Tue 30 Sep 2008 - 08:41
online
Registered Member #4134
Joined: Sat 14 Apr 2007 - 11:42
Posts: 752
@icemax
Rbon .. intanto ti ringrazio per aver segnalato P2T P2H

scusa, scusa, scusa .
Anche se non ho ancora utilizzato questi programmi, ti rigrazio molto per la tua disponibilità: ho usato gli altri programmi che gentilmente mi hai messo a disposizione
ciao

Back to top
domino
Fri 03 Oct 2008 - 22:44

online
Registered Member #9897
Joined: Fri 21 Mar 2008 - 17:57
Location: Milano
Posts: 600
domino wrote ...

Ciao rbon, ho provato ad usare le due gui di Icemax ma mi restituisce l'errore che riporto nell'immagine, l'errore è sia con P2H Pdf to html che con P2T Pdf to Text, per quanto riguarda html2txt201 non vedo alcuna gui e senza di quella non so usare i programmi a linea di comando, se puoi darmi qualche delucidazione ti ringrazio in anticipo, così mi chiarisco un po le idee.





Ciao a tutti, @icemax, non so dirti il motivo, ma ora i due programmi funzionano e l'errore è svanito, non chiedermi il perché, misteri dell'informatica...
Back to top

Moderators: Danix, Taf, Rcs, Energy, zandet2, ZioZione, Admin, LordJim60

Jump:     Back to top

Syndicate this thread: rss 0.92 Syndicate this thread: rss 2.0 Syndicate this thread: RDF
Powered by e107 Forum System