Google Groups no longer supports new Usenet posts or subscriptions. Historical content remains viewable.
Dismiss

Konwersja PDF na TXT

70 views
Skip to first unread message

Przemek Kramarczyk

unread,
Nov 2, 2012, 2:34:03 AM11/2/12
to
Witam

Jak skonwertowac plik PDF do TXT lub HTML zachowujac polskie znaki ?
Probuje pdftohtml plik.pdf, potem iconv -f UTF-8 -t ISO-8859-2 <
plik.html, ale wywala cos takiego:

<!DOCTYPE HTML PUBLIC "-//W3C//DTD HTML 4.01 Transitional//EN"><HTML>
<HEAD>
<TITLE></TITLE>
</HEAD>
<BODY>
<A name=1></a>abdsadf fd fd lggggg kgj gjkd sjgjkj jg kjgk jg DLiconv:
illegal input sequence at position 172

Jak to ugryzc?

Pozdrawiam

Krzysztof Gajdemski

unread,
Nov 2, 2012, 5:20:39 AM11/2/12
to
Jest Thu, 1 Nov 2012 23:34:03 -0700 (PDT), Przemek Kramarczyk pisze:
Próbowałeś użyć iconva z opcją -c? Możesz też użyć narzędzia enca:
http://cihar.com/software/enca/

k.
--
Krzysztof Gajdemski | songo (at) debian.org.pl | KG4751-RIPE
Registered Linux User #133457 | BLUG Registered Member #0005
PGP key at: http://s.debian.org.pl/gpg/gpgkey * ID: 3C38979D
Szanuję was wszystkich, którzy pozostajecie w cieniu - Snerg

ToMasz

unread,
Nov 2, 2012, 1:14:15 PM11/2/12
to
W dniu 02.11.2012 07:34, Przemek Kramarczyk pisze:
jeden plik? Otworzyć w adobe readerze, okularze czy co tam masz i
zapisać jako plik tekstowy! (zaznacz, skopiuj wklej)
ToMasz

Wald3k M.

unread,
Nov 3, 2012, 2:25:01 PM11/3/12
to
Przemek Kramarczyk pisze:
> Witam
>
> Jak skonwertowac plik PDF do TXT lub HTML zachowujac polskie znaki ?
Spróbuj:
$pdftotext -raw plik.pdf

Przepatrz też opcje, bo wg. manuala pdftotext konwertuje plik używając
domyślnie UTF-8.

Pozdrawiam
Wald3k M.
0 new messages