Google Groups no longer supports new Usenet posts or subscriptions. Historical content remains viewable.
Dismiss

pdf med krypteret font?

87 views
Skip to first unread message

Axel

unread,
Jul 5, 2012, 12:21:50 PM7/5/12
to
Jeg har modtaget en pdf fil med noget tekst som jeg skal copy/paste til en
tekstfil. Jeg benytter Acrobat Pro og værktøjet TouchUp text.

Teksten i pdf filen kan markeres men ikke kopieres. Prøver man alligevel så
får man volapyk. Årsagen er at fonten må være krypteret. Fontnavnet i
"TouchUp Properties" er en kodet tekst og uden tilgængelig systemfont.

Er det muligt at få fat i teksten med copy/paste ?

Jørgen Nielsen

unread,
Jul 5, 2012, 2:42:59 PM7/5/12
to
Axel skrev den 05-07-2012:
> Teksten i pdf filen kan markeres men ikke kopieres. Prøver man alligevel så
> får man volapyk.
>
> Er det muligt at få fat i teksten med copy/paste ?

Dokumentet er vel kopi beskyttet. Den kan ofte let fjernes med et
passende program.

Et par stykker jeg engang har prøvet
http://www.verypdf.com/pwdremover/index.htm

http://www.elcomsoft.com/apdfpr.html

--
Mvh. Jørgen
[e-mail address is valid]


Axel

unread,
Jul 5, 2012, 3:45:52 PM7/5/12
to
On Thu, 05 Jul 2012 20:42:59 +0200, Jørgen Nielsen wrote:

> Dokumentet er vel kopi beskyttet.

Nej, det var det første jeg kikkede efter.
No security
All allowed

emjeppesen

unread,
Jul 5, 2012, 3:52:08 PM7/5/12
to
Axel skrev:

>Jeg har modtaget en pdf fil med noget tekst som jeg skal copy/paste til en
>tekstfil.

kan du ikke bare vælge
File/ Export/word document
File/export/Rich Text format
fra Adobe reader?

Hilsen emj

Axel

unread,
Jul 5, 2012, 4:29:00 PM7/5/12
to
On Thu, 05 Jul 2012 21:52:08 +0200, emjeppesen wrote:

> kan du ikke bare vælge
> File/ Export/word document
> File/export/Rich Text format
> fra Adobe reader?

Nej. Alle former for export og save as, medfører alene at teksterne i
formularfelterne gemmes. Selve baggrundsformularen som indeholder større
områder med tekster, kommer slet ikke med.

Det er en pdf formular med indtastede data. Jeg vil have fat i de tekster
som står med små på formularen.

Peter T.

unread,
Jul 7, 2012, 7:15:04 AM7/7/12
to
Det virker lidt spøjst. Hvis du kan markere teksten, er den ikke
transmogriffet om til ren vektor (hvilket den i bund og grund jo
alligevel er, men...).

Jeg har et par bud:

- Prøv at omdøbe den til bla. .ai (adobe illustrator) og hent filen ind
i det program og se om du kan trække teksten ud derfra. Det vil
muligvis give lidt spøjse resultater.
- Prøv også andre pdf-readere end adobes egen. FoxIT PDF Reader er en
mulighed.
- Har du prøvet, at markere teksten, og kopiere den ind i en simpel
notepad? Sommetider kan kan denne metode løse problemer...
- Jeg ved ikke om man kan køre OCR-software på en pdf. Men hvis alle
andre muligheder er udtømte, er dette måske den sidste mulige løsning.
Du skal nok lave en jpeg af pdfen...

Spørgsmålet er dog om dokumentet er lavet i et adobeprogram (adobe pdf
writer, acrobat osv.) og ikke via en vilkårlig proprietær pdf-printer,
der inficerer koden ved at vride den igennem en skraldespand pga.
slamkodning.

--
Peter T.

Hauge

unread,
Jul 7, 2012, 7:58:48 AM7/7/12
to
On 05-07-2012 18:21, Axel wrote:
> Jeg har modtaget en pdf fil med noget tekst som jeg skal copy/paste til en
> tekstfil. Jeg benytter Acrobat Pro og værktøjet TouchUp text.
>
> Teksten i pdf filen kan markeres men ikke kopieres. Prøver man alligevel så
> får man volapyk. Årsagen er at fonten må være krypteret. Fontnavnet i
> "TouchUp Properties" er en kodet tekst og uden tilgængelig systemfont.

Problemet er at det kun er de benyttede bogstaver der er i selve
PDF-filen, og i den rækkefølge som de er skrevet..

Dvs. at f.eks. et K, hvis det nu er det førstbenyttede bogstav, vil have
ascii-værdien 0x01.

> Er det muligt at få fat i teksten med copy/paste ?

Nope, desværre..

Men..

Jeg har oplevet at det kan være muligt at oprette en printer (mener den
kaldes "generisk linjeprinter" eller noget i den stil), som er en ganske
alm. linjeprinter, og så udskrive via den til en fil, så får man den rå
tekst.

Men uanset hvad, så er det noget pis, roder engang imellem med samme
problem på mit arbejde.

Mvh Hauge

Axel

unread,
Jul 7, 2012, 4:35:56 PM7/7/12
to
On Sat, 07 Jul 2012 13:58:48 +0200, Hauge wrote:

> Problemet er at det kun er de benyttede bogstaver der er i selve
> PDF-filen, og i den rækkefølge som de er skrevet..
>
> Dvs. at f.eks. et K, hvis det nu er det førstbenyttede bogstav, vil have
> ascii-værdien 0x01.

Det lyder sandsynligt.


> Jeg har oplevet at det kan være muligt at oprette en printer (mener den
> kaldes "generisk linjeprinter"

Et rigtigt prof bud.
Jeg oprettede en "Generic / text only" printer med output til en txt fil,
men det blev også volapyk.


> Men uanset hvad, så er det noget pis, roder engang imellem med samme
> problem på mit arbejde.

Ja men de kan sgu ikke tage røven på proffer vel ;-)

Jeg har nu løst opgaven, ved at printe formularen til en ældre version af
Adobe Distiller og anvende pdf version 1.3 som output.
Nu har jeg så en pdf fil hvor fontnavnet er uændret og fonten stadig er
embedded - MEN hvor font encoding nu er Custom.
Således kan nu copy/paste til en vilkårlig tekstfil eller tekstbehandler
:-))

Axel

unread,
Jul 7, 2012, 4:35:57 PM7/7/12
to
On Sat, 07 Jul 2012 13:15:04 +0200, Peter T. wrote:

> Det virker lidt spøjst. Hvis du kan markere teksten, er den ikke
> transmogriffet om til ren vektor (hvilket den i bund og grund jo
> alligevel er, men...).

Det er hverken vektor eller grafik.
Fonten som har et navn af tal og bogstaver uden mening, er embedded i pdf
filen. Under "document properties" / font, ses den som truetype font med
built-in encoding.


> Jeg har et par bud:
>
> - Prøv at omdøbe den til bla. .ai (adobe illustrator) og hent filen ind
> i det program og se om du kan trække teksten ud derfra.

Det har nu lige prøvet. AI erstatter fonten med f.eks Arial og så er det
stadig volapyk - både ved copy/paste til notepad og ved print til en pdf
generator som f.eks PDFfactory samt en textprinter med fil output.


> FoxIT PDF Reader

En godt bud.
Jeg skrottede dog FoxIT fordi den altid viste filerne forkert.


> Har du prøvet, at markere teksten, og kopiere den ind i en simpel
> notepad?

Ja det var det første jeg gjorde ;-)


> Jeg ved ikke om man kan køre OCR-software på en pdf
Man kan med sikkerhed gemme filen som TIFF og køre OCR på denne. MEN min
tekst er på et fremmedsprog som jeg slet ikke forstår.


> Spørgsmålet er dog om dokumentet er lavet i et adobeprogram (adobe pdf
> writer, acrobat osv.) og ikke via en vilkårlig proprietær pdf-printer,
> der inficerer koden ved at vride den igennem en skraldespand pga.
> slamkodning.

Problemet er at fonten er kodet og det er nok lavet bevidst for at man ikke
må redigere i formularen.

Men jeg har løst problemet. Se næste post.

Cykelsmeden

unread,
Jul 9, 2012, 8:24:06 AM7/9/12
to
Den 05-07-2012 22:29, Axel skrev:
> Nej. Alle former for export og save as, medfører alene at teksterne i
> formularfelterne gemmes. Selve baggrundsformularen som indeholder større
> områder med tekster, kommer slet ikke med.
>
> Det er en pdf formular med indtastede data. Jeg vil have fat i de tekster
> som står med små på formularen.
lyder spøjst imho.

hvad sker hvis du PRINTER formularen til pdf? (eks.PDFwriter)

//finn

Axel

unread,
Jul 9, 2012, 4:32:13 PM7/9/12
to
On Mon, 09 Jul 2012 14:24:06 +0200, Cykelsmeden wrote:

> hvad sker hvis du PRINTER formularen til pdf?

Så printer den teksten som grafik.

Men jeg har lųst problemet :-)

Nicolai Lang

unread,
Jul 10, 2012, 12:48:38 AM7/10/12
to
On Mon, 9 Jul 2012 22:32:13 +0200, Axel
<ax...@youfuckingbastard.invalid> wrote:

>Men jeg har løst problemet :-)

Er det en løsning der kan komme andre til gode?


Med venlig hilsen
Nicolai

--
Jeg blogger om Mb. Crohn, sundhed m.m.
http://nicolai.hjorth.com

Cykelsmeden

unread,
Jul 10, 2012, 7:28:17 AM7/10/12
to
Den 09-07-2012 22:32, Axel skrev:
> On Mon, 09 Jul 2012 14:24:06 +0200, Cykelsmeden wrote:
>
>> >hvad sker hvis du PRINTER formularen til pdf?
> Så printer den teksten som grafik.
ok, det hænger så sikkert sammen med "problemet". Hvis jeg printer til
PDFwriter, kan jeg normalt i den dannede fil kopiere teksten.

>
> Men jeg har løst problemet:-)
ok, det opdagede jeg senere. - principielt forstår jeg det er samme
teknik, bare med destiller i stedet for PDFwriter??

//finn

Hauge

unread,
Jul 10, 2012, 8:08:19 AM7/10/12
to
On 10-07-2012 06:48, Nicolai Lang wrote:
> Er det en løsning der kan komme andre til gode?

Hvis du læste lidt mere af tråden (den er ikke så lang), så ville du
kunne læse løsningen, om den kan komme dig til gode, er jo uvist.

/Hauge

Axel

unread,
Jul 10, 2012, 6:22:04 PM7/10/12
to
On Tue, 10 Jul 2012 13:28:17 +0200, Cykelsmeden wrote:

> principielt forst�r jeg det er samme
> teknik, bare med destiller i stedet for PDFwriter??

Ja og med en pdf version som ikke respekterer diverse security settings ;-)
0 new messages