On Sat, 07 Jul 2012 13:15:04 +0200, Peter T. wrote:
> Det virker lidt spøjst. Hvis du kan markere teksten, er den ikke
> transmogriffet om til ren vektor (hvilket den i bund og grund jo
> alligevel er, men...).
Det er hverken vektor eller grafik.
Fonten som har et navn af tal og bogstaver uden mening, er embedded i pdf
filen. Under "document properties" / font, ses den som truetype font med
built-in encoding.
> Jeg har et par bud:
>
> - Prøv at omdøbe den til bla. .ai (adobe illustrator) og hent filen ind
> i det program og se om du kan trække teksten ud derfra.
Det har nu lige prøvet. AI erstatter fonten med f.eks Arial og så er det
stadig volapyk - både ved copy/paste til notepad og ved print til en pdf
generator som f.eks PDFfactory samt en textprinter med fil output.
> FoxIT PDF Reader
En godt bud.
Jeg skrottede dog FoxIT fordi den altid viste filerne forkert.
> Har du prøvet, at markere teksten, og kopiere den ind i en simpel
> notepad?
Ja det var det første jeg gjorde ;-)
> Jeg ved ikke om man kan køre OCR-software på en pdf
Man kan med sikkerhed gemme filen som TIFF og køre OCR på denne. MEN min
tekst er på et fremmedsprog som jeg slet ikke forstår.
> Spørgsmålet er dog om dokumentet er lavet i et adobeprogram (adobe pdf
> writer, acrobat osv.) og ikke via en vilkårlig proprietær pdf-printer,
> der inficerer koden ved at vride den igennem en skraldespand pga.
> slamkodning.
Problemet er at fonten er kodet og det er nok lavet bevidst for at man ikke
må redigere i formularen.
Men jeg har løst problemet. Se næste post.