Nagy divat lett ebookot olvasni. Én is fan lettem. Most szeretném
befejezni egy könyvsorozatomat (nem, nem én írtam) de csak pdf
formátumban van meg. Jártam már hasonlóképpen, s akkor text
formátumban megszereztem, s úgy oldottam meg. A mostani könyveknek
csak pdf verzióját lelem, illetve nem is nagyon keresem mert
előbb-utóbb muszáj lesz megoldanom.
A bevezető után a lényeg:
A könyvben (mily meglepő, hisz magyar nyelvű) vannak ő és ű betűk. A
kódlapját nem sikerül megállapítanom. Több fontot tartalmaz, s a
kérdéses betűk más fonttal vannak mint a szöveg többi része. Az a
gondom, hogy bármit is teszek, ezeket a betűket hülyén tudja
bármelyik konverter áthozni. PDF olvasóban bezzeg jól jelenik meg.
Képekkel illusztrálnám. pdf:
https://picasaweb.google.com/lh/photo/LqLYmiknF1WnNcDWKE3HP620vUvbY05aEIbgvOQYvf0?feat=directlink
mobi:
https://picasaweb.google.com/lh/photo/VHAqBC7err2nBenSktGW0K20vUvbY05aEIbgvOQYvf0?feat=directlink
Amivel eddig próbálkoztam:
calibre, mobipocket creator, solid pdf tools, libreoffice, pdftotext
mobipocket amikor szétszedte, az xml munkafájlban jól látszik, hogy
külön font a rosszul megjelenített betű/betűk. részlet:
....
<page width="421" height="595">
<font size="14" face="Times-Bold">
<text x="194" y="50" width="14" height="14">El</text>
</font>
<font size="14" face="MUHOSY+TTE185EA78t00">
<text x="208" y="47" width="7" height="14">ı</text>
</font>
<font size="14" face="Times-Bold">
<text x="215" y="50" width="21" height="14">szó </text>
<text x="203" y="82" width="22" height="14">HÓ</text>
</font>
<font size="11" face="Times-Roman">
<text x="45" y="123" width="338" height="11">Három lámpás
hunyorgó lángja vonta a kelleténél jóval élesebb fénybe az</text>
<text x="37" y="136" width="346" height="11">apró, durva, fehér
falú szobát, de Seaine le sem tudta venni a tekintetét a</text>
<text x="37" y="148" width="346" height="11">vaskos faajtóról.
Tudta, hogy irracionálisan viselkedik. Mintha nem is Fehér</text>
<text x="37" y="161" width="88" height="11">Ülnök lett volna! A</text>
</font>
<font size="11" face="Times-Italic">
<text x="125" y="161" width="31" height="11"> saidar</text>
</font>
<font size="11" face="Times-Roman">
<text x="156" y="161" width="227" height="11"> vékonyka fonata,
amit átfúrt a kulcslyukon, távoli</text>
<text x="37" y="174" width="256" height="11">lépések halk
surrogását hozta olykor felé. A kint tekerg</text>
</font>
<font size="11" face="UARTMS+TTE185C3E0t00">
<text x="293" y="171" width="5" height="11">ı</text>
</font>
<font size="11" face="Times-Roman">
<text x="298" y="174" width="87" height="11"> folyosórendszeren </text>
<text x="37" y="186" width="346" height="11">meg-megmozdult
valami, de épphogy meghallotta a neszt, az szinte azonnal</text>
<text x="37" y="199" width="93" height="11">elhallgatott. Egyszer</text>
</font>
<font size="11" face="UARTMS+TTE185C3E0t00">
<text x="130" y="197" width="6" height="11">ő</text>
</font>
<font size="11" face="Times-Roman">
<text x="136" y="199" width="249" height="11"> kis fonat volt,
még egykor régen, novícia korában </text>
<text x="37" y="211" width="106" height="11">tanulta az egyik
barátn</text>
....
Tud-e valaki olyan programot amivel rendbe tehetném a pdf fájlokat?
Bármilyen segítség jól jönne. El tudnám olvasni így is, de egyrészt
hosszú távon fárasztó (tesztelve) másrészt nézzen már ki szépen az
ebadta.
--
Nuanda
Carrying the fire!
_______________________________________________________
linux-flame lista - linux...@mlf.linux.rulez.org
http://mlf2.linux.rulez.org/mailman/listinfo/linux-flame
Olvasd angolul :)
-g-
> ....
>
> Tud-e valaki olyan programot amivel rendbe tehetném a pdf fájlokat?
> Bármilyen segítség jól jönne. El tudnám olvasni így is, de egyrészt
> hosszú távon fárasztó (tesztelve) másrészt nézzen már ki szépen az
> ebadta.
Igen, Windows.
Az a baj, hogy nem a kódlap a szar, hanem az ember, aki a PDF-et
csinálta, és nem ágyazta be az összes használt fontot a PDF-be.
Keress másik ebookot
:P
--
Nuanda
Carrying the fire!
Nemcsak windows alatt rossz. A képernyőképek windowsról vannak igen.
> Az a baj, hogy nem a kódlap a szar, hanem az ember, aki a PDF-et
> csinálta, és nem ágyazta be az összes használt fontot a PDF-be.
Ok. Tudom.
> Keress másik ebookot
Más megoldás?
--
Nuanda
Carrying the fire!
ezekt próbálnám:
- ocr-t ráereszteni
- pdf printerrel átkonvertálni
--
bbyy, marcee
Szar, de van.
Kikeresgeted a PDF infóból, hogy milyen fontkészletek vannak a fájlban,
mik azok, akik nincsenek beágyazva, azokat letöltöd, föltelepíted.
Vagy a mobipocket kimenetét betolod egy scriptnek, ahogy látom, tudja az
az ő betűt, csak az ű helyén, ezeket kell kicserélgetni, aztán tsókolom.
Melós, de szerintem mukodik.
A kereskedelem a másolásvédelem miatt preferálja
az ebook és a pdf formatumot.(Ezért vannak ebben
a nem védett és nem hivatalos eredetû könyvek is.
Jh
Megnézem valamelyikel. Bár jó lenne egyszerűbb megoldás, azonban ha működik ...
> - pdf printerrel átkonvertálni
Teszteltem, nem lett jó. 2 különbözővel is.
--
Nuanda
Carrying the fire!
pl. UARTMS+TTE185C3E0t00 ilyet honnan?
> Vagy a mobipocket kimenetét betolod egy scriptnek, ahogy látom, tudja az
> az ő betűt, csak az ű helyén, ezeket kell kicserélgetni, aztán tsókolom.
> Melós, de szerintem mukodik.
Legvégső esetre marad ez.
--
Nuanda
Carrying the fire!
Ez paradoxon.
--
Nuanda
Carrying the fire!
On máj. 10, 07:49, Attila Halász <halasz.att...@gmail.com> wrote:
> Tud-e valaki olyan programot amivel rendbe tehetném a pdf fájlokat?
> Bármilyen segítség jól jönne. El tudnám olvasni így is, de egyrészt
> hosszú távon fárasztó (tesztelve) másrészt nézzen már ki szépen az
> ebadta.
ABBYY Fine Reader 9 vagy 10.
Sajnos a pdf-ekből valóban jól kinéző mobi-t csak profi ocr-ezés után
tudsz csinálni.
Az ABBYY jelenleg a legjobb ebben, bár az oldalak végén bennmaradó
felesleges sortörésekkel ez sem tud kezdeni semmit, illetve nagyon
figylni kell a beállításoknál, hogy a dialógusokat (gondolatjellel
kezdődő sorokat) ne alakítsa listákká. Ezt a kimeneti docban nem is
biztos, hogy észreveszed, de a prc-ben már borzalom...
Megjegyzem: nálam a következő "gépsor" működik: szöveget LibreOffice-
szal javítom (OCR hibák, könyben bennmaradt sajtó és helyesírási
hibák, stb...). Ennek időtartama a forrás minőségétől és az igénytől
függően fél órától több napig is tarthat.
A kész, formázott odt megy az Atlantis Wordprocessor-ba. Itt kap
tartalomjegyzéket is. Ebből kijön az epub, ami nem teljesen
szabványos, így még bele kell küldeni a Sigil-be is, ami teljesen
szabványosra alakítja.
Az epub-ot ki kell csomagolni pl a 7zip-pel, a content.opf-ből és a
stíles.css-ből el kell tüntetni minden fonthivatkozást (ezekkel nem
tud mit kezdeni a mobi parserek egyike sem) és a content.opf-re már rá
lehet küldeni a mobipocket creatort. Ha szépet akarsz, még megadod a
könyvborítót, kitöltöd a metaadatokat és lesz egy tökéletes prc-d is.
--
SaGa
Miért is? :-O
Ha veszel másolásvédelemmel ellátott ebookokat és pdf-eket,
tehát van olyan olvasód, amellyel ezeket olvasgathatod,
akkor a nem védett (sőt, a crackelt) cuccokat is célszerű
ilyen formátumban terjeszteni, mint kitalálni valami mást,
amit sokan nem tudnak majd olvasni...
--
PTG
Everything is controlled by a small evil group to which, unfortunately,
no one we know belongs.
Debian Lenny
Nem egyszerubb ennel, ha egybol LaTeX-be tolja az ember, es abbol
pdf-et general? Raadasul ez teljesen ugy hangzik, mintha
windowsos szoftverekkel lenne megoldva :)
--
Udvozlettel
Zsiga
OMG, nem könyvet kiadni akarok :)
Nagyon kösz, megnézem ocrrel, reméltem hogy lesz könnyebb, de eddig
nem leltem én sem.
--
Nuanda
Carrying the fire!
Értő olvasás rulez. A hozzászólás első részében kifejti, hogy a
kereskedők a drm miatt preferálják majd kijelenti, hogy _ezért_ vannak
a nem hivatalos könyvek is ezekben a formátumokban.
Amit te mondtál az rendben van, de johannes nem ezt mondta.
--
Nuanda
Carrying the fire!
"Attila Halász" <halasz...@gmail.com> írta 2011-05-11 09:20-kor:
> Pirity Tamas Gabor <p...@apaczai.elte.hu> írta (2011. május 11. 8:54):
> > On Wed, May 11, 2011 at 07:14:53AM +0200, Attila Halász wrote:
> >> > A kereskedelem a másolásvédelem miatt preferálja
> >> > az ebook és a pdf formatumot.(Ezért vannak ebben
> >> > a nem védett és nem hivatalos eredet?? könyvek is.
> >>
> >> Ez paradoxon.
> >
> > Miért is? :-O
> >
> > Ha veszel másolásvédelemmel ellátott ebookokat és pdf-eket,
> > tehát van olyan olvasód, amellyel ezeket olvasgathatod,
> > akkor a nem védett (sőt, a crackelt) cuccokat is célszerű
> > ilyen formátumban terjeszteni, mint kitalálni valami mást,
> > amit sokan nem tudnak majd olvasni...
>
> Értő olvasás rulez. A hozzászólás első részében kifejti, hogy a
> kereskedők a drm miatt preferálják majd kijelenti, hogy _ezért_ vannak
> a nem hivatalos könyvek is ezekben a formátumokban.
>
> Amit te mondtál az rendben van, de johannes nem ezt mondta.
Értetlenkedés rulez. Szerintem pontosan ezt mondta, legalábbis én úgy
értettem amit mondott, mint ahogyan PTG is leírta. De biztos bennem van a
hiba, vagy szarul funkcionál ma az értetlenkedő pluginem.
Üdv:Gyur!
Én legalábbis úgy értettem (ami szerintem logikusabb, mint ahogy Te
értetted és ami valóban butaság), hogy a hangsúly a _preferálás_-on
van és nem a _másolásvédelmen_.
Azaz a kereskedelem preferálja a pdf-et (persze tudjuk, hogy a drm miatt),
és mivel a kereskedelem preferálja a pdf-et, _ezért_ célszerű a többi cuccot
is pdf-ben teríteni.
--
PTG
To laugh at men of sense is the privilege of fools.
Debian Lenny
Írtam már, hogy így teljesen rendben van, csak én nem ezzel a
kiemeléssel értelmeztem.
--
Nuanda
Carrying the fire!
Nem értetlenkedni akartam, nekem úgy volt értelmes a szöveg, ha ti
másképp értelmezitek ok. Lehet hogy az én parserem rossz.
--
Nuanda
Carrying the fire!
Főleg, ha a Te értelmezésed paradox :), valószínű a másik értelmezés
a jó. :)
--
PTG
There is a vast difference between the savage and civilized man, but it
is never apparent to their wives until after breakfast.
-- Helen Rowland
Debian Lenny
Johannes stílusába belefért volna.
--
Nuanda
Carrying the fire!
On máj. 11, 08:54, Kosa Attila <zs...@kosaek.hu> wrote:
> Nem egyszerubb ennel, ha egybol LaTeX-be tolja az ember, es abbol
> pdf-et general? Raadasul ez teljesen ugy hangzik, mintha
> windowsos szoftverekkel lenne megoldva :)
A TeX-be tolás még stimmelne is, de a pdf pont nem cél, mert nem
használható az e-book olvasókon. Vagy pont akkorára kell méretezni,
mint a kijelző (6", 600x800, 7" 480x800, 9", 10", 3,2", 4", a
leghülyébb méretek és mindegyikre kell egyet gyártani). Azért jobb a
mobi és az epub. Annak mindegy mekkora a kijelző, akkora betűket
állítasz be magadnak, amekkorát jól látsz, legföljebb sűrűbben
lapozol.
Epub és prc előállításra linux alatt vagy a vim-et, vagy a calibre-t
tudod használni. Egyik sem az igazi, ráadásul a vim után még kell
valami, ami tényleg mobi-t vagy epub-ot gyárt belőle. A calibre által
előállított cucc ugyan olvasható, de a minőségtől igencsak messze van.
Sajnos...
Illetve epubra ott a Sigil.
Mobipocket creator nincs, kindlegen se.
Olyasmin agyalunk egy ideje, hogy a nyersanyagot, ocrezés és
alapformázás után valami xml-be kellene tárolni, és megírni az xslt-
ket, amikkel ebből epub-ot, prc-t, fb2-t lehetne generálni.
Az fb2 maga is xml, a másik kettő meg xhtml alapú...
Csak én az xml-hez nem értek csak annyira, amennyi az fb2-höz kell.
--
SaGa
Ocr bejött, csak ki kellett kisérleteznem a végformátumot, hogy ne
felsorolásjel legyen a mobi-ba átalakításnál.
Kösz.
--
Nuanda
Carrying the fire!
Folyamatosan fejlesztik, s nekem megfelel amit előállít.
--
Nuanda
Carrying the fire!
Milyen ocr?
--
Udvozlettel
Zsiga
Keresgeltem egy kicsit "pcr convert Linux" kifejezessel
kapcsolatban, de nem tudom, hogy jokat talaltam-e:
http://www.plkr.org/
http://www.mobileread.com/forums/showthread.php?t=17718
http://wiki.mobileread.com/wiki/E-book_conversion
--
Udvozlettel
Zsiga
prc convert Linux - a pontossag kedveert :)
A SaGa által javallott abby.
--
Nuanda
Carrying the fire!
>>> Milyen ocr?
>>
>> A SaGa által javallott abby.
>>
> Az 'A SaGa'-ba mikor köt bele valaki? :-)
Miert kene belekotni? "Az abby amit a SaGa javasolt" helytelen,
viszont "A SaGa altal javasolt abby" teljesen helyes (a hatarozott
nevelo nem SaGara hanem abbyra vonatkozik).
--
Udv, Sandor
$SUBJ | s/pdf .*$/a subjectben/
LOL
>>>>> Milyen ocr?
>>>> A SaGa által javallott abby.
>>>>
>>> Az 'A SaGa'-ba mikor köt bele valaki? :-)
>>
>> Miert kene belekotni? "Az abby amit a SaGa javasolt" helytelen,
>> viszont "A SaGa altal javasolt abby" teljesen helyes (a hatarozott
>> nevelo nem SaGara hanem abbyra vonatkozik).
>>
> SaGa által javallott abby. - Szerintem ez is helyes.
Elofordulhat, attol fugg mit akarsz mondani.
> Ha igen, akkor minek
> mégis az 'A' a mondat elejére?
Hatarozott nevelo, az a dolga ami egy hatarozott nevelonek: pontositja
hogy egy konkret dologrol van szo es nem altalaban valamirol.
Ott van igazsagod hogy a kerdes volt rosszul felteve, altalanos
valaszt kivant. Helyesen "melyik ocr" lett volna :)
Pelda:
- Milyen torveny?
- Orban altal javasolt [torveny].
Viszont:
- Melyik torveny?
- Az Orban altal javasolt [torveny].
>> [valamit]
>
> $SUBJ | s/pdf .*$/a subjectben/
> LOL
:) Valami ocska es talan nem jol konfiguralt webmail, az csinalja ezeket.
--
Udv, Sandor
_______________________________________________________
On máj. 11, 15:37, Kosa Attila <zs...@kosaek.hu> wrote:
> On Wed, May 11, 2011 at 06:13:49AM -0700, SaGa wrote:
>
> > On máj. 11, 08:54, Kosa Attila <zs...@kosaek.hu> wrote:
> > > Nem egyszerubb ennel, ha egybol LaTeX-be tolja az ember, es abbol
> > > pdf-et general? Raadasul ez teljesen ugy hangzik, mintha
> > > windowsos szoftverekkel lenne megoldva :)
>
> > A TeX-be tolás még stimmelne is, de a pdf pont nem cél, mert nem
> > használható az e-book olvasókon. Vagy pont akkorára kell méretezni,
> > mint a kijelző (6", 600x800, 7" 480x800, 9", 10", 3,2", 4", a
> > leghülyébb méretek és mindegyikre kell egyet gyártani). Azért jobb a
> > mobi és az epub. Annak mindegy mekkora a kijelző, akkora betűket
> > állítasz be magadnak, amekkorát jól látsz, legföljebb sűrűbben
> > lapozol.
> > Epub és prc előállításra linux alatt vagy a vim-et, vagy a calibre-t
> > tudod használni. Egyik sem az igazi, ráadásul a vim után még kell
> > valami, ami tényleg mobi-t vagy epub-ot gyárt belőle. A calibre által
> > előállított cucc ugyan olvasható, de a minőségtől igencsak messze van.
> > Sajnos...
>
> Keresgeltem egy kicsit "pcr convert Linux" kifejezessel
> kapcsolatban, de nem tudom, hogy jokat talaltam-e:
Ezek közül gyakorlatilag a Calibre és a chm2mobi az, ami prc-t álllít
elő, de az utóbbi csak chm-ből.
A többi is konvertál, de prc-re, mobi-ra pont nem. A legtöbb pdf-re
alakít más formátumokat, amire a legjobb a Libreoffice.
--
SaGa
Bár látom többen irtak, de én is kifejteném:
A(z) ... abby. ez lenne, s a z betűt azért veszti el, mert a közvetlen
utána álló szó mássalhangzóval kezdődik.
--
Nuanda
Carrying the fire!
Calibre nem állít elő prc-t, de mobit igen, s az jó a kindle részére.
> A többi is konvertál, de prc-re, mobi-ra pont nem. A legtöbb pdf-re
> alakít más formátumokat, amire a legjobb a Libreoffice.
PDF-et nem szeretem, nem úgy tördeli.
--
Nuanda
Carrying the fire!
On máj. 12, 08:06, Attila Halász <halasz.att...@gmail.com> wrote:
> 2011/5/12 SaGa <saga...@gmail.com>:
Jó a pdf, ha akkora oldalméretet állítasz be, amekkora a kijelző.
Tán már itt is írtam egyszer: a Kindle 3 (és az összes 6"-es e-inkes
cucc) 256x340pt méretű oldallal, 0 margóval, körülötte 1pt vastag, 10%-
os szürke kerettel, azon belül 2pt belső keret. 12 pt méretű betűk,
115% sormagasság. Szerintem tökéletes.
Akinek jobb a szeme, az használhat kisebb betűket is.
Persze a pdf-nek csak akkor van ilyen olvasókon létjogosultsága a prc-
vel vagy epub-bal szemben, ha az olvasó nem képes a formázási
specialitásokat megjeleníteni pl epub-ból. Iniciálék, spéci
betűtípusok, körülfolyatott képek, spéci formázású táblázatok, stb...
Egy normál A5-ös oldalakból álló könyv átméretezése erre a formátumra
nagyjából 10 perc, mert néhány kiemelést (címsorok betűmérete és
távolsága a többi résztől) át kell méretezni, hogy tényleg jól nézzen
ki ekkorában is, de tényleg csak ennyi. A pdf-be be kell ágyaztatni a
felhasznált betűket is, amit szintén tud a Libre/OpenOffice pdf
exportja, sőt már a hibrid pdf-et, is, ami az odt-t is befoglalja a
pdfbe, azaz egy LibreOffice-szal akár tovább javíthatod, ha akarod,
mert simán megnyitja...
--
SaGa
Ebookot nem érdemes PDF-ben teríteni. DRM ide vagy oda. Vannak DRM
védelemmel ellátott tisztességes ebook formátumok is (epub, prc), és
jobban jár mindenki, ha abban tárolja a könyveket PDF helyett. A PDF
arra viszonylag megfelelő, hogy minden rendszeren ugyanúgy nézzen ki a
megjelenítendő szöveg, ez viszont az eltérő méretű ebook-olvasókon
inkább hátrány, mert amit egy 7-9"-es olvasón kényelmesen el tudsz
olvasni, az az 5"-esen már nehéz lesz, a PDF file-ok többsége viszont
nem tördelhető újra egyszerűen. Ráadásul személyfüggő, hogy ki mekkora
méretű betűket szeret olvasni, PDF-nél a nagyítás megintcsak nem jelent
automatikusan újratördelést, a kifejezett ebook formátumoknál viszont igen.
--
--- Friczy ---
'Death is not a bug, it's a feature'