c64 könyv scannelés

66 views
Skip to first unread message

Ferenc Veres

unread,
Jan 31, 2014, 8:22:53 PM1/31/14
to c6...@googlegroups.com
Sziasztok!

BookScannerhez fejlesztek algoritmust színes oldalak értelmezésére..

http://c64.rulez.org/~lion/bookscanner/color_text/demo.html

Még bőven fejlesztés alatt, illetve jó lenne a PHP-nek egy C++ újraírás,
mert ezzel 1-2 perc egy oldal... :-(

Könyvet is scanneltem egyet tesztből, illetve kettőt, de a másik még
nincs ScanTailorozva:

Basic Feladatok Tükrében (HT-1080z)
http://lion.xaraya.hu/books/221

(A második DJVU-ban OCR is van (igaz nyers), a PDF formátum meg valahogy
nekem nem jön be (de ha vannak jó Linuxos toolok akkor mondjátok). De
minden konvertálható minden mindenbe, szóval tökre nem érdekel. A DjVU
pedig maximálisan megtartja a minőséget mégis elfogadható a fájlméret
(általában minden másnál sokkal kisebb).

Ha valakit érdekel a projekt írjon.

Majd igyekszem olyan könyveket válogatni, ami még máshol nincs fent. A
Commodore egyesületi lapokat valószínűleg NEM fogom bescannelni, mert
már megtette más, a szín feldolgozót a kihívás miatt fejlesztem.

http://pcvilag.muskatli.hu/irodalom/ceu/ceuk.html

Üdv,
Lion

Atte

unread,
Feb 1, 2014, 10:19:01 AM2/1/14
to c6...@googlegroups.com
Szevasz Lion,

Ez egy gyonyoru projekt, tenyleg minden elismeresem!!!

Udv:
Atte

Ferenc Veres

unread,
Feb 1, 2014, 6:18:46 PM2/1/14
to c6...@googlegroups.com
Köszi!

Hát, igazán értéke a mennyiség lenne, én meg vacakolok itt a pixelekkel
meg a bookscanner finomhangolásával. De mivel maga a scannelés gyorsan
megy, az utófeldolgozás a több, megéri kikísérletezni, ez pont az
utómunkát segíti. (Meg persze a végeredmény minőségét javítja.)

Soci küldött egy érdekes hasonló rutint válaszban. Teljesen más a
megközelítés (azt hiszem egyszerűen ez:
http://en.wikipedia.org/wiki/Color_quantization ), így a hibák jellege
is teljesen más. (Nagyon elszórt, apró és kézzel javíthatatlan.)
Igazából a 2 módszer "összeházasításával" lehetne az igazán jó eredményt
elérni. Majd gondolkozok rajta.

Üdv,
Lion

Ferenc Veres

unread,
Mar 23, 2014, 6:57:51 PM3/23/14
to c6...@googlegroups.com
Sziasztok!

Hírek ;-)
Még mindig az első könyvnél tartok, de nagyon bekeményítettem és megírtam tudtommal a világ első igazán használható DjVu text layer editorát. Az történt, hogy PDF-re még mindig nem vitt rá a lélek, így csináltam is egy weboldalt a nagyon király DjVu formátumnak meg a házi készítésű könyv szkennereknek és könyv-szkenneléshez kapcsolódó programoknak (pl ScanTailor leírás):


Az OCR text layer editort pedig az hozta, hogy az egyébként brutál jól működő Tesseract OCR zagyvaságokat csinált a második szkenem fura betűvel szedett tartalomjegyzékéből (a könyv maga jó). Előtte már az alább linkelt HT 1080z BASIC könyv text layerét piszkálgattam plain text data dumpban, de azt senkinek se kívánom (koordináta dobokzok, stb..). 

A text layer egyébként itt is, mint PDF-ben, egy "ghost layer" a szkennelt könyv felett, a szavakat kis pozicionált dobozokba elhelyezve. (Látható a csatolt képen.) Ezeket a dobozokat kell néhol törölni (pl ábrába beleír az OCR), összevonni, szétvágni, cut&paste meg mindenféle van, drag-resize, stb, igaz a tree editort letöltöttem a netről, a spellcheckert is. Webböngészős az editor, mert jelenleg főleg abban tudok programozni. Majd publikálom is valamikor...

Aki foglalkozik könyv szkenekkel és esetleg belinkelné a weblapján a www.djvu.hu-t ha témába vág azt köszi! (Vagy a könyv szkennelési szekciót. De a c64 scanek nem itt lesznek!) Google nem szereti a sehonnan se linkelt oldalakat...

Amit még érdekes lehet megnézni az a HT könyv egyik ábrája vektorizálva. Durva :-)

Üdv,
Lion
webdjvued-1.png
webdjvued-2.png

Balazs Oszvald

unread,
Mar 24, 2014, 2:42:12 AM3/24/14
to c6...@googlegroups.com
Komoly meló, gratula hozzá!

Két elírást találtam nagy hirtelen:
- Nem kell feszíteni vagy nyomni a könyvet, tehát érZKeny anyagok is belerakhatóak
- A festés után készült fentebbi képeken látható ennek AZE redménye.



--
--
Azért kapta ezt a levelet, "C64 Hungary" csoport listára.
A hozzászóláshoz küldjön egy e-mailt a következő címre:
c6...@googlegroups.com
Ha szeretne leiratkozni erről a csoportról, küldjön egy e-mailt a
következő címre c64hu+un...@googlegroups.com
További lehetőségekért látogassa meg a csoportot:
http://groups.google.com/group/c64hu?hl=hu
---
Azért kapta ezt az üzenetet, mert feliratkozott a Google Csoportok „C64 Hungary” csoportjára.
Az erről a csoportról és az ahhoz kapcsolódó e-mailekről való leiratkozáshoz küldjön egy e-amailt a(z) c64hu+un...@googlegroups.com címre.
További lehetőségekért látogasson el ide: https://groups.google.com/d/optout.

Ferenc Veres

unread,
Mar 24, 2014, 6:19:07 AM3/24/14
to c6...@googlegroups.com
Köszi!
Remélem legközelebb már valami 64-es könyv linkjével írok. (Habár a
munkaasztalomon a Laser 210 magyar felhasználói kézikönyve van. :-D Ez
valami olyan ritkaság, hogy a neten nem is találok róla infót,
legalábbis a könyvről. Pedig egy 130 oldalas teljes könyv. Borítója meg
az eleje nincs meg, így azt se tudom ki írta vagy mi a pontos címe. :-( )

2014.03.24. 7:42 keltezéssel, Balazs Oszvald írta:
> Komoly meló, gratula hozzá!
>
> Két elírást találtam nagy hirtelen:
> - Nem kell feszíteni vagy nyomni a könyvet, tehát érZKeny anyagok is
> belerakhatóak
> - A festés után készült fentebbi képeken látható ennek AZE redménye.
>
>
>
> 2014. március 23. 23:57 Ferenc Veres írta, <li...@netngine.hu
> <mailto:li...@netngine.hu>>:

Pycur

unread,
Aug 10, 2021, 3:39:46 AMAug 10
to C64 Hungary
Bocsi hogy bele vau vau, és hogy ennyi idő után, de ez nem szkennelés, hanem befényképezés. Ami valóban színjavításra szorul. A scan valódi scanner eszközzel értendő, csakis úgy lesz eredeti a minősége. Lásd a behúzott sok ezer újság a www.retroujsag.com oldalamon. (van pár amit más archívumban találtam befényképezve....)

Egyébként úgy találtam ide, hogy olyan lapszámokat keresek, amik még nincsenek meg itt JÓ minőségben. Pettingmaster oldalát ismerem, de ő nagyon gyéren mentett le sok újságot, ami mai szemmel már nem annyira fain. Én behúztam 320 000 oldalt, és szívesen behúzok még ennyit ha lesz anyag. Mostanság kaptam egy marék mikrovilágot és mikroszámítógép magazint, de néhány szám még hiányzik.
Ha valaki tud adni olyat ami még ezen az oldalon nincs, és pc újság.... Azt megköszönöm. A3 scannerrel behúzom és visszaadom. Köszi!

Kása Attila

unread,
Aug 10, 2021, 4:08:51 AMAug 10
to c6...@googlegroups.com


:) értem én, más technológia. A scannelésről mindenki tudja mi az, de ha könyv befényképezést mondanánk, mindenki csak pislogna miről is van szó? A végeredmény számít.

Üdv,
Kása Attila
--
--
Azért kapta ezt a levelet, "C64 Hungary" csoport listára.
A hozzászóláshoz küldjön egy e-mailt a következő címre:
c6...@googlegroups.com
Ha szeretne leiratkozni erről a csoportról, küldjön egy e-mailt a
következő címre c64hu+un...@googlegroups.com
További lehetőségekért látogassa meg a csoportot:
http://groups.google.com/group/c64hu?hl=hu
---
Azért kapta ezt az üzenetet, mert feliratkozott a Google Csoportok „C64 Hungary” csoportjára.
Az erről a csoportról és az ahhoz kapcsolódó e-mailekről való leiratkozáshoz küldjön egy e-amailt a(z) c64hu+un...@googlegroups.com címre.
Ha szeretné megtekinteni ezt a beszélgetést az interneten, látogasson el ide: https://groups.google.com/d/msgid/c64hu/d3ed6ef8-935f-43db-b2ff-5be12b40650dn%40googlegroups.com.



Mentes a vírusoktól. www.avast.com

Pycur

unread,
Aug 10, 2021, 5:40:01 AMAug 10
to C64 Hungary
Oké, nem is akarok én ebből vitát szítani. :)
Inkább az érdekel valaki tud e még kölcsönadni pcs újságokat szkennelésre, hogy jó minőségben és teljes  is lehessen a múzeum. :)
Köszi!

Viktor Varga

unread,
Aug 10, 2021, 5:51:14 AMAug 10
to c6...@googlegroups.com
Szia
Az újságaim nem biztos, hogy megvannak, de Data Becker könyvek azok vannak bőven. 

Egyéb kérdés:
A listára nem akarsz feliratkozni, hogy ne kelljen minden leveled engedélyezni külön? :)


üdvözlettel/best regards: Varga Viktor



Ha szeretné megtekinteni ezt a beszélgetést az interneten, látogasson el ide: https://groups.google.com/d/msgid/c64hu/ce4b2439-6a83-4679-a90a-f683a2a1ce0en%40googlegroups.com.

Pycur

unread,
Aug 10, 2021, 6:11:58 AMAug 10
to C64 Hungary
Ja bocsi, azt hittem ez a botvédelem része. Asszem megtaláltam.
Van már egy jóadag könyvem, javarészt pettingmastertől(ő maga személyesen adott forrás scaneket amiket AI resize feljavítottam meg kontraszt javítottam, meg még a scan tailorral egyenesbe is húztam)
meg 1-2 másik helyről, meg 1-2 saját scan.
Itt van borítókban:

De a legördülő mappa választóban szétnézhetsz, ami borító ott van az mind megvan, kivéve, a kódmester első 4 száma, meg talán a controller magazin, azokból 2 szám van, a többihez csak borítót tudtam szerezni.

Legutóbb a mikrovilágot javítottam fel, új saját szkennel, meg a mikroszámítógép magazint, ezt pár napja készítettem el, még nem írtam be a főoldali menübe, de maholnap kiírom.

Ezekből érdekelne olyan szám aminek nincs itt képe. Sok megvan a muskátlin, ami nekem nincs meg, de előbb az eredeti forrásból javítanám, nem ilyen trükközéssel, mert ennek nagyon szöszös a képe amit már szöszösen nagyít az ai is....a commodore lapot azt meg tudta csinálni rendesen. De amit lehet újrahúzok abból is.

Köszi!

Feri Veres

unread,
Aug 11, 2021, 5:29:47 AMAug 11
to c6...@googlegroups.com
Sziasztok, szia Pycur!

Vicces az a régi levelem. Azóta se szkenneltem egyel többet se, pedig
itt van összerakva a scanner (vagy fényképező) a szobámban, hogy "majd
holnap". (Mivel ez az alábbi levelek szerint 7 éve így megy, lehet, hogy
szét kéne szedni elpakolni.)

Fekete-fehéret (se) szkennelek vele, legalábbis azt jobban szeretem,
mert a ScanTailor szépen levágja bitonalra és nincs vele sok gond. Ez az
egy van kész. és ez is csak DjVu, mivel a PDF formátum készítésével még
nem foglalkoztam:

https://c64konyvek.cmsbazar.hu/books/221

Szerintem eszement jó a minősége, kár, hogy csak ez az egy van. (Betű
pontossággal OCR, kézzel végigjavítva. :-) )

Neked viszont gratulálok, ez eszement sok és hasznos munka amit
megcsináltál. Igazából már nem is kell szkennelnem. Ez nagyszerű! :-)
Letölteni viszont annál inkább, köszi, hogy beküldted a linket. Be is
linkelgetem majd az "online olvasható" linkjeim alá.

Kérdezném, hogy MIRROR azaz tükör gyanánt átvehetem-e a c64 vonatkozású
szkeneket, természetesen forrásmegjelöléssel, hasonlóan ezekhez, amiket
már átvettem engedéllyel:

https://c64.rulez.org/pub/c64.hu/Konyvek/

A "C64 és Amiga újságok dögivel, sok 10 GB." linked hibás, az
"index.html" úgy néz ki már nem kell bele.

Egyébként miért a szürke megoldás mellett döntesz, ahelyett, hogy
levágnád fekete-fehérre és eltűnne az oldal másik feléről áttetsző
szürkeség? Illetve Megabyte-ban is töredékét foglalná. A fentebbi 160
oldalas könyv 2.35 MB, de ennek nagy része a színes hátlap és borító.

https://retroujsag.com/adatok/retroujsag/c64-konyvek/download.php?file=gepi_kodu_programozas_haladoknak_c64_pc128(1986).pdf

(Ez a példád meg 84 MB, 122 oldal és ez egy kisebb könyv.) Az egyetlen
ok ami miatt ezen gondolkoznék a "look and feel" vagy "feeling"
megtartása, de fehete-fehér könyv esetén szerintem nem ad annyit hozzá.
Bár 320.000 oldalnál lehet, hogy nem is gondolkoznék opciókon, azt
tényleg csinálni kell, nem morfondírozni. :)))

Ha tudok kölcsönadni újságot, akkor nézd meg a weboldalamon amire
szükség lenne, aztán privátban egyeztessünk. Ezen a mail címen elérsz.
PC-s újságom nincs, de Mikroszámítógép magazinból vagy Mikrovilágból
hátha tudok hiányzót pótolni. Egyébként.. nagyon irigylem, hogy
Mikrovilágból neked azok a számok is megvannak, amik még a korai nagy
formátumban jöttek ki. Vettem akkoriban, de kidobáltam olvasás után. :)
Csak a fűzötteket tartottam meg. Sőt, a későbbi szinesekeből meg
kivágtam érdekesebb képeket. Így csak a középső korszak úszta meg.

https://c64konyvek.cmsbazar.hu/mags

Üdv,

Feri / Lion

Pycur

unread,
Aug 11, 2021, 7:57:03 AMAug 11
to C64 Hungary
Helló!
Köszi a link hibát, javítva.
Viszont most vettem észre hogy pl a zxspeccyalista levette az újságokat a linkről. Nem tudom miért, nem kérdeztem meg.
Időnként végigkattogom őket(úgy 4 havonta) akkor még működött.
Az anyagok szabad préda, pont ezért készülnek, hogy a fan bázis-utókor láthasson valamit ezekből.
Szerintem a te linkedről én is szereztem én 1-2-t... :D Kaptam könyvet innen onnan, pár saját scan jah.
A basic feladatok tükrében-t nemrég húztam be, de ez se rossz. Így valóban nagy kontrasztos és kis helyet foglal, csak én azt nem szeretem ebben a formában hogy a betűket nem betűkészletből teszi oda, hanem vektorgrafikusnak felismert alakzatokat rak oda, és nagyításkor recésedik a betű.
És igen, napi 6-700 oldal feldolgozásánál nem nagyon akartam azzal bíbelődni, hogy ilyen-olyan felismerőkön áteresszem, ami a szöveget megőrzi és cserébe kisebb lesz a helyigénye.
Sőt pár évig a scan tailort se ismertem, a nélkül fejlesztettem egyedi megoldást: az acdsee progiban lepörgettem az összes álló, majd fejjel lefelé álló oldalt, és az egér poziciójához viszonyítva kifigyeltem azt az egyetlen oldalt, amelynek a vágása illik majd a többire is és az alapján körbevágattam a faststone photo resizerrel+a méretet is megcsinálta, így azt már csak egy pdfbe kellett önteni és kész is voltam.

Azokat a hatalmas mikrovilágokat csak kölcsönbe kaptam szkennelni, de mivel nagyobb mint egy A3-as így sokat szívtam vele mire kitaláltam hogyan tudom jó minőségben bevinni. A fényképezéssel az volt a bajom, hogy ha nem totál 90° szemből fotózom akkor csúcsosodik mint a piramis, de ha szemből csinálom megcsillan a vaku az üvegen amivel kilapítottam, meg még én is rajta vagyok :D (van itthon egy üvegasztal leszedhető tetővel), nem lett az igazi. Miután behúztam szkennerrel a felét úgy, hogy itt-ott egy betű oszlop kimaradt, nekiálltam fotózni, de az meg nem lett olyan színárnyalatú meg homályosította is a kis betűket, meg ahány oldal annyi képpen állt a gép a kezemben, egyszóval nem volt automatizáltan feldolgozható.
A végső megoldás az lett hogy félbe kinyitottam az újságot és álló A3 módba belefektettem keresztbe, emiatt a szélessége befért és alsó és felső részbe behúztam, majd kézzel gépen összeollóztam. Ez se volt automata de legalább a legjobb eredményt hozta.

A hiányzó lapszámokkal kapcsolatban szívesen és boldogan veszek minden hiánypótlást, és azért adtam meg a galéria linkjét, hogy tudd egyeztetni mi az ami már megvan. Mert az könnyebb hogy nézed a borítókat sorban, és neked is gondolom szépen sorban van a gyűjtemény, és lapozgatod a sajátod és amelyiket a képeken nem látod akkor az valószínűleg hiányzik.

Mikroszámítógép magazinból meglesz még az első 3, ott van a szkennernél, csak most én nem vagyok ott a héten... :)  Ezen felül úgy látom hogy abból a 1989-11 és a 1990-01--04-ig nincs meg, az 5-ös megvan és az valószínűleg az utolsó is.

A mikrovilágból ennél macerásabb összeírni mi az ami nincs meg.(és a borítók nevébe beírtam melyikből hiányzik melyik oldal, sajna van pár ilyen, 1-2 kivágott valamikkel)
Talán a commodore újságokat kéne átnézni és az AI felméretezetteket rendes scanre cserélni, de azok egész jók lettek így is.

Ezen felül szívesen vennék kölcsönbe még amigás újságokat is. 1 embert találtam a neten aki igéri pár szám behúzását, de elég lassan megy a projekt egy marék házi munka mellett és egy házi szkennerrel. Kölcsönadni meg nem szeretné, inkább behúzza maga.
Nem tudom mennyi újság létezhet még, amiről nincs tudomásom sem.

Ha valaki aki e listát olvassa, és talál olyat ami még nincs meg, és beadakozná egy olvasás erejéig azt megköszönném a nagyközség nevében. :)

Hirtelen ennyit tudok elmondani az oldal történelméből.
Köszi!

Viktor Varga

unread,
Aug 11, 2021, 11:13:30 AMAug 11
to c6...@googlegroups.com
Szia Pycur,

A Speccialistás anyagok a szerver átrendezés áldozatai lettek, mikor össze lett vonva a 8bit.hu oldal alá a zx-es kontent is. Szerintem nm szándékos, de Bali-nak még nem szóltam én sem.

üdvözlettel/best regards: Varga Viktor



--
--
Azért kapta ezt a levelet, "C64 Hungary" csoport listára.
A hozzászóláshoz küldjön egy e-mailt a következő címre:
c6...@googlegroups.com
Ha szeretne leiratkozni erről a csoportról, küldjön egy e-mailt a
következő címre c64hu+un...@googlegroups.com
További lehetőségekért látogassa meg a csoportot:
http://groups.google.com/group/c64hu?hl=hu
---
Azért kapta ezt az üzenetet, mert feliratkozott a Google Csoportok „C64 Hungary” csoportjára.
Az erről a csoportról és az ahhoz kapcsolódó e-mailekről való leiratkozáshoz küldjön egy e-amailt a(z) c64hu+un...@googlegroups.com címre.
Ha szeretné megtekinteni ezt a beszélgetést az interneten, látogasson el ide: https://groups.google.com/d/msgid/c64hu/4db21df9-5a47-43d6-b28a-61d6e27e6cf4n%40googlegroups.com.

Pycur

unread,
Aug 21, 2021, 4:50:27 AMAug 21
to C64 Hungary
Üdv!
Sikerült bővíteni a mikrovilág magazinokat, aki szeretné most több lapszámot olvashat mint eddig. Már 109 elérhető!

Kép galéria:

Fájlok:

És lehet hogy még mindig jön hozzá!

Reply all
Reply to author
Forward
0 new messages