[devteam]ISBN - rozczai to ktoś?

16 views
Skip to first unread message

Ryszard Mikke

unread,
Sep 20, 2010, 3:08:29 PM9/20/10
to Blipoteka
Zacznijmy od "po co nam ISBN?".

Do wprowadzania książek do bazy.
Chcemy, żeby to było jak najprostsze, inaczej części ludzi po prostu
nie będzie się chciało wklepywać, a tym bardziej sprawdzać, czy
poprawnie wklepali - i książek będzie mniej.

Widzę to tak:
Pole do wprowadzania książek będzie mieć na samej górze niewymagalne
pole "ISBN" i guzik "Sprawdź" obok.
Po wpisaniu ISBN naciska się guzik i jeśli tylko uda się wyciągnąć
dane, to reszta pól uzupełnia się sama.
A jak się nie da sprawdzić, albo nie wpiszemy ISBN (bo go np. nie ma),
to cóż, trzeba klepać...

Teraz - jak to zrobić?

Nie wiem jeszcze i podejrzewam, że kto inny (Argasek?) prędzej ode
mnie to rozczai, ja prosty DBadmin jestem :D
Na razie mam:
* wyszukiwarke podrzuconą przez rubeusa: http://alpha.bn.org.pl/
* namiar na protokół Z39.50 (też od rubeusa): http://pl.wikipedia.org/wiki/Z39.50
* namiar na różne cudeńka, całkiem obiecujący na moje lajkonikowe oko:
http://isbntools.com/

Fajnie by było, gdyby ktoś umiał to doprowadzić do postaci działającej
formatki,
w której by się wpisywało ISBN i dostawało się dane, czyli żeby umiał
jakoś te dane wyciągać.

Później widzę to tak, że najpierw się sprawdzi, czy książki już w
bibliotece nie ma
i dopiero jak nie ma, to się sięgnie do zewnętrznych zbiorów. Ale
najpierw trzeba umieć sięgnąć.
To kto się pisze na odkrywcę?

rmikke

Piotr 'Mikołaj' Mikołajski

unread,
Sep 20, 2010, 3:45:51 PM9/20/10
to Blipoteka
W odkrywcę się nie pobawię, ale dorzucę do kolekcji link do formatu
MARC21.
Stosowanego chyba równie powszechnie, jak Z39.50: http://www.loc.gov/marc/

PMM / Sithian

Rubeus

unread,
Sep 20, 2010, 3:55:26 PM9/20/10
to blip...@googlegroups.com
W dniu 20 września 2010 21:45 użytkownik Piotr 'Mikołaj' Mikołajski
<piotr.mi...@gmail.com> napisał:

Z.39.5 to protokół wymiany danych - w skrócie to on właśnie
odpowiadałby za 'realizację zlecenia' a MARC21 to format danych. A to
są dwie różne 'rzeczy'.


Co do 'rozgryzienia' - trzeba by napisać skrypcik, który wysyła
zapytanie do Bazy Biblioteki Narodowej (tylko książki po polsku, o
Polsce i polakach lub wydane u nas, oraz nieliczne zagraniczne
naukowe ) i automagicznie wypełnia formularze.

--
http://warszawawobiektywie.waw.pl/ -  Warszawa w obiektywie

Najstrukturalniejszy RaV

unread,
Sep 20, 2010, 4:05:11 PM9/20/10
to blip...@googlegroups.com
mozna sprobowac zrobic tez proces w talend ktory to wyciagnie (a docelowo bedzie mogl z csv'ek wrzucac informacje do systemu. z tego co pamietam talend komipuje sie do javowych jarkow i wystawia worki jako webservice)
- pytanie tylko, czy baza jest relacyjna z SQL, czy jakies NoSql.
pozdrawiam, rd

"Whoever fights monsters should see to it that in the process he
does not become a monster.  And when you look into an abyss, the abyss
also looks into you."  -- Nietzsche


2010/9/20 Rubeus <rub...@gazeta.pl>

Ryszard Mikke

unread,
Sep 20, 2010, 4:53:05 PM9/20/10
to Blipoteka
On 20 Wrz, 22:05, Najstrukturalniejszy RaV <elpa...@gazeta.pl> wrote:
> mozna sprobowac zrobic tez proces w talend ktory to wyciagnie (a docelowo
> bedzie mogl z csv'ek wrzucac informacje do systemu. z tego co pamietam
> talend komipuje sie do javowych jarkow i wystawia worki jako webservice)
> - pytanie tylko, czy baza jest relacyjna z SQL, czy jakies NoSql.

Baza musowo będzie relacyjna i z SQL, inaczej ja się nie piszę
na jej robienie.

rmikke

Paweł Wolak

unread,
Sep 20, 2010, 4:54:16 PM9/20/10
to blip...@googlegroups.com
rmikke +1, chociaż do zabierania się za ISBN się nie deklaruję.

2010/9/20 Ryszard Mikke <ryszar...@gmail.com>



--
Pozdrawiam,
Paweł Wolak

macnow

unread,
Sep 20, 2010, 6:25:55 PM9/20/10
to Blipoteka
http://macnow.pl/tmp/isbndecoder.php -> wstępna wersja mojego parsera.

Pozdrawiam,
Maciej Nowakowski

Ryszard Mikke

unread,
Sep 21, 2010, 2:33:38 AM9/21/10
to Blipoteka
On Sep 21, 12:25 am, macnow <mac...@gmail.com> wrote:
> http://macnow.pl/tmp/isbndecoder.php-> wstępna wersja mojego parsera.

Oooo, pierwszy zdolny, brawo dla tego pana :D

A skąd ten parser bierze dane?

Bo sprawdziłem na dwóch numerach:
0-7384-8530-6 (amerykański)
83-89529-11-4 (polski)
i żadnego nie znalazło...

rmikke

Rubeus

unread,
Sep 21, 2010, 2:49:26 AM9/21/10
to blip...@googlegroups.com
W dniu 21 września 2010 08:33 użytkownik Ryszard Mikke
<ryszar...@gmail.com> napisał:

> On Sep 21, 12:25 am, macnow <mac...@gmail.com> wrote:
>> http://macnow.pl/tmp/isbndecoder.php-> wstępna wersja mojego parsera.
>
> Oooo, pierwszy zdolny, brawo dla tego pana :D
>
> A skąd ten parser bierze dane?
>
> Bo sprawdziłem na dwóch numerach:
> 0-7384-8530-6 (amerykański)

dla zagranicznych polecam zapytania kierować tu:
http://www.worldcat.org/ - dla polskich też działa, ale bez polskich
literek

> 83-89529-11-4 (polski)
> i żadnego nie znalazło...

Bo Narodowa nie opisała tej książki - tzn. wydawnictwo jej nie
dostarczyło i nie można było zrobić opisu
z autopsji. Są takie przypadki :-(

W Polsce w zbiorach mają ją tylko 4 biblioteki ?!

Można to sprawdzić ręcznie tu -> http://karo.umk.pl/Karo/karo.php


>
> rmikke
>

rubeus

Argasek

unread,
Sep 21, 2010, 3:51:45 AM9/21/10
to Blipoteka
Macnow: brawo :) Przy okazji, znalazłem coś takiego:

http://www.blyberg.net/2006/04/05/php-port-of-isbn-1013-tool/

teraz pozostaje to ładnie zorganizować od strony kodu. Mój pomysł:

- stworzyć interfejs Blipoteka_Book_Import_Interface deklarujący
metodę import(), której jednym z wymaganych argumentów będzie obiekt
klasy Blipoteka_Book
- stworzyć klasę abstrakcyjną Blipoteka_Book_Import dziedziczącą z
interfejsu Blipoteka_Book_Import_Interface
- stworzyć klasę (z kodem Macnowa) konkretną
Blipoteka_Book_Import_Isbn, dziedziczącą z Blipoteka_Book_Import

W przyszłości będzie można implementować inne klasy, typu
Blipoteka_Book_Import_Csv i używać ich w ten sam sposób. Sugestie
odnośnie wzorców projektowych mile widziane.

Argasek

macnow

unread,
Sep 21, 2010, 7:38:49 AM9/21/10
to Blipoteka
Sprawdź teraz te ISBNy, które niedziałały ;)

macnow

unread,
Sep 21, 2010, 7:44:02 AM9/21/10
to Blipoteka
Dopisałem jeszcze jedno źródełko, a mianowicie WorldCat
publicznie zdradzić nie mogę pierwszego, bo jeszcze zbanują nas :P

Dajcie znać jak znajdziecie jakiś ISBN, którego nie rozpoznaje :)

Jak trzeba będzie, to się podepnę pod to: http://karo.umk.pl/Karo/karo.php
;)

Pozdrawiam,
Maciej Nowakowski

Rubeus

unread,
Sep 21, 2010, 7:59:02 AM9/21/10
to blip...@googlegroups.com
W dniu 21 września 2010 13:44 użytkownik macnow <mac...@gmail.com> napisał:
> Dopisałem jeszcze jedno źródełko, a mianowicie WorldCat
> publicznie zdradzić nie mogę pierwszego, bo jeszcze zbanują nas :P
>
> Dajcie znać jak znajdziecie jakiś ISBN, którego nie rozpoznaje :)
>
> Jak trzeba będzie, to się podepnę pod to: http://karo.umk.pl/Karo/karo.php
> ;)
>
> Pozdrawiam,
> Maciej Nowakowski
>


To doczytaj, że ma zamiar blokować 'automaty; :-)

Ryszard Mikke

unread,
Sep 21, 2010, 8:23:19 AM9/21/10
to Blipoteka
No tera to tak :D
Ten polski, co to go Biblioteka Narodowa nie widziała, TEŻ.
Duze brawko.

rmikke

macnow

unread,
Sep 21, 2010, 8:38:16 AM9/21/10
to Blipoteka
On 21 Wrz, 13:59, Rubeus <rub...@gazeta.pl> wrote:
> To doczytaj, że ma zamiar blokować 'automaty; :-)

Ale on pisze o Tym, że ludzie wysysają całe bazy bibliotek, a my
potrzebujemy początkowo więcej, ale w późniejszejpewnie średnio ok. 5
zapytań dziennie, więc nie do wykrycia.
Inna sprawa, że można by się z pewnością dogadać, może udostępniłby
nam jakieś API :)

Piotr Kasprzyk

unread,
Sep 21, 2010, 8:40:29 AM9/21/10
to blip...@googlegroups.com

--------------------------------------------------
From: "macnow" <mac...@gmail.com>
...
> Dajcie zna� jak znajdziecie jaki� ISBN, kt�rego nie rozpoznaje :)
>
A jak rozpoznaje, ale �le?
978-83-89325-48-8 rozpoznaje jako Nauk� �wiata Dysku II (jest III), opis te�
jest z dw�jki.
a
83-7337-641-0 jako Nauk� �wiata Dysku (ale tutaj rok wydania chyba si�
zgadza, opisu nie ma, wi�c mo�e to tylko przeoczenie)

Phaedrus

Jakub Argasiński

unread,
Sep 21, 2010, 8:40:48 AM9/21/10
to blip...@googlegroups.com
W dniu 21 września 2010 14:38 użytkownik macnow <mac...@gmail.com> napisał:
> Ale on pisze o Tym, że ludzie wysysają całe bazy bibliotek, a my
> potrzebujemy początkowo więcej, ale w późniejszejpewnie średnio ok. 5
> zapytań dziennie, więc nie do wykrycia.
> Inna sprawa, że można by się z pewnością dogadać, może udostępniłby
> nam jakieś API :)

Jestem raczej za tym, aby się dogadać. Napisać uczciwie, że to i
tamto, że ruch mały itp.

--
Jakub Argasiński
Web developer | http://www.vela.net.pl/
ESC S.A. Kraków
+48 (12) 656 51 58

macnow

unread,
Sep 21, 2010, 8:54:45 AM9/21/10
to Blipoteka

Rubeus

unread,
Sep 21, 2010, 9:08:00 AM9/21/10
to blip...@googlegroups.com
jak ofto to oftop.

Trójka ma taki isbn

978-83-7648-010-7

to już jest nowy 13-to zamiast 10-cio znakowego i macnowy skrypt nie łyka

Rubeus

unread,
Sep 21, 2010, 9:10:30 AM9/21/10
to blip...@googlegroups.com
hmmm... za szybko napisałem - wygląda na to, że u mnie w pracy pod IE
skrypt nie zwraca wyników

macnow

unread,
Sep 21, 2010, 11:35:50 AM9/21/10
to Blipoteka
Doklepałem jeszcze sprawdzanie na Merlin.pl ;)

Na chwilę obecną łączy wyniki z 3 serwisów.
Reply all
Reply to author
Forward
0 new messages