Sedotan id.wikipedia.org

4 views
Skip to first unread message

Harry Sufehmi

unread,
Aug 5, 2006, 2:49:35 AM8/5/06
to tekno...@googlegroups.com
Membaca posting disini : http://tunascendekia.org/wordpress/archives/279

Saya jadi mendapat ide untuk membuat versi offline dari id.wikipedia.org,
sehingga kemudian bisa dimanfaatkan oleh lebih banyak orang; karena tidak
memerlukan akses Internet.

Selain itu rencananya juga akan di hosting di sebuah server lokal
(terkoneksi ke IIX), sehingga bisa diakses dengan cepat oleh yang memiliki
akses ke Internet. Di update secara otomatis setiap akhir pekan, sehingga
akan selalu lumayan up to date.

Surprise.... setelah 3 hari download dari server di Amerika (koneksi 10
Mbps), masih belum selesai ! :D Tapi memang saya downloadnya tidak dengan
kecepatan maksimum, untuk mencegah membebani server wikipedia secara
berlebihan.

Hari ke 5, ketika saya cek, lho wget-nya berhenti total. Nggak bergerak
sama sekali. Sewaktu saya jalankan "du .-ms ." pun tidak ada hasilnya
bahkan setelah menunggu dari malam sampai pagi.

Setelah diteliti lagi, sepertinya mentok di limitasi jumlah file di sebuah
direktori di fs ext3 ... ?
Akhirnya ya sudah, saya stop dulu... dan mulai saya kompres dengan 7-zip
(www.7zip.org)

Ini hari ke 4, dan 7-zip masih terus berjalan :D total ukuran direktori
/tmp/id.wikipedia.org/ adalah sekitar 14 GB, dan 7-zip berusaha
mengkompres dengan setting kompresi maksimum.
Dengan prosesor AMD 2 GHz dan RAM 512 MB, saat ini baru selesai sekitar
separuhnya.

Anyway, apakah hal seperti ini sudah ada ? (versi offline wikipedia)
Atau, paling tidak yang di hosting di IIX/OIX ?


Trims,
Harry

Adjie

unread,
Aug 5, 2006, 4:33:51 AM8/5/06
to tekno...@googlegroups.com
On 8/5/06, Harry Sufehmi <mi...@sufehmi.com> wrote:

Membaca posting disini : http://tunascendekia.org/wordpress/archives/279

Saya jadi mendapat ide untuk membuat versi offline dari id.wikipedia.org,
sehingga kemudian bisa dimanfaatkan oleh lebih banyak orang; karena tidak
memerlukan akses Internet.

Selain itu rencananya juga akan di hosting di sebuah server lokal
(terkoneksi ke IIX), sehingga bisa diakses dengan cepat oleh yang memiliki
akses ke Internet. Di update secara otomatis setiap akhir pekan, sehingga
akan selalu lumayan up to date.


Anyway, apakah hal seperti ini sudah ada ? (versi offline wikipedia)
Atau, paling tidak yang di hosting di IIX/OIX ?


Wah Kang Harry, ide bagus tuch

apa yang bisa kita bantu ..???

bantuin nyedot id.wikipediaa terus di bikin off-line DVD gitu ??

jadi inget kegiatannya Om Made, download journal, terus di kirim ke Indo jadi JOD ( journal off-line DVD)

ayo lah kalau kita gotong royong rame2, kayaknya bisa kita bantu banyak untuk pendidikan di Indonesia, soalnya Milis Teknologia kan sudah ngomong panjang lebar soal pendidikan and what so ever, it's time to execution getting things done.

mungkin bisa di bikin hal yang konkrit yang harus kita kerjakan bareng-bareng,

yang lain silahkan tanggapannya


rgds

Adjie


 



Made Wiryana

unread,
Aug 5, 2006, 4:56:21 AM8/5/06
to tekno...@googlegroups.com
On 8/5/06, Adjie <aset...@gmail.com> wrote:


Wah Kang Harry, ide bagus tuch

apa yang bisa kita bantu ..???

bantuin nyedot id.wikipediaa terus di bikin off-line DVD gitu ??

jadi inget kegiatannya Om Made, download journal, terus di kirim ke Indo jadi JOD ( journal off-line DVD)

ayo lah kalau kita gotong royong rame2, kayaknya bisa kita bantu banyak untuk pendidikan di Indonesia, soalnya Milis Teknologia kan sudah ngomong panjang lebar soal pendidikan and what so ever, it's time to execution getting things done.

Wah Adjie, kamu ini ndak canggih banget. Di jaman sekarang koq malah cuma mikirnya ngeburn ke DVD.  Pakai bandwidth tinggi donk :-)
 
Mirror tuh wikipedia ke server IIX, jadi orang dari rumah di INdonesia bisa baca :-) he hee  lha dikasih file aja di Indonesia masih banyak yg minta versi kertas.

BTW ada koq script buat ngegrab wikipedia dg baik dan benar.  Termasuk versioningnya.  Manfaatkan rsync dan teman temannya, di Gottginen (gwdg) ada scriptnya.

Sorry kalau saya tahunya cuma yg kayak gini, ndak canggih canggih, cuma urusan nyedot jurnal dan paper, dan di DVD in aja bisanya

IMW
 

Adjie

unread,
Aug 5, 2006, 5:20:09 AM8/5/06
to tekno...@googlegroups.com

Wah Adjie, kamu ini ndak canggih banget. Di jaman sekarang koq malah cuma mikirnya ngeburn ke DVD.  Pakai bandwidth tinggi donk :-)

;) wah di Indonesia Raya bandwith nya udah kenceng yaa pak, ngga tahu saya kalau itu, cuman kalau di desa gitu bukannya internet baru mau dateng.... *nunduk ah ntar di timpuk telkom*
 

Mirror tuh wikipedia ke server IIX, jadi orang dari rumah di INdonesia bisa baca :-) he hee  lha dikasih file aja di Indonesia masih banyak yg minta versi kertas.


Wah kalau Bandwithya udah  kenceng bisa donk pak.


BTW ada koq script buat ngegrab wikipedia dg baik dan benar.  Termasuk versioningnya.  Manfaatkan rsync dan teman temannya, di Gottginen (gwdg) ada scriptnya.

 

Sorry kalau saya tahunya cuma yg kayak gini, ndak canggih canggih, cuma urusan nyedot jurnal dan paper, dan di DVD in aja bisanya

 
heheheh iyaaa makanya, yang ngga canggih itu kadang bisa lebih cepet dari yang canggih.  soalnya nungguin telkom gali galian kabel atau ISP masang WiMAX  sampe ke garut waduh masih lama atuh *kabur ahh gue kayaknya di black list telkom nich*


adjie


atrinia

unread,
Aug 5, 2006, 5:23:57 AM8/5/06
to tekno...@googlegroups.com
On 8/5/06, Harry Sufehmi <mi...@sufehmi.com> wrote:


Setelah diteliti lagi, sepertinya mentok di limitasi jumlah file di sebuah
direktori di fs ext3 ... ?
Akhirnya ya sudah, saya stop dulu... dan mulai saya kompres dengan 7-zip
( www.7zip.org)

Mas Harri, kok keliatannya downloadnya satu per satu?
Gak pakai ini yah ?
http://en.wikipedia.org/wiki/Wikipedia:Database_download  

Made Wiryana

unread,
Aug 5, 2006, 6:30:27 AM8/5/06
to tekno...@googlegroups.com
On 8/5/06, atrinia <atr...@gmail.com> wrote:


direktori di fs ext3 ... ?
Akhirnya ya sudah, saya stop dulu... dan mulai saya kompres dengan 7-zip
( www.7zip.org)

Mas Harri, kok keliatannya downloadnya satu per satu?
Gak pakai ini yah ?
http://en.wikipedia.org/wiki/Wikipedia:Database_download

Bagi pecinta simple-simplean seperti saya yg hobby-nya download ke DVD, mungkin informasi di bawah ini bermanfaat

http://en.wikipedia.org/wiki/Wikipedia:Wikipedia-CD/Download

Lebih lengkapnya lagi kalau bahasa Hitler

http://de.wikipedia.org/wiki/Wikipedia:WikiPress/Download

Di Jerman wikipedia offline  tersedia dalam berbagai cara siap disedot, padahal bandwidth juga tersedia melimpah ruah

IMW



Harry Sufehmi

unread,
Aug 5, 2006, 8:31:45 AM8/5/06
to tekno...@googlegroups.com
On Sat, August 5, 2006 5:30 pm, Made Wiryana wrote:
> On 8/5/06, atrinia <atr...@gmail.com> wrote:
>> Mas Harri, kok keliatannya downloadnya satu per satu?
>> Gak pakai ini yah ?
>> http://en.wikipedia.org/wiki/Wikipedia:Database_download
>>
>
> Bagi pecinta simple-simplean seperti saya yg hobby-nya download ke DVD,
> mungkin informasi di bawah ini bermanfaat
> http://en.wikipedia.org/wiki/Wikipedia:Wikipedia-CD/Download

Trims untuk semua informasinya.

Yang versi downloadable CD-nya itu enggak lengkap (cuma sekitar 4000
artikel) dan dalam b.Inggris. Jadi kelihatannya saya akan incar yang
Database_download :

http://download.wikimedia.org/idwiki/20060716
http://download.wikimedia.org/idwikibooks/20060804
http://download.wikimedia.org/idwikiquote/20060804
http://download.wikimedia.org/idwiktionary/20060804

Enaknya, kalau pakai cara ini, maka kemudian kita bisa up to date terus
dengan memanfaatkan rsync :
http://en.wikipedia.org/wiki/Wikipedia:Database_download#Rsync

Kalau sampai hari Selasa tidak ada yang menawarkan (ini saya enggak
mengemis lho :) jasanya untuk membantu download ke server di indonesia,
maka saya akan download sendiri.

Tentang hosting mirror id.wikipedia.org, rencananya saya mau taruh di
server groups.or.id.
Tapi memang saat ini ada keterbatasan space hard disk, jadi kalau ada yang
menawarkan (lagi-lagi saya ndak ngemis nih :) jasanya untuk ini, maka
welcome sekali.

Naaahh.. kalau id.wikipedia.org sudah up & running di server lokal, maka
kemudian sudah gampang deh untuk membuat versi offline nya :-)
Kemudian distribusinya mungkin kita bisa manfaatkan jaringan distribusi CD
lokal yang sudah ada (baca: Glodok, Mangga Dua, dkk ;)

btw; salut untuk semua kontributor Wikipedia Indonesia, saya betul-betul
kagum ketika menyadari bahwa total content-nya sudah mencapai lebih dari
14 GB !!
Bravo untuk Anda semua !


Salam,
Harry

Harry Sufehmi

unread,
Aug 5, 2006, 8:46:15 AM8/5/06
to tekno...@googlegroups.com
On Sat, August 5, 2006 7:31 pm, Harry Sufehmi wrote:
> Kalau sampai hari Selasa tidak ada yang menawarkan (ini saya enggak
> mengemis lho :) jasanya untuk membantu download ke server di indonesia,
> maka saya akan download sendiri.

Ralat, ternyata versi database dump-nya ini besarnya hanya sekitar 62 MB,
karena sudah dikompres. Jadi nampaknya biar saya lakukan sendiri saja.
http://download.wikimedia.org/idwiki/20060716/

Cuma memang katanya setelah di uncompress, maka besarnya bisa bengkak
sampai bahkan 100x lipatnya. Jadi mungkin untuk hostingnya masih akan bisa
memanfaatkan bantuan; tapi biar saya konfirmasi dulu.

Trims.


Salam,
Harry


muhammad panji

unread,
Aug 6, 2006, 2:17:47 PM8/6/06
to tekno...@googlegroups.com
On 8/5/06, Made Wiryana <mwir...@gmail.com> wrote:
> On 8/5/06, atrinia <atr...@gmail.com> wrote:
>
> >
> >
> >
> >
> >
> >
> > > direktori di fs ext3 ... ?
> > > Akhirnya ya sudah, saya stop dulu... dan mulai saya kompres dengan 7-zip
> > > ( www.7zip.org)
> >
> >
> >
> > Mas Harri, kok keliatannya downloadnya satu per satu?
> > Gak pakai ini yah ?
> > http://en.wikipedia.org/wiki/Wikipedia:Database_download
>
>
> Bagi pecinta simple-simplean seperti saya yg hobby-nya download ke DVD,
> mungkin informasi di bawah ini bermanfaat
>
> http://en.wikipedia.org/wiki/Wikipedia:Wikipedia-CD/Download
>
> Lebih lengkapnya lagi kalau bahasa Hitler
>
> http://de.wikipedia.org/wiki/Wikipedia:WikiPress/Download
Halaman ini kok kelihatannya lengkap banget ya pilihannya, nggak paham
artinya apa, tapi liat ada beberapa tulisan Gb. sama CD yang en kalah
jauh keliatannya

> Di Jerman wikipedia offline tersedia dalam berbagai cara siap disedot,
> padahal bandwidth juga tersedia melimpah ruah

kenapa ya pak? apa bagaimanapun juga off lebih cepat daripada online?
dan bisa dibawa kemana-mana mungkin?

--
Panji
http://sumodirjo.blogspot.com

muhammad panji

unread,
Aug 6, 2006, 2:23:24 PM8/6/06
to tekno...@googlegroups.com
On 8/5/06, Harry Sufehmi <mi...@sufehmi.com> wrote:
>
> On Sat, August 5, 2006 7:31 pm, Harry Sufehmi wrote:
> > Kalau sampai hari Selasa tidak ada yang menawarkan (ini saya enggak
> > mengemis lho :) jasanya untuk membantu download ke server di indonesia,
> > maka saya akan download sendiri.
>
> Ralat, ternyata versi database dump-nya ini besarnya hanya sekitar 62 MB,
> karena sudah dikompres. Jadi nampaknya biar saya lakukan sendiri saja.
> http://download.wikimedia.org/idwiki/20060716/
mungkin lebih ambil yang di : http://download.wikimedia.org/idwiki/latest/

--
Panji
http://sumodirjo.blogspot.com

muhammad panji

unread,
Aug 6, 2006, 4:20:41 PM8/6/06
to tekno...@googlegroups.com
On 8/5/06, Harry Sufehmi <mi...@sufehmi.com> wrote:
>
pak harry sudah lihat halaman ini http://download.wikimedia.org/static/
untuk dibuat DVD kelihatannya lebih cocok, dibaca offline ok juga
kalaupun diletakan diserver bukankah load nya akan lebih rendah?


--
Panji
http://sumodirjo.blogspot.com

Harry Sufehmi

unread,
Aug 6, 2006, 9:08:48 PM8/6/06
to tekno...@googlegroups.com
On Mon, August 7, 2006 3:20 am, muhammad panji wrote:
> pak harry sudah lihat halaman ini http://download.wikimedia.org/static/
> untuk dibuat DVD kelihatannya lebih cocok, dibaca offline ok juga
> kalaupun diletakan diserver bukankah load nya akan lebih rendah?

Lha, ini lebih bagus lagi :-)
Updating nya juga menjadi jauh lebih simple.

Trims untuk informasinya, nanti saya akan download yang ini saja kalau
demikian.


Salam,
Harry

Made Wiryana

unread,
Aug 7, 2006, 5:57:24 AM8/7/06
to tekno...@googlegroups.com
On 8/6/06, muhammad panji <sumo...@gmail.com> wrote:

> Di Jerman wikipedia offline  tersedia dalam berbagai cara siap disedot,
> padahal bandwidth juga tersedia melimpah ruah
kenapa ya pak? apa bagaimanapun juga off lebih cepat daripada online?
dan bisa dibawa kemana-mana mungkin?

Orang Jerman itu pelit alias perhitungan, kalau bisa bandwidth dihemat dg cara via DVD , dan mirror di institusi lokal, kenapa tidak dilakukan ?

Bahkan utk memasang ADSL di rumah aja yg udah murah, orang Jerman masih itungan banget. Seperti yg saya ungkapin VoD vs DVD, di Jerman aja orang lebih milih lari ke persewaan DVD yg 24 jam (kayak kios gitu) daripada pakai VoD.

Itu Jerman lho

IMW

Ariya Hidayat

unread,
Aug 7, 2006, 7:35:56 AM8/7/06
to tekno...@googlegroups.com
> Orang Jerman itu pelit alias perhitungan, kalau bisa bandwidth dihemat dg
> cara via DVD , dan mirror di institusi lokal, kenapa tidak dilakukan ?

Hehehe padahal untuk yang punya flat-rate, bandwidthnya melimpah ruah.

> Bahkan utk memasang ADSL di rumah aja yg udah murah, orang Jerman masih
> itungan banget.

Flat-rate DSL dibagi-bagi sama tetangga, kadang jadinya "cuma" perlu
bayar iuran 10 euro per bulan.

> Seperti yg saya ungkapin VoD vs DVD, di Jerman aja orang
> lebih milih lari ke persewaan DVD yg 24 jam (kayak kios gitu) daripada pakai
> VoD.

Lha saya nggak punya online video-on-demand udah ada pilihan ratusan
DVD di tempat sewa 24 jam itu. Tarifnya juga murah sekali: 50 sen
(setengah Euro) per 8 jam, nonton DVD kan paling lama 2 jam. Nggak
perlu ojeg karena dekat sekali.

Malah saya yang menawarkan jasa video-on-demand: kalau ada teman mau
nonton, kan saya tanya dulu "kamu mau nonton apa?". Hehe :-)

BTW, yang seperti Netflix di Jerman juga sudah mulai menjamur, antara
lain Amango dan Amazon.de. Cocok untuk yang rumahnya jauh dari rental
DVD.


--
Ariya Hidayat

Made Wiryana

unread,
Aug 7, 2006, 8:58:42 AM8/7/06
to tekno...@googlegroups.com
On 8/7/06, Ariya Hidayat <ariya....@gmail.com> wrote:


> Bahkan utk memasang ADSL di rumah aja yg udah murah, orang Jerman masih
> itungan banget.

Flat-rate DSL dibagi-bagi sama tetangga, kadang jadinya "cuma" perlu
bayar iuran 10 euro per bulan.

Nyindir nih :-) kekekkeke
 
Lha saya nggak punya online video-on-demand udah ada pilihan ratusan
DVD di tempat sewa 24 jam itu. Tarifnya juga murah sekali: 50 sen
(setengah Euro) per 8 jam, nonton DVD kan paling lama 2 jam. Nggak
perlu ojeg karena dekat sekali.

Ya dan tinggal lari ke kios, masukin kartu bisa nyewa film, udah abis nonton balikin.  Kalo males nunggu bus/strassenbahn, naik sepeda aja.  Pilihan film juga bagus-bagus, sayang ndak ada film lawak Indonesia , kayak ludruk dan ketoprak humor

IMW
Reply all
Reply to author
Forward
0 new messages