Wikidata: 反向把維基資源開放出來再加值...

136 views
Skip to first unread message

Han-Teng Liao

unread,
Jan 16, 2013, 4:03:02 AM1/16/13
to odt...@googlegroups.com
各位關心open data發展可以注意一下Wikidata這project

http://meta.wikimedia.org/wiki/Wikidata

一言蔽之就是利用維基百科等內容, 以符合open data的格式釋出讓大家加值使用....

像最近討論的台北捷運地圖, 目前因為各捷運站已有其infobox的格式化資料,

Wikidata就承諾會提供技術和平台讓這些資料方面大家做運用,

像其data 合作者, 範例 http://openseamap.org/ (德文的公海地圖吧...)

基本上像台北捷運地圖的原始資料是數學上很簡單的網絡關係圖,

是可以快速利用像NodeXL或open diagram 等工具製圖

若各位對台北捷運地圖想要自力救濟用已開放資料再製圖,

可考慮和Wikidata合作...

http://www.wikidata.org/wiki/Wikidata:Data_collaborators


這算是民間自力/互助救濟反向把維基資源開放出來再加值...

漢騰和Wikidata的工作人員之一Daniel 有幾次見面聊天,

最近一次是Google在德國的討論會場子, 若有conflict

of interest在此宣告,


有時促進(逼)政府或政府相關單位open data的策略之一是,

以民間自力/互助救濟成果取得使用基礎, 待使用基礎

影響到其政令及資料權威性時, 該單位常會以「打不過,

只好加入」的方式來加入open data 的參與。


台北捷運地圖的原始資料較單純, 且在中文維基已有相關

資料及資源, 不輸官方資料, 可以是個好例子來展現

民間自力/互助救濟成果, 在Wikidata的中文應用上來說,

也許是可以搶到頭香....

Chia-Kai Liu

unread,
Jan 16, 2013, 4:15:32 AM1/16/13
to odt...@googlegroups.com
OSM guys, what do you say?

從我的 iPhone 傳送

> --
> --
> - OpenData.TW Working Group group.
> - https://groups.google.com/d/forum/odtw-wg?hl=en
> - To post, send email to odt...@googlegroups.com.
> - To unsubscribe, send email to odtw-wg+u...@googlegroups.com.
> --
>
>

Han-Teng Liao

unread,
Jan 16, 2013, 4:16:00 AM1/16/13
to odt...@googlegroups.com
補上Daniel Kinzler, Wikimedia, Germany的演講,

http://www.scivee.tv/node/55318

說明wikidata project的成立目標和作法, 他們成立才不到二年吧,

所以一切都在起步中, 一年半前還在徵數個全職員工,

維基數據(Wikidata)的中文介紹在此

http://meta.wikimedia.org/wiki/Wikidata/zh-hant

希望有幫助

2013/1/16 Han-Teng Liao <han...@gmail.com>:

deng dongpo

unread,
Jan 16, 2013, 4:46:36 AM1/16/13
to odt...@googlegroups.com
wikidata是一個好的方式,既然被點名了,
就提供另一個管道來做捷運圖。事實上,台灣的OSM上,
已經有mappers將各捷運站和各線的資料建起來了,
連還在蓋的幾條也有人畫。
這些資料在ODbL,格式是XML,可以隨時拿出來玩。

附上的圖是從JOSM上看些捷運站和捷運線。
有點醜,只是告訴各位有這樣的資料可以用。
http://farm9.staticflickr.com/8090/8386459346_6ca4139717_o.png


dongpo


2013/1/16 Han-Teng Liao <han...@gmail.com>:

whisky

unread,
Jan 16, 2013, 5:22:40 AM1/16/13
to odt...@googlegroups.com
WikiData 之前我們有稍微研究一下他在玩什麼。後來發現他是要推一個各語系 Wikipedia 頁面皆可引用的共同(共通)資料庫。所以也曾想過可以如何利用。

不過這邊主題似乎還是在捷運地圖。剛好這幾天我看到一個非常棒的 interactive paris metro 地圖,就在這邊推薦給各位玩一玩


然後漢騰提到的民間自行發起的資料庫和資料收集,我這邊就推薦一下 Charles 他們之前 survey CKAN 後做出的 data repository 給大家,網站目前是掛在我們名下,但是一切功勞與苦勞都是 Charles 和網絡行動


順便提一下,歐盟的 open data portal 也是使用 ckan 架設的... : http://open-data.europa.eu/open-data/

-- whisky

Han-Teng Liao

unread,
Jan 16, 2013, 5:27:50 AM1/16/13
to odt...@googlegroups.com
OSM的工作和範圍廣的多了, 畢竟OSM(open street map)的主要是做和實際地理位置的mappers,
真的是更花心力的在地圖的製作上進行開放製圖的協作,

然而我現在提的只是一個範圍很小的用開放資料做"示意圖"(diagram)的可能做法, 不可能取代或置換OSM要
達成的目標地圖(cartography),

當然在製圖(cartography)上加一層示意圖是可能的整合方式, 不過目前的APP地圖"著作權"問題似乎
是在"示意圖"(diagram)而非地圖(geographic map)上

若OSM社群已有可用的開放資料(各捷運站和各線), 當然非常有可能比維基百科的內容和格式更好更完善
這兩種資料都是很好的自力救濟方式, 與台北捷運公司要不要釋出地圖或資料都無關

至於要在做"示意圖"(diagram)方面, 目前維基百科現有的車站條目的template為此

http://zh.wikipedia.org/wiki/Template:Infobox_Station

這template (相當於有格式化的資料metadata)所提供的資料結構, 雖有提供更多
製示意圖以外的資訊, 但示意圖最基本需要的上一站下一站可能沒有, 目前看條目內容,
似乎是利用其他template 如Template:S-inop 來交待上下站資訊。

個人是傾向相信ODbL的資料結構是比較符合製圖(地圖及示意圖)的原始資料,
與其等Wikidata若台灣已有人做出相關示意圖可用的原始資料,
那麼就可以更快做出相關的diagram, 特別是捷運圖看來要考量的東西還不少,

介於不過分失真和具設計感之間找到平衡:

http://www.sciencedirect.com/science?_ob=ArticleURL&_udi=B6WMM-4JP9FWT-1&_user=10&_rdoc=1&_fmt=&_orig=search&_sort=d&view=c&_acct=C000050221&_version=1&_urlVersion=0&_userid=10&md5=9c6746cd06067b008345e8703c192bd4

http://en.usenet.digipedia.org/thread/16985/2765/

http://blog.visual.ly/how-to-design-transit-map-style-graphics/

若真的弄出來, 不管是什麼工具, 這種open data利用diagram

software自動先產生向量格式的基本半成品後再加工設計的

示意圖的技術水準和可再利用性都應該比目前有爭議的

但又低像素的地圖來的高。不過我不知道能幫上什麼, 我能做的

會做的只是網路關係圖(用pajek)產出svg格式檔供人加工, 若

只是快速的堪取代現在的圖, 我可以利用NodeXL做出, 只要是

資料格式是符何 點A-點B-關係 的格式就好....


2013/1/16 deng dongpo <dongp...@gmail.com>:

Han-Teng Liao

unread,
Jan 16, 2013, 5:41:17 AM1/16/13
to odt...@googlegroups.com
Wikidata的能耐的優缺點都在其infobox的template, 另文有述, 這Wikidata不太可能取代世界上任何一個open
data projects, 但是有可能成為半結構資料和結構資料的多方來源中介,

所以(台北捷運)現實來說, 若Dongpo Deng,
Charles等有更多比目前中文維基有的半結構infobox的資料結構和內容更好更適合製示意圖的資料(我猜應該是如此),
那麼資料流應該是這些好的資料往Wikipedia的infobox template 輸出, 及將有的wikidata平台輸出。

不過捷運地圖真的要做的好, 看來不是那麼簡單, 我用的視覺化工具多為網絡分析工具, 和不是open source的GIS (別打我),
實在是我不是專業的製圖者, 只是有需要做簡單製圖的網際網路研究者 (
http://zh.wikipedia.org/wiki/User:Hanteng#.E7.A0.94.E7.A9.B6.E9.81.B8.E5.9C.96
),

現在的台北捷運問題至少有一個wikicommons的示意圖可以用(見前述連結), 若只是要在APP手機上小畫面使用應該是夠用吧。

不過若要利用這機會把開放資料-開放製圖的流程及合作有一個未來可重覆操作的SOP, 個人覺得或許值得花點心力一起做.....


2013/1/16 whisky <whi...@ystaiwan.org>:

Dennis Raylin Chen

unread,
Jan 16, 2013, 8:23:53 AM1/16/13
to odt...@googlegroups.com
Wikidata除了是存一個國家有多少人口,大都會的基本數據外,還是一個reference的儲存處
以後吵南京大屠殺多少人死亡,就在上面吵各方來源數據,而不在百科上吵
或者是我最近遇到的例子,國父紀念館的建築師王大閎到底那一年生的
Wikidata可以存《王大閎作品集》的說法1918,以及《靜默的光 低吟的風 王大閎先生》他兒子的說法1917年 

OSM的話,先前我有把台北捷運的路線雙軌化,先前畫的人地下段只有單軌。我也補了幾個比較熟的車站月台相對道路的位置
2013/1/16 Han-Teng Liao <han...@gmail.com>

charlesc

unread,
Jan 16, 2013, 10:34:11 PM1/16/13
to odt...@googlegroups.com
http://hub.opendata.tw/ 只是一個(empty的)資料倉儲平台,我其實兩手空空,只會把別人抓好的資料放上(若有時間...)

話說,原來 wikidata 跟 dbpedia 有差/差很大,長了見識!!


DBpedia, among many other things, extracts structured data from the infoboxes in Wikipedia, and publishes them in RDF and a few other formats. But it also hosts a community effort to define extractors for the data, that can be used well beyond Wikipedia. It provides a number of services around the extracted data, like DBpedia mobile, a SPARQL endpoint, a faceted browser, a number of mappings to external ontologies, an ontology itself, etc. A lot of research is being done on DBpedia.
 
Wikidata on the other hand will provide a secondary and tertiary database of structured data that everyone can edit. It turns the extraction process of DBpedia on its head: instead of extracting structured data from infoboxes, it will allow infoboxes to be created from structured data. This means that the effort DBpedia puts into extracting the data can be reduced, and the folks in the project can concentrate on the higher-value services and processes, like the browsers, the SPARQL endpoint, discovering mapping and quality issues in the data, etc. DBpedia did and will go well beyond the goals of Wikidata.
 

Charles

Han-Teng Liao

unread,
Jan 16, 2013, 11:41:26 PM1/16/13
to odt...@googlegroups.com
的確,在格式和資料流程上wikidata 和dbpedia 差很大,用戶的差異性也值得參考。

其實台灣不管是開放資料還是雲端產業,在政府端都比較少聽取這樣的民間努力和聲音(不管是國外還是國內的),我指的比較少,是相對於跨國顧問公司及主要台灣本土科技公司的意見,常常是被政府端照單全收而其結果只是維持現狀而沒有民間參與。這樣子直接影響的是電子化政府及產業推動方面的封閉性和保守性,各位可以思考如何介入這樣的惡性循環,使一些(不期望全部)現有的政經資源和媒體關注可以導入各位歷年來在台灣默默做的努力成果和專業經驗心得。

以上說法真的是看到Google被迫投資柏林為基地的數個研究機構,再來也投資Wikidata的政經觀察...期待類似的事能發生在這,而各位的努力可以真的取得各位應得的市場及政府回應及投資。

2013/1/17 charlesc <yeou...@gmail.com>:
Reply all
Reply to author
Forward
0 new messages