維基文庫 古文分割JavaScript程式編寫請求

19 views
Skip to first unread message

mr w

unread,
Sep 26, 2014, 1:08:31 AM9/26/14
to zh_wikipedia

維基文庫有不少古文內容是從簡體版自動轉換來的。現在維基文庫的內容多數沒有掃描版,不方便編者通過比較原版對照正誤。而不少古文的掃描版可以從高等学校中英文图书数字化国际合作计划下載到。如果可以將轉換過的沒有校對的文字放入page名字空間,則可以方便感興趣的讀者校對。(已校對過的示例見夜航船/卷15。)即使是OCR現代文本依然會有錯誤出現,轉換過的沒有校對的文字的正確率應該超過現代文本的OCR結果,所以我認為這麼做沒有問題。

因此,我希望有一個JavaScript程式,可以切割並保存頁面。過程如下:

  1. 編者打開page頁面(如Page:Ye Hang Chuan part 10.djvu/2);
  2. 點擊按鈕彈出文本框,編者將整卷內容複製到文本框中;
  3. 編者根據右邊圖片顯示掃描頁的最後一個字,點擊文本框中的字,分割出此頁文本;
  4. 程式將分割出的文本保存到相應的page頁面,在文本框中刪除這一頁的字;
  5. 加載下一張圖片,重新開始這個過程。

本人曾嘗試編寫,但由於編程水平太差,只好放棄。如果有編者會JavaScript程式並且認同以上的做法,希望可以編寫。

shi zhao

unread,
Sep 26, 2014, 1:32:27 AM9/26/14
to zh_wik...@googlegroups.com
没明白。

另外示例页面看到,为何要重新标点?
Chinese wikipedia: http://zh.wikipedia.org/
My blog: http://shizhao.org
twitter: https://twitter.com/shizhao

[[zh:User:Shizhao]]
> --
> --
> 維基百科 - 人人可編輯的自由百科
> 通 過 郵 件 和 新 聞 組 發 言 ﹙發 言 請 用 純 文 本﹚ :
> zh_wikipedia ﹙AT﹚ googlegroups ﹙DOT﹚ com
> news://news.gmane.org/gmane.org.user-groups.wikipedia.chinese
> 維 基 百 科 群 組 瀏 覽 訂 閱 與 取 消 :
> ﹙ 新 ﹚ httpS://groups.google.com/forum/#forum/zh_wikipedia
> httpS://groups.google.com/group/zh_wikipedia/subscribe
> httpS://groups.google.com/group/zh_wikipedia/boxsubscribe
> ---
> 這是 Google 網上論壇針對「zh.wikipedia」群組發送的訂閱通知郵件。
> 如要取消訂閱這個群組並停止接收來自這個群組的郵件,請傳送電子郵件到 zh_wikipedia...@googlegroups.com
> 如要在這個群組張貼留言,請傳送電子郵件到 zh_wik...@googlegroups.com
> 請前往以下網址造訪這個群組:http://groups.google.com/group/zh_wikipedia
> 如要在網路上查看這項討論,請造訪
> https://groups.google.com/d/msgid/zh_wikipedia/CABzpjfe4q%2B84omoa03ZCouwQuu9%2B7Y75OTfbnjHCJYEuTgs3_w%40mail.gmail.com
> 如需更多選項,請前往:https://groups.google.com/d/optout

h

unread,
Sep 26, 2014, 6:33:09 AM9/26/14
to zh_wik...@googlegroups.com
建議去IEG申請經費,若你知道如何雇用一位懂程式/編程的能手

你的描述如Shizhao所言,不是很清楚,我猜是不是批次校對處理界面,並標示已校對或未校對內容?

建議看一下Commons的批次上傳界面,修改一下成為你想要的界面,如此他人比較能瞭解你要的功能長什麼樣。



您已訂閱「Google 網上論壇」的「zh.wikipedia」群組,因此我們特別傳送這封郵件通知您。
如要取消訂閱這個群組並停止接收來自這個群組的郵件,請傳送電子郵件到 zh_wikipedia...@googlegroups.com
如要在此群組張貼留言,請傳送電子郵件至 zh_wik...@googlegroups.com
請前往以下網址造訪這個群組:http://groups.google.com/group/zh_wikipedia
如要在網路上查看這項討論,請造訪 https://groups.google.com/d/msgid/zh_wikipedia/CAG9jPxyTTkXRYhSy4dQVOaTzT97U8k7ipd%2BLraK-WNxzQU6rQQ%40mail.gmail.com
如需更多選項,請前往:https://groups.google.com/d/optout

mr w

unread,
Sep 26, 2014, 10:02:59 AM9/26/14
to zh_wikipedia
标点是复制的文字版带来的。用page页面校对的部分是文字。当然如果标点有错也可以更改。

您已訂閱「Google 網上論壇」的「zh.wikipedia」群組,因此我們特別傳送這封郵件通知您。
如要取消訂閱這個群組並停止接收來自這個群組的郵件,請傳送電子郵件到 zh_wikipedia...@googlegroups.com
如要在此群組張貼留言,請傳送電子郵件至 zh_wik...@googlegroups.com
請前往以下網址造訪這個群組:http://groups.google.com/group/zh_wikipedia

mr w

unread,
Sep 26, 2014, 10:12:55 AM9/26/14
to zh_wikipedia
过几天放假做。

Liang-chih Shang Kuan

unread,
Sep 26, 2014, 8:45:09 PM9/26/14
to zh_wik...@googlegroups.com
可以把編程的介面截圖先模擬出來,這樣更容易讓大家理解
在網路上有很多paper prototyping 的資料,建議你用類似的設計概念先把流程具象化
大家可以更快理解與提供建議
如果有需要翻譯上的協助或其他幫忙,也歡迎隨時提出

加油!

上官

小花喵

unread,
Sep 27, 2014, 10:58:17 AM9/27/14
to zh_wik...@googlegroups.com
文库中很多条目的格式太过于混乱了,不知是否能有个机器人可以用于文库条目的格式化自动操作呢。
 


~盛开如夏莲,美丽动人~
~شکوفه مانند لوتوس تابستان، زیبا~
Me.Sina 
小花(Jyu..)谨上

mr w

unread,
Sep 27, 2014, 11:05:45 AM9/27/14
to zh_wikipedia
解释在这个pdf里面,感谢各位查看。

如果还有没说明白的欢迎继续询问。
2014-09-27 8:45 GMT+08:00 Liang-chih Shang Kuan <shang...@gmail.com>:
detail.pdf

mr w

unread,
Oct 25, 2014, 9:03:53 AM10/25/14
to zh_wikipedia

Leo Way

unread,
Oct 26, 2014, 1:31:14 AM10/26/14
to zh_wik...@googlegroups.com
好久不见
关于 捐款使用的,有没有朋友英语好的 做个翻译。
https://meta.wikimedia.org/wiki/Special:MyLanguage/Grants:APG/Proposals/Community/Review
大家好去投票。

--
--
維基百科 - 人人可編輯的自由百科
通 過 郵 件 和 新 聞 組 發 言 ﹙發 言 請 用 純 文 本﹚ :
zh_wikipedia ﹙AT﹚ googlegroups ﹙DOT﹚ com
news://news.gmane.org/gmane.org.user-groups.wikipedia.chinese
維 基 百 科 群 組 瀏 覽 訂 閱 與 取 消 :
﹙ 新 ﹚ httpS://groups.google.com/forum/#forum/zh_wikipedia
httpS://groups.google.com/group/zh_wikipedia/subscribe
httpS://groups.google.com/group/zh_wikipedia/boxsubscribe
---
這是 Google 網上論壇針對「zh.wikipedia」群組發送的訂閱通知郵件。
如要取消訂閱這個群組並停止接收來自這個群組的郵件,請傳送電子郵件到 zh_wikipedia...@googlegroups.com
如要在這個群組張貼留言,請傳送電子郵件到 zh_wik...@googlegroups.com
請前往以下網址造訪這個群組:http://groups.google.com/group/zh_wikipedia
Reply all
Reply to author
Forward
0 new messages