[ご相談] WordPress の翻訳への WEB 翻訳への使用について

123 views
Skip to first unread message

Odyssey

unread,
Oct 18, 2017, 9:44:54 AM10/18/17
to wp-j...@googlegroups.com
おつかれさまです。おでっせいです。
WordPress 翻訳ルールについてちょっとご相談です。

WordPress の翻訳への WEB 翻訳への使用について、明確なルールは定めていなかった、と思うのですが、ぼくの記憶は正しいでしょうか ? (汗

というのも、プラグインの翻訳承認を行っていた所、Google 翻訳結果をそのまま使用している疑いがあるものが見つかったからです。

1つ目※最後の一文以外は全く同じ


2つ目※一字一句同一


上記の翻訳に対しては、ルール違反(英単語の前後スペース)や、翻訳そのものの質の悪さなどでリジェクトは可能ですが、
そもそもの 「WordPress の翻訳への WEB 翻訳への使用について」についてはルールがなかったように思いました。

今年の始め、Ubuntu 翻訳に Google 翻訳結果をそのまま突っ込む事件がありましたので、
あまりよろしくない感は醸成されていたのかなと思いましたが、
一方で WordPress ではかつて、GlotPress に「Translation from Google」リンクがあったりもしました。
(リンクがなくなった経緯を Trac で追ってみましたが、プラグインになったから消えただけ ?

Google 翻訳のライセンスについては白に近いグレーではないか、という見解もあるようですが、

・個人的にはライセンスについて明言していないものはリスクを孕む
・そのまま突っ込まれると質の悪い翻訳提案が増えて手間

という2点から、
「Google 翻訳結果をそのまま使った提案はしない」
的なルールを作ったほうが良いのでは、と思っています。

ご意見お聞かせください。

nukaga junko

unread,
Oct 20, 2017, 12:01:28 PM10/20/17
to wp-j...@googlegroups.com
こんばんは。
おでさん、問題提起ありがとうございます。

Google翻訳、なかなか悩ましいですね。

GlotPress に「Translation from Google」リンクがあったというのを知らなくて、Makeで情報を追ってみたのですが

Andrew Nacin
December 18, 2011
https://make.wordpress.org/polyglots/2011/12/18/translate-from-google-did-it-get/

Birgit Olzem
November 27, 2014
https://make.wordpress.org/polyglots/2014/11/26/discussion-using-translation-tools-with-glotpress/

ライセンスよりも品質の話が主なように見えました。(2014年の時のSlackの情報は全部追えてはいません)

私が気になったことは以下になります。
・機械翻訳の使用はGoogle翻訳だけではない
・今後Google翻訳の精度がもっと上がって品質が良くなるかもしれない
・短い言葉の場合Google翻訳と自分の翻訳が一致する場合がある


ちなみにGoogle翻訳の日本語に対してのライセンスは
https://translate.google.co.jp/about/intl/ja_ALL/license.html
Japanese Wordnet にある(なる?)ようです。
http://compling.hss.ntu.edu.sg/wnja/
Wordnet のソフトウェア・データベースのライセンスは BSD という記述を Wikipedia で見つけたのですが WordNet のサイトではBSDという文字に行き着くことはできませんでした。
https://ja.wikipedia.org/wiki/WordNet

またBSDライセンスだったとしても「翻訳された言葉」へのライセンスも同様になるのでしょうかね。
すみません。あまり自信がないです。

上記の点を踏まえて
・機械翻訳を使用する場合はライセンスの確認を促す(これで結構ハードルが上がる気がする)
・機械翻訳をそのまま入力するのは推奨されませんというような注意を入れる
ぐらいの「ルール」より少し緩い感じの方が受け入れられやすいかな、と思いました。

ぜひ、この件、他の方の意見もお聞きしたいです。
翻訳の質をあげられるように私も頑張ろうと改めて思う問題提起でした!

 nukaga junko | 額賀順子

Naoko Takano

unread,
Oct 21, 2017, 4:35:54 AM10/21/17
to wp-ja-pkg
どうもです。

自分でも Chrome の Google 翻訳拡張や Poedit の翻訳提案(「事前翻訳」)を使って、文面そのままを採用することがあります。
特に、原文がしっかりしている…と言うか、訳しやすいものや単語のみの場合、かなり精度が高い翻訳が返されることがありますし、入力補助ツール的な位置付けでもあるかなと。

こういった翻訳の入力補助ツールを使うことを禁止するわけではなくて、精査していない翻訳を突っ込むのをやめてもらうということには賛成です。
なので、
「Google 翻訳結果をそのまま使った提案はしない」
ではなく
「機械翻訳の結果を精査せずに使った提案はしない」
というルールでしたら、いいと思います。

さらに踏み込んで、
「精査が行われていないと見受けられる場合、レビュワーが提案を一括リジェクトする場合があります。もう一度、きちんとチェックを行った上で翻訳提案を行ってください。」
などと足してもいいと思います。
たまにOKなものが紛れていたりしますが、レビュワーがそれを見つけ出したり間違いを直すリソースがもったいないと感じるので…

> ちなみにGoogle翻訳の日本語に対してのライセンスは
> https://translate.google.co.jp/about/intl/ja_ALL/license.html
> Japanese Wordnet にある(なる?)ようです。

WordNet のライセンスは、Google 翻訳の成果物に対してのライセンスではなくて、Google
翻訳が採用している意味辞書のライセンスという位置づけではないかな?と思います。
ちなみにライセンスとしてリンクされている
http://www.casta-net.jp/~kuribayashi/multi/wns/jpn/LICENSE が404ですねw

成果物については、機械的にそのまま使っているわけではなくて一度レビュワーが見ているというのもあって、著作権やライセンス的にどうなるんでしょう。
Google Translate API を使う場合は帰属表示が必須のようですが、この場合とは異なりますよね。

https://cloud.google.com/translate/attribution#translation_results

こういうのもありました。
https://ja.wikipedia.org/wiki/機械翻訳#.E8.91.97.E4.BD.9C.E6.A8.A9

> 著作権の保護を受けるのは独創的な著作物のみであり、機械翻訳には創作性がないため、機械翻訳の結果には著作権の保護を受ける権利が与えられないと主張する学者もいる[7]。問題となっている著作権は二次的著作物(英: derivative work)についてである。原語で執筆された原著作物(英: original work)の著者[訳注 1]は作品が翻訳されたときに権利を失うことはなく、翻訳者は翻訳物を出版するには許可を得なければならない。

---
Nao

---
Naoko Takano
http://naoko.blog/
> --
> --
> WordPress 日本語版作成チーム
> http://groups.google.com/group/wp-ja-pkg?hl=ja
> http://ja.wordpress.org/about-wp-ja/
>
> ---
> このメールは Google グループのグループ「WordPress 日本語版作成チーム」に登録しているユーザーに送られています。
> このグループから退会し、グループからのメールの配信を停止するには wp-ja-pkg+...@googlegroups.com
> にメールを送信してください。
> その他のオプションについては https://groups.google.com/d/optout にアクセスしてください。

Odyssey

unread,
Oct 28, 2017, 9:58:50 AM10/28/17
to wp-j...@googlegroups.com
額賀さん、Nao さん、返信ありがとうございました。
なかなか時間が取れず、少し空いてしまいました。

とりいそぎ Google 翻訳についてですが…
WordNet のライセンスは、Google 翻訳の成果物に対してのライセンスではなくて、Google
翻訳が採用している意味辞書のライセンスという位置づけではないかな?と思います。
ちなみにライセンスとしてリンクされている
http://www.casta-net.jp/~kuribayashi/multi/wns/jpn/LICENSE が404ですねw
機械翻訳には、翻訳エンジンとコーパスが必要で、
WordNet は後者のコーパスに近いものです。
言葉同士の関係性を定義しています。

ライセンスは↓に移っていますね。
ライセンス体系のどれ、とは書かれてないですけど、自由度は高いライセンスですね。

一方の翻訳エンジンは、Google 自体のもので、ライセンスや利用規約が見つかりませんでした。
(Google 利用規約そのものなのかな? https://www.google.com/intl/ja/policies/terms/

なお、Excite 翻訳は第6条で NG を出してます(OSS への翻訳貢献は、私的範囲ではないと思います)。

 
> 著作権の保護を受けるのは独創的な著作物のみであり、機械翻訳には創作性がないため、機械翻訳の結果には著作権の保護を受ける権利が与えられないと主張する学者もいる[7]。問題となっている著作権は二次的著作物(英: derivative work)についてである。原語で執筆された原著作物(英: original work)の著者[訳注 1]は作品が翻訳されたときに権利を失うことはなく、翻訳者は翻訳物を出版するには許可を得なければならない。
機械翻訳の創作性を否定し、機械翻訳の提供者の著作権を認めない、という考えはよく聞きます(ただ、国内の判例はなかったはず…)が、機械翻訳の提供者が、たとえば私的範囲を超える場合(ビジネスなど)に利用する際には利用料を徴収しているケースでは本来得られる利益が得られなくなる(逸失利益といいます)ため、不法行為が生じる可能性があります。
ということで、そもそもあんまり筋のいい話ではないと思ってます。
(Ubuntu に機械翻訳が突っ込まれた事件は、Google 翻訳だったようですが、結局全部リジェクトしたようです… http://blog.goo.ne.jp/ikunya/e/37e5a52e10ab26fcbd4f7ff867e9eace

今回使われていたのが Google 翻訳でしたので、Google 翻訳寄りで書いてしまいましたが、
どれは OK で、どれは NG というのは扱いづらいルールだと思いますので、
(そんなのを Translate Editor が調べる時間がもったいない)
機械翻訳全般について、ということにしたいと思っています。

 
あたりに、一つ項目を立てたいと思っています。
Nao さんに修正いただいたものを活かしながら、一方で翻訳は GlotPress に限らないことから

--------------
WordPress の翻訳における機械翻訳(Web 翻訳を含む)の使用について
・機械翻訳の結果を精査せずに使った翻訳および翻訳の提案はしないでください。
・精査が行われていないと承認者が判断した場合、提案を一括リジェクトする場合があります。
 もう一度、きちんとチェックを行った上で翻訳提案を行ってください。
--------------
(太字が変更部分)
いかがでしょうか。

同じことをこっちにも書いたほうがいいかな…。↓


> このグループから退会し、グループからのメールの配信を停止するには wp-ja-pkg+unsubscribe@googlegroups.com

> にメールを送信してください。
> その他のオプションについては https://groups.google.com/d/optout にアクセスしてください。

このメールは Google グループのグループ「WordPress 日本語版作成チーム」の登録者に送られています。
このグループから退会し、グループからのメールの配信を停止するには wp-ja-pkg+unsubscribe@googlegroups.com にメールを送信してください。
その他のオプションについては、https://groups.google.com/d/optout にアクセスしてください。

michiko takekoshi

unread,
Oct 28, 2017, 8:48:24 PM10/28/17
to wp-j...@googlegroups.com
お疲れさまです。
私もUbuntuの件の後調べたり気を揉んでいた1人です。
これまで、コントリビューターデーなどで伝えていた範囲では、
「機械翻訳の訳は直接使わない(コピペはNG)、推敲して自分の言葉に直して入力する」
という説明をしてました。一部、コピペはライセンス的にNGなのでリジェクトor修正するよ、という指摘を
WordSlack上でしたこともあります。
おでさんの提案するCodexへの内容に賛成です。

その一方で、国際的に統一した見解があるのか気になっています。
日本だけでこうなっても仕方ない気がしていまして…
Ubuntuの件はgoogle翻訳以外の機械翻訳も混ざった自動翻訳を製造して翻訳していたことが起因しており、
poeditの機械翻訳機能に使われているエンジンが何か、気になっています。
基本、WordPressは、PTE・GTEが精査してリジェクトしていますし、それで大義名分が通っていると思いますが、
プラグイン作者にPTEを渡したら、機械翻訳をコミットされた場合は、GPLライセンス的にはどうでしょう?
そこら辺はルールの徹底ができてないと怖い部分ではあります。
(Ubuntuは同意にチェックしたら通った/ほぼ1人だったとかだったはず)



2017年10月28日 22:58 Odyssey <odyss...@gmail.com>:



--
======>
      mic...@gmail.com
  Takekoshi, Michiko (竹腰倫子)
Reply all
Reply to author
Forward
0 new messages