Twitterの藤井です。
お返事が遅くなってしまい申し訳ありませんでした。
(昨日無事アメリカに帰って来ました。時差ボケ中です。。。)
> 今回の顛末とコーパスとしてのTweetの利用、配布への嘆願についてまとめれば
> よろしいでしょうか?
はい、コーパスのサイズ、仮定している利用形態や配布方法、どのような
個人情報が含まれているか、等をまとめていただいたものを
弊社Tech Advocateの山本(yus...@twitter.com)と私にまで
送っていただければと思います。
よろしくお願いいたします。
ご参考までに.
私がカルテ文章などを扱うときに使っている方法なのですが,
人名は全て <P> 、数字連続は全て<N>、地名は全て<G>、組織は全て<C>に置き換え,
さらに<P>や<G>や<C>に一貫性のあるダミーの人名などをいれます.こうすることで,まるで生コーパスのように研究利用できるので便利かと思います.
あらまき
2012/3/30 Masao Utiyama <masao....@gmail.com>:
--
あらまき