JTPA ギークサロン　戸上真人氏と「音源分離と確率統計モデル」について語る

3 views

Skip to first unread message

Jin YAMANAKA

unread,

Jul 22, 2022, 3:59:31 AM7/22/22

to jtpa...@jtpa.org

8月のギークサロンでは、20年以上に渡って音声処理技術の研究開発に従事され、現在はパロアルト市のAmazon Web Services (AWS)にて Principal Applied Scientisを務められている戸上真人氏をお招きします。

戸上氏は2017年～2018年にスタンフォード大学にVisiting Scholarとして所属された後、Line株式会社に入社されAI開発室室長を務められています。これまでに登録特許が20件以上、査読あり国際会議での採択論文数が60件以上、また各種の受賞歴をお持ちであり音声認識・音源分離分野での第一人者として活躍されています。

近年ではスマートスピーカーやスマホによる音声アシスタント、リアルタイム翻訳や文字起こし、リモート会議システムでの話者認識など様々な場面で音声認識・音声処理が使われていますが、これらは各種の信号処理技術やDNNを用いたAIによる音声認識・処理技術の飛躍的な発展によるものと言えると思います。例えばカクテルパーティーのような様々な人が話すザワザワとした環境でも人間は聞きたい人の声を聞き取ることができ、これは「カクテルパーティー効果」と呼ばれていますが、雑音などがある中でも聞きたい人の声のみを分離する音源分離技術の技術進化が進んでいます。

本講演では、この音源分離技術の中でも特に複数のマイクロホンを用いた技術開発の歴史を、戸上氏が執筆された「Pythonで学ぶ音源分離」の内容に準じた形で概要をお話し頂きます。特に、数学的に何故音源分離問題が解けるのか不思議な部分がありますが、そのエッセンスを簡略的にご解説頂く予定です。

また、音源分離と確率統計モデルに基づく信号処理技術の関係性はとても強く、戸上氏は確率統計モデルを用いた信号処理を他分野で応用する際にも参考となる要素があると考えられています。加えて深層学習（Deep Learning)を音源分離に応用する際の一つの考え方である、音源分離と確率統計モデルの統合的な学習法について、戸上氏のこれまでの研究内容を中心にお話しを伺います。

■ アジェンダ
・音声認識、音声処理、音響処理など関連分野での最近の動向
・「カクテルパーティー効果」：音源分離技術とは？
・音源分離と確率統計モデルの統合的な学習法

■ プログラム
2022年 8月 12日 (金) 7:00PM – 9:00PM
7:00PM 開場／ネットワーキング、7:30PM より戸上氏のスピーチ開始

本サロンはSunnyvale Plug & Play Tech Centerとの共催になります。会場は Sunnyvale Plug & Play Tech Center (440 N Wolfe Rd, Sunnyvale, CA 94085) です。申し込みは下記のmeetupページにて。

https://www.meetup.com/jtpa-japanese-technology-professionals-association/events/287135199/

参加費は$8。当日は軽食が提供されます。学生の参加費は無料になりますので現地にて支払時にその旨お知らせ下さい。

■スピーカー：
戸上真人（とがみ　まさひと）氏
[ linkedin: https://www.linkedin.com/in/masahito-togami-08b20635/ ]
[ Google Scholar: https://scholar.google.com/citations?user=bJaH7JMAAAAJ&hl=en&oi=ao ]

略歴：
2002年　東京大学工学系研究科航空宇宙工学専攻修士課程修了
2003年　日立製作所中央研究所入社
2011年　東京大学工学系研究科航空宇宙工学専攻博士後期課程修了。博士（工学）
2017年　Stanford Data Science Initiative Visiting Scholar
2018年　LINE株式会社入社　AI開発室室長
2019年　社団法人人工知能学会　理事
2021年　Amazon Web Services (AWS)入社　Principal Applied Scientist
IEEE Senior Member、人工知能学会全国大会優秀発表賞、テレコムシステム技術賞、日本音響学会独創研究奨励賞板倉記念、粟屋潔学術奨励賞などを受賞。

著書:
『Pythonで学ぶ音源分離機械学習実践シリーズ』インプレス出版

https://www.amazon.co.jp/dp/4295009849

戸上氏による解説記事：

「深層学習を用いて音源を分離する」LINE Research Labsが研究成果を解説

https://logmi.jp/tech/articles/321579

「レストラン予約」から「議事録」まで. LINEのAI技術が使われている場所

https://logmi.jp/tech/articles/324672

音声認識・音声合成・環境音の研究……　音声処理はますますおもしろくなっていく　ここまで来た音声技術

https://logmi.jp/tech/articles/323674

「テキストの自動生成」で広がる超巨大言語モデルの可能性　LINEのAIが実現するイノベーション
https://logmi.jp/tech/articles/324867

趣味：空手です！

野望：日本の経済低迷、少子高齢化、日本がどんどん暗くなっているのが気になっています。シリコンバレーと日本とを行き来しながら、日本を元気にするようなネタを、じっくりと考えていきたいなと思っています！

-----
※ 当日は、会場で軽食のご用意がございます。
※ ご参加はCOVID-19 ワクチン接種済（ブースターショットまで）の方に限定させて頂きます。会場にてワクチン接種済み証明を確認させて頂きますので、ご協力下さい。

-----

JTPA

Jin Yamanaka

Reply all

Reply to author

Forward

0 new messages

JTPA ギークサロン 戸上真人氏と「音源分離と確率統計モデル」について語る

Jin YAMANAKA

JTPA ギークサロン　戸上真人氏と「音源分離と確率統計モデル」について語る