【実施報告】DSCafé「音声情報処理とその応用 -コンピュータと音声/水中で話ができる世界を創る」を4/16に開催しました

2024年4月16日開催のデータサイエンスCaféは、「音声情報処理」をキーワードに、山形大学大学院理工学研究科の小坂哲夫教授と、山形カシオ株式会社の鈴木隆司氏にご講演いただきました。

 小坂先生のご講演では、音声情報処理とAIの関係性の歴史と、先生のご研究内容の紹介。ボイスチェンジャーを使って、より自然な(人間に近い)表現で声質変換にするには、感情表現が重要で、そこには”韻律”がポイントとなること、マルチモーダル対話システムで、AIがより人間らしく対話するには、音声の感情認識や身体表現(ジェスチャ)を考慮することが重要であることなどについて、学生とアバターの掛け合い動画で、ご紹介いただきました。また、文字情報を音声変換する音声合成(text-to-speach)では、感情表現の特徴抽出がポイントとのことでした。ご講演のまとめでは、”音声処理技術は、ディープラーニングの登場で大きく進展し、GPUなどの計算性能の向上、事前学習モデルの登場で分野によっては敷居が低くなったものの、チューニングが必要であり、目的ごとに必要なデータ収集が重要!”とのお話でした。

 鈴木氏のご講演は、水中トランシーバー「Logosease」の開発秘話。開発の根底にあるのは、『世界中どこでも話ができる時代なのに、”水の中では、話をすることができない”という問題を解決したい!』という思い。きかっけは当時10歳でダイビングをはじめたご息女。レジャーダイビングでも手軽に使える水中通話機をつくるにはどうしたらいいか?明瞭な音声に変換するにはどうしたらよいか?という課題に出会います。そこで、小坂先生のご指導下で、会社の同僚とともに数々のプロトタイプを作成し、改良を重ねた日々のご様子や、出来上がってみたら、海猿(レスキューダイバー)やTV出演者に好評だった、というお話を実際の動画とともに、ご紹介いただきました。鈴木氏のご講演で最も印象に残ったのは最後のまとめ。『DXの本質は「新たな価値の創造」。新たな価値を発見(課題の発見)、設計、伝達、実現(必要な人が実際に使う)といったプロセスが重要。そして、データサイエンティストに求められるのは、何のためにやっているのかを理解し、データを採取するところから分析・予測し、その価値を伝えていくということ。』というお話でした。

 講演当日は、会場10名、オンライン25名の総勢35名が参加。また当日参加できなかった方にも、見逃し配信をご覧いただきました。今回のお申込者は見逃し配信を含め70名。YUDS関係者6名も参加しました。当日会場参加は飛入りもOKです。次回は5月14日です!

(写真上段から第1部講演風景と小坂氏、第2部講演風景と鈴木氏)

CATEGORY

TAG

もっと見る

ARCHIVE

Translate »