声を聞き分けるAIの新たな可能性

子どもとのやり取りに混乱
ある公共施設が、AIを活用した音声案内システムを設置したところ、大人にはほとんど使われず、使うのは子どもたちばかりでした。大人向けに設計されたシステムは子どもの声をうまく認識できず、まともに機能しません。また、子どもたちに「バカ」と怒鳴られても、それを想定していないシステムは的外れな返答を繰り返し、どんどん混乱していきました。こういった事例から、「声からユーザーが子どもかどうかを判断し、相手に合った応答をする」必要性が強く認識されるようになりました。
声から年齢層を判別する
そこで取り組まれているのが、声から話者の年齢層を推定するAIの研究です。声だけで正確な年齢を当てることは難しいものの、幼稚園、小学校低・中・高学年といった「学校区分」であれば、一定の精度で判別できるようになりました。これにより、例えば子どもにはわかりやすい言葉で案内を行い、大人には簡潔に情報を提示するなど、相手に合わせた応答が可能になります。さらに、音声だけでなく画像などの情報と組み合わせることで、より適切な対応を実現する研究も進んでいます。
身近な場面で広がる用途
音に関するAIは、コミュニケーションを豊かにする用途がさまざまに広がっています。例えば、会話中の笑い声を検出して場の盛り上がりを可視化する技術や、環境音を「カタカタ」「チクタク」といった擬音語に変換して映画の字幕制作に役立てる研究があります。また、物理的な衝撃の有無と種類を音で検知する技術は、ロボットへの応用が期待されています。ほかにも、わずかな音声からその人らしい声を再現したり、文章の内容に合わせて音楽を自動生成したりといった試みも行われています。
これらに共通するのは、用途は必ずしも大規模ではなく、身近な場面で人の感覚に寄り添うという使い方です。人がどのような状況でどのように感じるのかに注目することで、AIを単なる便利な道具から、コミュニケーションを支える存在へと進化させていけるのです。
※夢ナビ講義は各講師の見解にもとづく講義内容としてご理解ください。
※夢ナビ講義の内容に関するお問い合わせには対応しておりません。
先生情報 / 大学情報

先生が目指すSDGs
先生への質問
- 先生の学問へのきっかけは?
- 先輩たちはどんな仕事に携わっているの?
![選択:[SDGsアイコン目標9]](https://telemail.jp/shingaku/requestren/img/data/SDGs-9-active.png )
![選択:[SDGsアイコン目標10]](https://telemail.jp/shingaku/requestren/img/data/SDGs-10-active.png )
