「キャラの声」を科学する　音声合成の新領域

声の雰囲気を自在に操る

音声合成技術は、単に人間らしい声を再現するだけではありません。特に日本では、アニメやゲームのキャラクターボイスとして利用するために、「泣きそうに聞こえる声」や「お姉さん風の語り」などの「発話スタイル」ごとの音声の需要があります。こうした声のスタイルは、聞けばすぐに違いがわかっても、音の高さや抑揚などの数値で表しにくく、科学的に分析するのは難しいとされています。それでも、声とキャラクターの組み合わせが作品の印象を左右することから、声のスタイルをどう分類し、どう設計するかが重要な研究テーマとなっています。

オープンなデータセット

発話の音声を合成するためには、元となる音声データが必要です。これを用意するためには、十分な文章データを集めて、それを声優が読んで「音声データセット」をつくらなければなりません。これ自体、大変な作業ですが、さらに文章の著作権と声優の声の権利に適切に対応することも必要です。これを個々の開発者やクリエイターが行うのは現実的ではありません。
そこで、誰もが自由に使えるように権利処理を行った「文章データセット」が作成され、パブリックドメインで公開されました。さらに、声優の声をどこまで利用してよいのかを明確にした契約を交わし、さまざまな発話スタイルで収録された音声データを公開する仕組みも整えられています。著作権などの権利を丁寧に整理した上でデータを公開することにより、開発者やクリエイターが安心して利用できる環境が実現されているのです。

さらなる普及へ

どのような発話スタイルが人気を集めるかは、予測が困難です。公開当初は人気がなかったスタイルが、動画などで使われて初めて評価されることもあります。そのため、複数の発話スタイルを収録して、実際にどれが支持されるかを見ながら改良が進められています。また、声優、開発者、クリエイターそれぞれが持続的に活動できるよう、音声の利用に応じた報酬の仕組みづくりも研究されています。

※夢ナビ講義は各講師の見解にもとづく講義内容としてご理解ください。

※夢ナビ講義の内容に関するお問い合わせには対応しておりません。

先生情報 / 大学情報

明治大学総合数理学部先端メディアサイエンス学科教授森勢将雅先生

研究室

興味が湧いてきたら、この学問がオススメ！

音声情報処理、感性情報学、認知科学

先生が目指すSDGs

メッセージ

生成AIの進化により、近い将来、音声も自由に生成できる時代が訪れるでしょう。新しい技術には無限の可能性がありますが、使い方を誤れば特定の人を傷つけたり、権利を侵害したりする恐れもあります。特に音声は個人のアイデンティティと深く結びついているため、その取り扱いには十分な注意が必要です。こうした音声生成技術を、誰かを傷つけるためではなく、みんなが幸せになれるような形で活用してほしいです。技術を正しく理解し、倫理的に使うことで、明るい未来を切り開いていってください。

先生への質問

先生の学問へのきっかけは？
先輩たちはどんな仕事に携わっているの？

明治大学に関心を持ったあなたは

明治大学は、10学部28学科で「個」を強くする大学です。みなさんの知への好奇心に応える学びが、きっとこの中にあります。
トライするチャンスは3つ。
①学部別入試、②全学部統一入試、③大学入学共通テスト利用入試。
入学後のキャンパスライフを経済面からサポートする奨学金制度も16種類を用意しており、約3万人の学生のうち、1万人以上が利用しています。就職キャリア支援も、4年生向けに学内採用選考会・面接会を実施しています。
ぜひ「メイジ」に入学し、「個」を強くしてみませんか。