コンピュータで自由自在に人の声を聞いたり作り出せたら……

スマホやパソコンで音声検索をする技術

コンピュータを使って音声の処理をする技術を、「音声情報処理技術」と言います。例えば、スマートフォンに向かって「今日の天気は？」と話しかけると、コンピュータが検索をするなどして、正しい情報を人の声で答えてくれる音声検索機能は、かなり一般的になってきました。
ただ、長い文章や話し言葉をコンピュータが正しくとらえるのは、まだ難しい段階です。なぜなら、話す人になまりがあったり、文法的に違っていたり、滑舌が悪かったりするからです。そこで、その精度をさらに上げていくことが求められています。

より精度の高い認識を実現するためには？

コンピュータは、聞こえてきた人の声をテキストに置き換えることができますが、そのためには膨大な量の人の声のデータが必要となります。そこで活躍するのが、「ニューラルネットワーク」です。これは、脳内でさまざまな情報処理を行う神経細胞の仕組みをシミュレーションし、まねたもので、音声や画像の分野で大きな力を発揮しています。
このニューラルネットワークにデータ処理を行うGPU（グラフィックスプロセッシングユニット）という高性能な演算装置を使って、1000人以上の膨大な人の声のデータを読み込ませます。これによりネットワークの学習ができ、音声認識の精度を上げられるのです。

音声情報処理技術が秘めた可能性

音声情報処理技術が高度になり、さまざまな声を自由に出せるようになると、どんなことが可能になるのでしょうか？例えば、病気や事故で声をなくした人でも、過去に録音した元の声のデータがあれば、元と同じ声を作り出すことができるかもしれません。また、人気アニメの主役の声を、永遠に変えないということも可能になるでしょう。このように音声情報処理技術が進歩すると、さまざまな可能性が広がっているのです。

※夢ナビ講義は各講師の見解にもとづく講義内容としてご理解ください。

※夢ナビ講義の内容に関するお問い合わせには対応しておりません。

先生情報 / 大学情報

山形大学工学部情報・エレクトロニクス学科教授小坂哲夫先生

興味が湧いてきたら、この学問がオススメ！

情報エレクトロニクス学

先生が目指すSDGs

メッセージ

工学部では、人の生活にダイレクトにつながる「ものづくり」ができます。自分の作ったものが、人の役に立ったり、楽しませたりできるので、とてもやりがいがあります。
私の研究室では、「音声とコンピュータ」について研究しています。人間の声とコンピュータでいろいろな処理をして、新しい技術を開発します。例えば、コンピュータにしゃべらせたり、コンピュータが聞いたり、人間の声を違う声に変えたりという研究をする分野です。声や音に興味がある人は、ぜひ一緒に研究しましょう。

先生への質問

先生の学問へのきっかけは？
先輩たちはどんな仕事に携わっているの？

山形大学に関心を持ったあなたは

山形大学は、東日本有数の総合大学であり、４つのキャンパスはネットワークで融合されています。社会のリーダーにふさわしい基本能力と幅広い教養を身につけるため、教養教育に力を入れています。大学運営の基本方針として、一つは、何よりも学生を大切にして、学生が主役となる大学創りをするということ、そしてもう一つは、教育、特に教養教育を充実させるという２点を掲げています。