Webの自動翻訳はどんな仕組みなんだろう

コンピュータは意味を理解せずに翻訳している

Webには、ある言語を別の言語に翻訳してくれるサービスがあります。試しにある程度長い英語の文章を日本語に翻訳させてみると、完璧ではありませんが大体の意味をつかむことは可能です。ただ、日本語としては意味の通じない表現も見受けられます。コンピュータが自動翻訳しているわけですが、実はコンピュータは日本語の意味を理解して翻訳しているわけではないのです。では、どのように翻訳しているのでしょうか。

大量の対訳情報を覚えさせ、統計的な手法で翻訳

例えば、日本語を英語に翻訳する場合、大量の日本語と英語の対訳情報をコンピュータに記憶させます。その際、文単位で記憶させると同じものが出現する確率が小さいので、なるべく出現する確率が大きい単語の組み合わせをコンピュータが自動的に検出して記憶します。一方で、日本語として自然な言葉の並びも学習させます。これは、Webにある大量の文書を分析して、言葉の並びのルールを検出します。これらには、統計的な手法が用いられます。両者の情報をもとに、日本語を機械的に英語に置き換えているのです。ところが、実際に翻訳する場合は、自然な言葉の並びでない場合もあります。その場合は、いったん自然な日本語に並び直した上で翻訳されています。

構文分析を行って自動翻訳する方法もある

この方法は、「統計的な機械翻訳」と言われます。だいたいの意味をつかみたいという場合は実用的ですが、正確な翻訳ではありません。正確な技術用語が要求される製品のマニュアルなどでは、自動翻訳で昔から行われている別の方法で翻訳されます。文章の構文分析を行った上で、意味を置き換えているのです。
日本語の場合は、主語がなかったり、係り結びが複雑だったりしますが、英語に翻訳する場合は主語を補うなどして、英語の文法上の要素と対応させます。不自然なところは人間が調整します。自動翻訳は目的に応じて、適切な方法を選択することも必要なのです。

※夢ナビ講義は各講師の見解にもとづく講義内容としてご理解ください。

※夢ナビ講義の内容に関するお問い合わせには対応しておりません。

先生情報 / 大学情報

広島市立大学情報科学部知能工学科教授竹澤寿幸先生

興味が湧いてきたら、この学問がオススメ！

情報科学

先生が目指すSDGs

メッセージ

私は「コンピュータが人間の言語を理解すること」に興味があって、音声認識や機械翻訳の研究をしてきました。最近は、スマートフォンでの音声検索やWebページの自動翻訳も可能になっています。しかし、音声認識も機械翻訳も毎日新しい事件が起こるたびに現れる地名や人名をはじめとする新しい単語をどう扱うかなど、課題がまだまだたくさんあります。ぜひ、国語、英語にも興味を持って、さらに数学のような論理的なものの考え方も身につけて、情報科学に興味を持ってほしいと思っています。

広島市立大学に関心を持ったあなたは

広島市立大学は、広島市の都市像である「国際平和文化都市」にふさわしい大学づくりをめざして、1994年に「科学と芸術を軸に世界平和と地域に貢献する国際的な大学」を建学の理念として開学しました。
世界と地域が求める新しい時代の要請に応えるため、「国際、情報、芸術、平和」をキーワードに、特色ある教育研究活動を通じ、学術の振興と感性豊かな創造力、実践力を備えた人材を養成し、教育研究の成果を地域に還元するとともに広く世界に発信しています。