Webの自動翻訳はどんな仕組みなんだろう
コンピュータは意味を理解せずに翻訳している
Webには、ある言語を別の言語に翻訳してくれるサービスがあります。試しにある程度長い英語の文章を日本語に翻訳させてみると、完璧ではありませんが大体の意味をつかむことは可能です。ただ、日本語としては意味の通じない表現も見受けられます。コンピュータが自動翻訳しているわけですが、実はコンピュータは日本語の意味を理解して翻訳しているわけではないのです。では、どのように翻訳しているのでしょうか。
大量の対訳情報を覚えさせ、統計的な手法で翻訳
例えば、日本語を英語に翻訳する場合、大量の日本語と英語の対訳情報をコンピュータに記憶させます。その際、文単位で記憶させると同じものが出現する確率が小さいので、なるべく出現する確率が大きい単語の組み合わせをコンピュータが自動的に検出して記憶します。一方で、日本語として自然な言葉の並びも学習させます。これは、Webにある大量の文書を分析して、言葉の並びのルールを検出します。これらには、統計的な手法が用いられます。両者の情報をもとに、日本語を機械的に英語に置き換えているのです。ところが、実際に翻訳する場合は、自然な言葉の並びでない場合もあります。その場合は、いったん自然な日本語に並び直した上で翻訳されています。
構文分析を行って自動翻訳する方法もある
この方法は、「統計的な機械翻訳」と言われます。だいたいの意味をつかみたいという場合は実用的ですが、正確な翻訳ではありません。正確な技術用語が要求される製品のマニュアルなどでは、自動翻訳で昔から行われている別の方法で翻訳されます。文章の構文分析を行った上で、意味を置き換えているのです。
日本語の場合は、主語がなかったり、係り結びが複雑だったりしますが、英語に翻訳する場合は主語を補うなどして、英語の文法上の要素と対応させます。不自然なところは人間が調整します。自動翻訳は目的に応じて、適切な方法を選択することも必要なのです。
※夢ナビ講義は各講師の見解にもとづく講義内容としてご理解ください。
※夢ナビ講義の内容に関するお問い合わせには対応しておりません。