『源氏物語』の作者は一人だけ? データサイエンスで文学の謎に迫る

『源氏物語』の作者の謎
紫式部によって書かれた『源氏物語』ですが、室町時代から「実は作者は複数いたのではないか」と考えられてきました。特に「宇治十帖」と呼ばれる最後の10巻分は、別人が書いたのではないかといわれています。ただし歴史的な証拠はありません。そこでデータサイエンスの手法を使い、『源氏物語』の文体から作者を推定しようと研究が始まりました。
データ分析で作者を推定
研究のため、『源氏物語』に含まれる約36万語がデータ化されました。各単語には品詞や活用形の情報を付与し、どの単語がどれくらい登場するかが分析されました。特に注目されたのは助詞や助動詞といった、物語の内容に依存しない単語です。これは書き手の癖が表れやすい単語で、急に傾向を変えるのは難しいことがわかっています。分析の結果、『源氏物語』は宇治十帖も含めて助詞や助動詞の傾向が大きく変化しませんでした。少なくとも文体においては、複数の人物によって書かれた証拠は見つからなかったといえます。
文体から執筆時期を分析
『源氏物語』にはまだまだ謎が多いです。例えば今の巻のナンバリング通りに執筆されたわけではない、という説があります。ただし執筆順が明確にわかる資料がないため、研究は困難です。もし文体をもとに作品の執筆時期を推定できれば、『源氏物語』の研究に新しい見解や知見を報告できるかもしれません。これを可能にするためにも、まずは発表年がはっきりとわかっている小説を使って、いつ書かれたのかを文体から推定するモデルの構築が始まりました。
モデルには作者の癖が出やすい、会話以外の地の文のみを使います。まず夏目漱石の小説でモデルが試作された結果、文末に出てくる単語が手がかりになることがわかりました。夏目漱石の場合、地の文の文末が「~た」で終わるものが徐々に増えていたのです。そのため「~た」の出現頻度を見れば執筆時期を推定できます。モデルをさらに改良して、『源氏物語』の執筆順を明らかにしようと研究が続いています。
※夢ナビ講義は各講師の見解にもとづく講義内容としてご理解ください。
※夢ナビ講義の内容に関するお問い合わせには対応しておりません。
先生情報 / 大学情報

お茶の水女子大学共創工学部 文化情報工学科 准教授土山 玄 先生
興味が湧いてきたら、この学問がオススメ!
統計学、文化情報学、人文社会情報先生が目指すSDGs
先生への質問
- 先生の学問へのきっかけは?