テキストマイニングで分析 文系でも活用できるデータサイエンス

テキストマイニングで分析 文系でも活用できるデータサイエンス

データサイエンスでは「人の言葉」も分析対象

今の社会では、人間の活動のあらゆる場面でIT技術が使われています。そこに蓄積された膨大なデータ(ビッグデータ)を、数学、統計学やプログラミングなどの知識を組み合わせてコンピュータで分析することで、新しい事実を発見できるようになりました。その分析技術を研究するのが「データサイエンス」という分野です
データサイエンスは数学など理系の知識が重要と思われがちですが、基本的な理論さえ学べば、文系の力を発揮できる分野です。特に、データサイエンスの中でも自然言語を扱う「テキストマイニング」は、言葉を分析することでビジネスや研究に生かせます。

膨大なレビューをゲーム作りに生かす

例えば「面白いゲームを作ろう」というとき、プログラミング以前に、どんなゲームが人気なのかを調べたり企画したりする市場調査やプランニングというプロセスが大切です。そこで、既存のゲームのプラットフォームに書き込まれたユーザーのレビューを分析すると、ユーザーが何を面白いと感じているかがわかってきます。
レビューの文章を一つ一つ読んでいくには時間がかかりますし、全体像を把握できません。そこで、テキストマイニングの技術を使うと、膨大なレビューのデータの中で、どんな言葉が多く使われているか、どんな言葉同士がセットで使われているかなどを、グラフや図で確認できます。そのゲームがユーザーにどう受け止められているかがひと目で分かるのです。

データの裏付けを持つ研究・調査ができる

データサイエンスでは、膨大なデータをどう分析したら求める答えが得られるかというアイデアが重要です。その発想力は理系・文系は関係ありません。
また、データサイエンスで得られた分析結果は、前述の例で言えば、レビューを読んだ「感想」ではなく、数値で表すことのできる客観的なデータとして説得力を持ちます。その点で、人文科学の研究や市場調査などでも、データサイエンスが有効なツールになると言えます。

※夢ナビ講義は各講師の見解にもとづく講義内容としてご理解ください。

※夢ナビ講義の内容に関するお問い合わせには対応しておりません。

先生情報 / 大学情報

東京情報大学 総合情報学部 総合情報学科 データサイエンス学系 准教授 藤原 丈史 先生

東京情報大学 総合情報学部 総合情報学科 データサイエンス学系 准教授 藤原 丈史 先生

興味が湧いてきたら、この学問がオススメ!

統計科学、数理情報学

メッセージ

「データサイエンス」はプログラミング、数学・統計学の知識が柱です。そう説明すると、「数学は苦手」と敬遠する人も多いかもしれませんが、私は文系の人にこそデータサイエンスを学んでほしいと思っています。基本的な理論を理解すれば、あとはデータをどう組み合わせて、自分の仮説を検証していけばいいかという発想力が大事で、実務の上では難しい数式を使うこともあまりありません。文系の人も自分の研究や仕事で力を発揮できるツールとして、データサイエンスを活用してほしいです。

東京情報大学に関心を持ったあなたは

東京情報大学は1988年の創立以来「情報を活かして新しい未来を切り拓く人材育成」を建学の精神に教育・研究を行ってきました。2027年4月、総合情報学部は進化します。3学系10コース制を軸に、1年次に基礎を学び2年次から専門を選択できる柔軟なカリキュラムを導入。アントレプレナーシップを育み、未来を共創する力を磨きます。看護学部では「看護×情報」を掲げ、確かな技術と高度な情報リテラシーを兼備。ICTを駆使し、高度情報化社会の医療現場を支え、自立して学び続ける看護師を養成します。