テキストマイニングで分析 文系でも活用できるデータサイエンス

テキストマイニングで分析 文系でも活用できるデータサイエンス

データサイエンスでは「人の言葉」も分析対象

今の社会では、人間の活動のあらゆる場面でIT技術が使われています。そこに蓄積された膨大なデータ(ビッグデータ)を、数学、統計学やプログラミングなどの知識を組み合わせてコンピュータで分析することで、新しい事実を発見できるようになりました。その分析技術を研究するのが「データサイエンス」という分野です
データサイエンスは数学など理系の知識が重要と思われがちですが、基本的な理論さえ学べば、文系の力を発揮できる分野です。特に、データサイエンスの中でも自然言語を扱う「テキストマイニング」は、言葉を分析することでビジネスや研究に生かせます。

膨大なレビューをゲーム作りに生かす

例えば「面白いゲームを作ろう」というとき、プログラミング以前に、どんなゲームが人気なのかを調べたり企画したりする市場調査やプランニングというプロセスが大切です。そこで、既存のゲームのプラットフォームに書き込まれたユーザーのレビューを分析すると、ユーザーが何を面白いと感じているかがわかってきます。
レビューの文章を一つ一つ読んでいくには時間がかかりますし、全体像を把握できません。そこで、テキストマイニングの技術を使うと、膨大なレビューのデータの中で、どんな言葉が多く使われているか、どんな言葉同士がセットで使われているかなどを、グラフや図で確認できます。そのゲームがユーザーにどう受け止められているかがひと目で分かるのです。

データの裏付けを持つ研究・調査ができる

データサイエンスでは、膨大なデータをどう分析したら求める答えが得られるかというアイデアが重要です。その発想力は理系・文系は関係ありません。
また、データサイエンスで得られた分析結果は、前述の例で言えば、レビューを読んだ「感想」ではなく、数値で表すことのできる客観的なデータとして説得力を持ちます。その点で、人文科学の研究や市場調査などでも、データサイエンスが有効なツールになると言えます。

※夢ナビ講義は各講師の見解にもとづく講義内容としてご理解ください。

※夢ナビ講義の内容に関するお問い合わせには対応しておりません。

先生情報 / 大学情報

東京情報大学 総合情報学部 総合情報学科 データサイエンス学系 准教授 藤原 丈史 先生

東京情報大学 総合情報学部 総合情報学科 データサイエンス学系 准教授 藤原 丈史 先生

興味が湧いてきたら、この学問がオススメ!

統計科学、数理情報学

メッセージ

「データサイエンス」はプログラミング、数学・統計学の知識が柱です。そう説明すると、「数学は苦手」と敬遠する人も多いかもしれませんが、私は文系の人にこそデータサイエンスを学んでほしいと思っています。基本的な理論を理解すれば、あとはデータをどう組み合わせて、自分の仮説を検証していけばいいかという発想力が大事で、実務の上では難しい数式を使うこともあまりありません。文系の人も自分の研究や仕事で力を発揮できるツールとして、データサイエンスを活用してほしいです。

東京情報大学に関心を持ったあなたは

東京情報大学は、1988年の創立以来「情報を活かして新しい未来を切り拓く人材育成」を建学の精神に、常に次代の先端を見据えた教育・研究をおこなってきました。
総合情報学部では、「情報システム学系」「データサイエンス学系」「情報メディア学系」の3学系体制で、データサイエンス、人工知能などの研究教育を強化し、次代のニーズに応える専門性を身につけた学生を育てます。
また、2017年に開設した看護学部では、ICTを有効に活用し情報リテラシーを備えた、地域医療に貢献する「たくましい看護師」を育成しています。