テキストマイニングで分析 文系でも活用できるデータサイエンス
データサイエンスでは「人の言葉」も分析対象
今の社会では、人間の活動のあらゆる場面でIT技術が使われています。そこに蓄積された膨大なデータ(ビッグデータ)を、数学、統計学やプログラミングなどの知識を組み合わせてコンピュータで分析することで、新しい事実を発見できるようになりました。その分析技術を研究するのが「データサイエンス」という分野です
データサイエンスは数学など理系の知識が重要と思われがちですが、基本的な理論さえ学べば、文系の力を発揮できる分野です。特に、データサイエンスの中でも自然言語を扱う「テキストマイニング」は、言葉を分析することでビジネスや研究に生かせます。
膨大なレビューをゲーム作りに生かす
例えば「面白いゲームを作ろう」というとき、プログラミング以前に、どんなゲームが人気なのかを調べたり企画したりする市場調査やプランニングというプロセスが大切です。そこで、既存のゲームのプラットフォームに書き込まれたユーザーのレビューを分析すると、ユーザーが何を面白いと感じているかがわかってきます。
レビューの文章を一つ一つ読んでいくには時間がかかりますし、全体像を把握できません。そこで、テキストマイニングの技術を使うと、膨大なレビューのデータの中で、どんな言葉が多く使われているか、どんな言葉同士がセットで使われているかなどを、グラフや図で確認できます。そのゲームがユーザーにどう受け止められているかがひと目で分かるのです。
データの裏付けを持つ研究・調査ができる
データサイエンスでは、膨大なデータをどう分析したら求める答えが得られるかというアイデアが重要です。その発想力は理系・文系は関係ありません。
また、データサイエンスで得られた分析結果は、前述の例で言えば、レビューを読んだ「感想」ではなく、数値で表すことのできる客観的なデータとして説得力を持ちます。その点で、人文科学の研究や市場調査などでも、データサイエンスが有効なツールになると言えます。
※夢ナビ講義は各講師の見解にもとづく講義内容としてご理解ください。
※夢ナビ講義の内容に関するお問い合わせには対応しておりません。