「ベイズ統計学」を使って不確実性を評価する
代打は誰に?
あなたは今、野球チームの監督として、試合の重要な局面で代打を送ろうとしています。ベンチにいる代打の候補は二人、これまでのキャリアで1000打数300安打のA選手と、10打数4安打のB選手です。打率で決めるなら、4割のB選手です。しかし、10打数しか経験のないB選手の4割は偶然かもしれません。「打率では劣っていても経験のあるA選手を代打に送りたい」と思うなら、あなたはすでに「ベイズ統計学」の考え方をしているといえます。
人間の脳に近い意思決定
ベイズ統計学は、統計学の主要分野の一つです。ある事象が起きることに対する分析者の頭の中にある信念の強さを「事前確率」といいます。ベイズ統計学では実際にデータが観測されると、ベイズの定理と呼ばれる確率法則により事前確率は「事後確率」に更新されます。この事後確率が分析対象の不確実性を表します。
先ほどの代打の例にベイズ統計学を適用してみましょう。メジャーリーグの過去100年ほどのデータから、打率の約95%は2割から3割5分の間にあることがわかります。例えばこれを事前情報として、ベイズの定理を使って事前情報を更新すると、B選手よりもA選手を送る方が成功する確率が高いと推測でき、我々の直感とも一致した結果になります。打率という数字だけでなく、選手のキャリアなども意思決定に利用できることが特徴です。
自動運転から政策決定まで
ベイズ統計学は、機械学習との相性もよく、自動運転や検索エンジンの開発にも使われてきました。また、ビジネスや金融政策における意思決定など、生活に直結するような場面でも活用されています。最近は、COVID-19患者の入院日数が多い地域を高精度で特定できるような方法がベイズ統計学を使って開発されました。これは、感染拡大を防ぐために政策を施す必要のある地域の特定を行うのに有用です。一方でベイズ統計学の課題は、大規模データに対して事後確率の計算を高速にかつ高精度で行う方法の開発にあり、これからも挑戦が続いていきます。
※夢ナビ講義は各講師の見解にもとづく講義内容としてご理解ください。
※夢ナビ講義の内容に関するお問い合わせには対応しておりません。