Pythonで学ぶ! ベイズ統計 第2回
ベイズの定理と利用例
ベイズの定理
前回の条件付確率は下記になる
これを変形すると下記になる
さらに、この2つは同時確率で同じくになるので、下記が成り立つ
これをベイズの定理と呼ぶ
さらに、今後、関係してくるのは、下記の変形を施したものになる
利用例
よく例として出るのが、病気の陽性・陰性の検査である
- 一般的に、病気の確率が0.1%である病気
- 検査で、病気に罹患している場合は、99%の人が陽性になる
- 検査で、病気に罹患してない場合も、3%の人が陽性になる
この検査で陽性だった場合に、その人が罹患している確率を求める
: 罹患している
: 罹患していない
: 検査で陽性
: 検査で陰性
とすると、
求めるのは、「"陽性"の場合に"罹患している"」なので、
を求める
から
となる
表で表す
10万人いるとすると、
罹患しいる人は、0.1% -> 100人
罹患していない人は、99,900人
100 | 99,900 | 100,000 |
罹患していて、陽性になるのは、99% -> 99人
罹患していなくて、陽性になるのは、3% -> 2,997人
99 | 2,997 | 3096 | |
100 | 99,900 | 1000,000 |
この表から、陽性者3096人のうち、罹患している人は99人となり、
3.2%程度になる
99%の検査精度の高さから、陽性=罹患と思ってしまうが、
そもそもの罹患率の低さと、擬陽性率が3%であることから、陽性者のほとんどは擬陽性であると考えられる
参考文献
この記事は以下の書籍を参考にしましたが、
私の拙い知識で書いておりますので、誤り等ありましたらご指摘ください