疾患検査の精度に対する誤解

新型コロナウイルス感染者の発見にPCR検査を導入してから間もないころ、
全数検査をすべきだという意見と、してはいけないという意見の対立があったことはご存じでしょうか。
この記事では、全数検査反対派がどういう根拠をもってして主張していたのかの説明と、
疾患検査のデータの見方について紹介していきます。
本当に感染している人は何人?
全数検査してはいけないと主張する人は、その根拠として「条件付き確率」を用いた陽性者の割合にまつわる話を挙げていました。
以下の問題を考えるとします
ある疫病は国民の1000人に1人が感染しているといわれていて、感染者を検出する検査キットは、感染している人に99%の確率で陽性の結果を出す。
一方で、感染していない人にも2%の確率で陽性の結果が出るとする。Aさんの検査結果が陽性であったとき、Aさんが本当に感染している確率はいくつか
計算は省きますがこの問題の答えは約4.7%となります。
エンジニアらしくシミュレートでも確認してみました。
検査_陽性 | 検査_陰性 | 検査_合計 | |
感染 | 104 | 0 | 104 |
非感染 | 1988 | 97908 | 99896 |
合計 | 2092 | 97908 | 100000 |
求める値は、検査の結果陽性だった人(2092)のうち、本当に感染している人(104)の割合なので、約5.0%。大体あってますね
この結果で注目したいのが、感染してないのに検査の結果陽性となっている人(偽陽性者)が、陽性と判断された2092人のうち1988人と、かなり多くの人が誤った検査結果によって陽性となっていることです。
ここで検査数を10万から100万にしてみましょう
検査_陽性 | 検査_陰性 | 検査_合計 | |
感染 | 988 | 11 | 999 |
非感染 | 19952 | 979049 | 999001 |
合計 | 20940 | 979060 | 1000000 |
比較してわかる通り、検査数を10倍にしたことで偽陽性者も約10倍になってしまいました。
つまり検査数を増やせば増やすほど偽陽性者も増やしてしまい、検査の信頼性を落としてしまうということがわかります。
「全数検査をしてはいけない(するのは危険)」と主張していた人は、このこと述べていたようです。(感染の広がり具合や検査精度をどの程度に設定するかで、シミュレートの結果は大きく変わります。)
疾患検査は意味がない?
シミュレーションの結果を見ると、
「精度の高い検査をしても本当に感染している可能性が5%未満なのなら、検査すること自体意味ないのでは?」と思われてしまいそうですが、それも誤解だと思います。
この結果を悪く感じてしまうのは、比べる対象を間違っていることに起因しています。
今回の例だと、「精度99%の検査なのに、Aさんが本当に感染している確率は4.7%に減少してしまった」と考えてしまいがちですがそれは間違いで、「Aさんが感染している確率はもともと0.1%であったのに、検査で陽性と出たことによって4.7%(47倍)に上昇した」ととらえるのが正しいのです。
皆さんはシミュレートの結果をみて同じ結論に行き着くことはできたでしょうか。
確率はときに人間の直観とはかけ離れている結果を出すことがあり、また捉える人間によって結論が捻じ曲げられ、最悪の場合騙されてしまう可能性がある、というのが感じられたのではないでしょうか。
この記事を見てデータの正しい見方の重要性について気づいていただければと思います。
◆WEB会議/セミナーシステム『Szia』
https://www.ois-yokohama.co.jp/szia/
◆サーバサイドで動作するミドルウェア『ReDois』
https://www.ois-yokohama.co.jp/redois/wp_redois/