臨床研究の進め方―応用編Ⅰ― 【Ⅰ-1 症例数設定の意味(χ二乗検定を使って)】

症例数設定の意味については,基礎編でも少しだけ触れました.もう一度基礎編のその部分を読み直してみてください.基礎編の要点を簡単に述べると,

  • p値はn数に大きく依存する 母集団から,たくさんの標本をとってくればくるほど,言いたいことが言えてしまいます.症例数設定するということは,研究者はこのくらいの比率であれば臨床医として意味があると思うと宣言することです.
  • 効果量はn数に無関係である 効果量という概念を簡単に説明し,症例数に無関係であるといいました.臨床医が,その効果量が臨床上有意だと思えば,それを示すことのできるn数を集めてきます.これを症例数設定といいます.それで,有意性を示すことができなければ,臨床医が有意だと思った効果量はなかったということになります.

 ここで重要なことは,主体となるのは統計家ではなく臨床医であるということです.効果量をどこに設定するかは統計家にはできません.最も重要なのは臨床家の臨床的経験であり,次に重要なのは文献的知識です.

 

 仮に,症例数が非常に大きくて,意に反して(想定した効果量よりずっと小さい効果量なのに)有意差が出た時にはどうすればよいでしょうか? 本来は研究計画の時点の症例数設定が間違っているのですが,一例として,論文には以下のように書くべきだと思います.「この2群間には統計学的に有意差が出ました.しかし2群の平均値は○○と□□であり,この差は臨床上意味があるとは思えませんでした.このような結果となった理由は症例数が非常に多かったからです.」と.自分はある論文(1)の中でこのような書き方をしました.下の図は,ある疾患の治療薬AとBについての有効性を評価したものです.本来は“有効”を測定できるようにしなくてはいけませんが,ここでは省略です.p=0.002ですから統計的にはB薬はA薬より有効でしたが,臨床医としてはとてもそうは言えません.一般的には十分な症例数を確保する必要に迫られることが多いですが,こういうことが起こることもあり,適切な症例数を設定しなくてはいけません.

f:id:uhomme:20200505120926j:plain

χ二乗検定(症例数が多すぎる)

 

下の図を見てください.効果量をしっかり理解していただくために3つの表を出しましたが,3つの表は全て同じ効果量(χ二乗検定の場合,効果量はφ係数)です.佐藤先生は左上の比率ならB薬がA薬より有効であると考えてよいだろうと臨床医として考えています.しかし症例数設定を左下図のように設定してしまったために,本来佐藤先生が意図した効果量だったのに統計的に有意であることを示せませんでした.右上の症例数を選べばよかったわけです.

 

f:id:uhomme:20200505121055j:plain

χ二乗検定とφ係数(1)


 

下の図の右側についてはφ係数が異なります,予め.左上は,佐藤先生が実際にやった症例数です.どのくらいの症例数があったらよかったのでしょうか.少なくとも左下であれば統計的に有意でした.逆に実際にやった症例数で統計的に有意であることを示すには右上の比率(効果量)でなくてはなりませんでした.左下は症例数は400例でした.ここで,症例数設定計算ソフトであるG*powerを使って計算してみると,症例数は776例必要であることになりました.400例と776例とでは大きく違いますが何故でしょうか?

 

f:id:uhomme:20200505121417j:plain

χ二乗検定とφ係数(2)



 

これを説明しようと考えて,次の図を示します.本来は臨床医が知りたい真実があります.真実があるのは母集団の中です.我々が臨床研究をするときには母集団から標本を引っ張ってきます.そこから母集団を推測しようというわけです.例えば右上が母集団(真実)とします.正当にバランスよく標本を抽出できると左下になりなり,B薬の有効性を示すことができました.ところが母集団が右上とは違って,もう少しB薬が非優位だったとします.しかし左下の結果となったとします.誤ってB薬が優位と判断することになり,これをα誤差といいます.次に母集団が右上と同等か,さらにB薬が優位だった時に,左下のようにB薬優位と評価できる可能性を検出力(1-β)といい,1からβ誤差を引いたものです.β誤差は“B薬が優位”が真実なのに,それを示せない確率です.1つ下の図はα誤差,β誤差を説明するためによく使われる図です.参考にしてください.

 

f:id:uhomme:20200505121522j:plain

χ二乗検定(α誤差とβ誤差)



f:id:uhomme:20200505121625j:plain

検定力(検出力)とβ誤差



 

大雑把に言うと,下図の通りα誤差は結果に利用され,β誤差は計画に利用されます.α誤差は,その研究の結果が間違っている確率がαということです.β誤差は0.2を使われることが多いですが,母集団は臨床医の仮説通りでB薬が優位であるのに,今回の研究計画では20%の確率でその真実を示すことができないということです.今回の研究を無駄にはしたくないですよね.つまり研究の安全弁を80%としたということで,宣言でもあります.つまり,「B薬はA薬より本当に優位であるならば,確率高く証明したい」という気持ちがβ誤差であり,そのために400例と776例の差ができます.それでも2割は証明することができないし,しかも少し小さい効果でも証明されるかもしれないということになります.しかし,臨床研究で臨床医が尊重される部分であることが分かっていただけたと思うし,そこに臨床医としてのプライドを持たないといけません.

 

f:id:uhomme:20200505121729j:plain

結果;α誤差と計画;β誤差

 

 

引用論文

  1. Uemura O, Yokoyama H, Ishikura K, Gotoh Y, Sato H, Sugiyama H, et al. Performance in adolescents of the two Japanese serum creatinine based estimatedglomerular filtration rate equations, for adults and paediatric patients: A study of the Japan Renal Biopsy Registry and Japan Kidney Disease Registry from 2007 to 2013. Nephrology (Carlton, Vic). 2017;22(6):494-7

     

    腎臓病小児のマネジメント 改訂第2版 実践のための数学的アプローチ (臨床クリップ)
     

     

     

     

    .