パラメトリック検定とノンパラメトリック検定

ここでは、統計手法の大きな分類であるパラメトリック検定とノンパラメトリック検定について、できるだけ分かりやすく説明します。

パラメトリック検定は、データが特定の確率分布 (データの出現のしやすさや頻度) に従っていると仮定 (特定の形やパターンに従って分布しているはずだと想定) して行う統計手法です。

パラメトリック検定では、統計解析を行う際に、データがある一定のルールやパターンに従って分布していることを前提とします。たとえば、「このデータが正規分布の形に従っている」といった仮定を置いて解析しますが、正規分布（ベル型のカーブを描く分布）は、平均値を中心に左右対称にデータが広がるような分布です。この仮定に基づくことで、統計的な分析や計算がやりやすくなりますし、検出力も上がりますが、もしデータがその仮定通りでなかった場合、分析結果が正確でなくなるリスクもあります。

データが特定の分布 (多くの場合、正規分布) に従うと仮定します。
平均値や標準偏差などの「パラメータ (母数)」を用いて分析します。
一般に、データが仮定通りの分布に従う場合、ノンパラメトリック検定よりも検出力 (真の差を見つける能力) が高い傾向があります。

t検定: 2つのグループの平均値を比較します。(例: 新薬群と従来薬群の血圧の平均値を比較する)
分散分析 (ANOVA): 3つ以上のグループの平均値を比較します。(例: 3種類の運動療法が患者の歩行距離に与える影響を比較する)
ピアソンの相関係数: 2つの連続変数間の関係の強さを測定します。(例: 年齢と血圧の関係を調べる)

血圧の平均値を2つの治療群で比較する場合 (t検定)
年齢、身長、体重など、連続的な数値データを分析する場合 (分散分析やt検定)

ノンパラメトリック検定は、データの分布に特定の仮定を置かない統計手法です。

データの分布に関する前提条件が少ないです。
データの順位や符号を用いて分析を行います。
サンプルサイズが小さい場合や、データの分布が正規分布から大きく外れている場合に適しています。

マン・ホイットニーのU検定: 2つのグループの順位の差を比較します。(例: 新薬群と従来薬群の痛みスコア (1-10点) を比較する)
Brunner-Munzel検定: 2つのグループの確率優位性を比較します。
- マン・ホイットニーのU検定の代替手法と言えますが、頑健で適用範囲が広く、より有用です。
- 2つのグループの分布が同じ形である必要がありません。
- 順序尺度のデータに適していますが、連続データにも使用できます。
クラスカル・ウォリス検定: 3つ以上のグループの順位の差を比較します。(例: 3種類の治療法が患者の回復度 (軽度・中度・重度) に与える影響を比較する)
スピアマンの順位相関係数: 2つの変数間の単調な関係の強さを測定します。( 例: 患者の満足度と入院日数の関係を調べる)

患者の満足度 (1:不満、2:やや不満、3:普通、4:やや満足、5:満足) を比較する場合
データのサンプルサイズが少ない場合 (例: 珍しい疾患の研究)
データの分布が明らかに正規分布でない場合 (例: 医療費のデータ)
2つのグループの分布が異なる可能性がある場合 (Brunner-Munzel検定)

近年、従来の検定方法よりもさらに信頼性の高い手法が開発されています。これらの手法は、外れ値 (極端に大きいまたは小さい値) や不均一な分散に対してより強固です。

ブートストラップ法:
- 手持ちのデータから何度も再サンプリング (データの再抽出) を行い、推定値の信頼区間を算出します。
- 例: 手術時間のばらつきが大きい場合、平均手術時間の信頼区間を求める。

順列検定:
- データのグループ分けをランダムに入れ替えて、結果の差が偶然かどうかを判断します。
- 例: 新薬と従来薬の効果の差が偶然なのかどうかを判断する。

統計学の発展に伴い、より柔軟で強力な手法が利用可能になっています。

一般化線形モデル (GLM):
- 正規分布以外の確率分布に従うデータも扱えます。
- 例: 患者の生存・死亡 (二値データ) を予測するロジスティック回帰。

混合効果モデル:
- 個人差や時間経過の影響を考慮できるモデルです。
- 例: 同じ患者から繰り返し測定したデータの分析。

データが前提とする分布を満たさない場合、変数変換を行うことで、パラメトリック検定の適用が可能になる場合があります。

変換手法の例:

対数変換: 大きな値の方に裾が長い分布を正規分布に近づけます。
- 使用例: 医療費データの変換
Box-Cox変換: パラメータλを使ってデータの正規性を改善するための変換手法で、正規分布への変換を試みます。Reactivestat では、自動的に最適なパラメータを見つけてデータの歪みを調整します。

注意: 変換後のデータの解釈には注意が必要です。また、変換によってデータの性質が大きく変わる場合は、ノンパラメトリック検定の使用を検討してください。

データの性質を確認する
- データは連続的か、それとも順序づけられたものか？
- サンプルサイズは十分か？ (一般的に30以上が望ましいですが、これは検定方法により異なります)

データの分布を確認する
- ヒストグラムを作成して、データの分布の形を確認します。
- 正規性の検定 (例: シャピロ・ウィルク検定)を行います。ただし、正規性からわずかに外れているだけで、必ずノンパラメトリック手法を使うべきというわけではありません。

適切な検定方法を選択する
- データが仮定通りの分布に従い、サンプルサイズが十分な場合: パラメトリック検定
- データが仮定する分布に従わない、またはサンプルサイズが小さい場合: ノンパラメトリック検定
  - 2つのグループの分布が異なる可能性がある場合: Brunner-Munzel検定を検討
- 分布の仮定が満たされない場合、変数変換を検討します。
- より頑健な手法 (ブートストラップ法など) の使用も検討します。

Shapiro–Wilk検定などの正規性検定の結果だけで、パラメトリックにするかノンパラメトリックにするかを決めるべきではありません。
- サンプルサイズの影響: 大きなサンプルでは、わずかな非正規性でも検出されやすくなります。
- 検定の頑健性: 多くのパラメトリック検定は、軽度の非正規性には強いく、完全な正規性は必ずしも必要ありません。
- 視覚的確認: ヒストグラムやQ-Qプロットで分布を目で見て確認するのも大切です。
- 変数変換の検討: 強い非正規性がある場合、変数変換を試してみるのも良いでしょう。サンプルサイズが大きければ (通常30以上) 多くの場合パラメトリック検定が使えます。
研究の目的や仮説に合わせて適切な手法を選択することが重要です。
統計的に有意な差が見られても、それが臨床的に意味のある差であるかどうかを慎重に検討する必要があります。
複雑なデータ構造や研究デザインの場合、より高度な統計手法 (混合効果モデルなど) の使用を検討してください。
Brunner-Munzel検定のような、より頑健な手法の使用を検討することで、より信頼性の高い結果が得られる可能性があります。

パラメトリック検定とノンパラメトリック検定は、それぞれ異なる特徴と適用場面を持っています。
データの性質や研究の目的を十分に理解し、適切な手法を選択することで、より信頼性の高い研究結果を得ることができます。
実際の統計処理にあたっては、統計の専門家にアドバイスを求めることも重要です。

名義変数の解析

連続変数の解析

統計的モデリング

生存期間の解析

検査の正確度

マッチングによる解析

比率(割合)のサンプルサイズ

平均値のサンプルサイズ

生存曲線のサンプルサイズ

パラメトリック検定とノンパラメトリック検定

はじめに

パラメトリック検定とは

特徴

代表的な統計手法

使用例

ノンパラメトリック検定とは

特徴

代表的な例

使用例

より頑健な統計手法

現代的な統計手法

変数変換

パラメトリック検定とノンパラメトリック検定の選び方

注意点

まとめ