Student-t検定の前に行う正規性の検定・不等分散性の検定の必要性について考えてみたよ

てん＠統計屋さんです

2群間の平均値が異なるかを確率的に評価する有意差検定として、Student-t検定というものがありますね。

おそらく、統計学的有意差検定を習ったことのある方は、Student-t検定を例として習ったのではないでしょうか？

avatar

てん

t検定そのものの解説ではないので、そちらはWikipedia先生にお問い合わせください

教科書的には「Student-t検定は2群が等分散の正規分布に従うことを前提としている」と記載されています。

2つの比較したい群が【等分散】であり【正規分布である】この2つが手法の前提であるため、Wikipedia先生にも

t検定を始める前に
実務的なデータ分析では、母集団が様々な前提を満たしているかどうかを調べるため、以下のような検定をt検定の前段階に行う場合がある。

・標本が正規分布に従うかどうかは、コルモゴロフ-スミルノフ検定やシャピロ-ウィルク検定などの正規性検定によって判断することもできる。
・標本の分散が等しいかどうかは、F検定、ルベーン検定、バートレット検定などにより判断する方法がある。

という記載があります。

“場合がある“この言葉は、統計の専門ではない研究者にとって非常に判断に困る言葉だと思います。

そやで、論文作成時になって頭抱えるんや

avatar

くまひろ

そこで、この”場合がある”について、私なりのスタンスを紹介したいと思います。

※あくまでイチ実務家の判断基準です、すべての研究分野で普遍的な考え方である保証はできません。それでも誰かの参考になれば幸いです。

この記事の目次

正規性の検定は使うか
不等分散性の検定は使うか
- Studentのt検定の前処理としては使いません
まとめ
おまけ：アイキャッチ画像がなぜ黒ビールなのか？

正規性の検定は使うか

使いません

以前の↓記事↓でも書きましたが、基本的に実務上で合うデータで「これは正規分布してるなぁ」なんてものはありません。

データをてんから見てみよう

正規分布するデータ？そんなものないよ

https://www.ten-kara-data.com/where_is_normaldist

てん@統計屋さんです入門的な統計の教科書でちょいちょい見かけるフレーズがありますね。「世の中には正規分布するものが多い」あれ、正確じゃないです。タイトルにある「正規分布するものなんか無い！」を証明するのは悪魔の証明になってしまいますので無理ですし、若干言い過ぎの自覚があります。でも少なくとも「世の中には正規分布するものが多い」には否定的です。では、どう言えば正確だと考えているか、紹介させてください。正規分布するものなんてないじゃないかええ、統計を教科書で勉強してた頃は思ってましたよ、「世の中に...

検定というのは、その差がどんなにわずかでも、データを積み上げれば有意であると判定します。『統計的に有意な違い』と『意思決定に重要な違い』と必ずしも一致しません。

ですので、どんなに見た目正規分布に従っていそうに見えるデータも、数百、数千、数万とデータを集めるうちに、必ず、必ず、正規性の検定は有意の判定になります。

avatar

てん

言い過ぎの嫌いはありますが、この際言い切ってしまいます

なので、正規性の検定は私は絶対に使いません。

avatar

てん

正規性の検定は私は絶対に使いません

大切なことなので二度言いました

avatar

くまひろ

代替として考えうること

では、正規性は全く検討しないかというと、そんな事はありません。

歪度　と　尖度

のどちらかは必ず、ほとんどの場合で両方を確認しています。データの全変数に対してです。（リンクはWikipedia先生です）

チェックポイント、何らかの対処が必要と考える目安も紹介します。

ヒストグラム

こちらで最も重視するのは、分布が”単峰”になっているかです。ヒストグラムが二峰性や多峰性になっている場合は、パラメトリックな解析は危険信号と考えます。二峰性なら必ずというわけではないですが、ノンパラメトリック手法を適用したり、閾値を決めてカテゴリ化したデータに置き換えたりします。

単峰性だの二峰性だの言われてもイメージ湧かんな

avatar

くまひろ

avatar

てん

画像で紹介しておきますね。

単峰

二峰

って、山のイラストかい！！！

avatar

くまひろ

歪度

歪度というのは、概ね分布の非対称性を表した指標です。正規分布は左右対称な分布なので、当然歪度は0になります。この値が絶対値で大きい分布ほど分布は非対称ということになります。あくまで私の目安ですが、

-2～2：特に気にせず正規性問題無しとして進めます

-4～-2, 2～4：変数変換を検討し始めます、ただし変数変換によって尺度上解釈が難しくなることが多いので悩ましいです

～-4, 4～：できる限り変数変換の適用を行います。変数変換が尺度上も解釈しやすいケースが増えてきます

変数変換の候補には、対数変換や、指数変換、累乗変換、累乗根変換あたりが好みです。Box-Cox変換は・・・変換後の尺度が解釈できないので最終手段です。

avatar

てん

というかBox-Coxは使ったことないな

尖度

読んで字のごとく、分布が如何に”尖っているか？”という指標です。

尖っている

尖ってない

わかりやすい！（わかりやすいったらわかりやすいんだよ）

avatar

くまひろ

正規分布の尖度は3です。しかし、尖度には定義が2種類あり、正規分布の尖度が0になるよう-3する定義も存在します。私は特に断らない限りは正規分布の尖度が0になる方の定義を用います。

尖度は”尖り”の指標と言いましたが、画像の三角コーンでも台座部分があるように、”分布の裾の広さ”＝”外れ値の出やすさ”の指標という側面も持ちます。もっと言えばそちらの意味でしかこの指標を見ていません。歪度が高いというのは、データに外れ値が含まれている、ということの証拠ですので基本的には”外れ値の有無のスクリーニング”という使い方になります。こちらの目安としては

-∞～1：無視何もしません

1～3：歪度やヒストグラムも同時に見てみて、特に気になることがなければ何もしません

3～：ヒストグラムを確認します。外れ値に該当しそうなデータの取扱を検討します。

avatar

てん

外れ値の扱いは過去に記載しています

データをてんから見てみよう

外れ値への対処法を考えてみたよ

https://www.ten-kara-data.com/how-to-outlier

てん＠統計屋さんです以前の↓ネタ記事↓にたどり着いた方の検索ワードで、ひときわ目立ったものがあります。外れ値の除外立ち上げたばかりのこのサイトにたどり着いた方のかなりの比率が、上記に関連しそうなワードでお越しになっております。いったいどのような研究分野の方がたどり着いたのかわかりませんが、データを取得して解析を自身で行っているような研究者や学生の皆さんの中には、外れ値に頭を悩ませている方が多くいるのでしょうかね？以前のネタ記事では外れ値を闇雲に外すなんてとんでもない！ということだけを述べさせて...

不等分散性の検定は使うか

Studentのt検定の前処理としては使いません

結論は正規性の検定と一緒ですが理由は全く異なります。

そもそも・・・

avatar

てん

分散が違うなら同一分布じゃないじゃん！！！

心からの叫びです

avatar

くまひろ

Studentのt検定は、等分散でない場合にα errorが増大する傾向がありますが、私はあまり気にしないです。だって”等分散でない”という事自体が分布の不一致の証左ですから。

分散が違うのは知っているのだけど、平均値の差が知りたいんだ！ということであれば、端から等分散を仮定しないWelchのt検定で解析を計画してもいいと思います。確かに、等分散のもとではStudentのt検定より若干検出力は劣るかもしれませんが、運用そのものはシンプルです。

ちなみに『分散が群間で異なる場合にはノンパラの検定を使う』という手順が紹介されているケースがありますが、私は全く賛同できません。ノンパラの検定（多くはWilcoxon検定）は確かに正規分布を仮定しなくてもいいですが”分布型は等しい”という条件はついています。”分布型が等しい”というのは”分散も等しい”という状況でもあります。なので、分散が異なるならWilcoxon検定の前提も満たせていません。

一方で、節題で条件をつけたように等分散性の検定そのものは使うことがあり得ます。それは、「群間で分散が違うか？」という仮説そのものに興味がある場合です。この場合は等分散性の検定の利用も十分ありえます。ただし、等分散性の検定を用いるモチベーションは多くの場合、分散が異ならないことを期待するケースです。検定は差があることを確認するツールではあっても、差がないことを確認するツールではありません。よって、「等分散性の検定で有意ではなかったので、等分散と確認できた！」というような誤りをしないように注意が必要です。

まとめ

今回のまとめは簡単です。「Student-t検定は2群が等分散の正規分布に従うことを前提としている」に対して、私は正規性の検定も、等分散性の検定も使いません。

さて、この記事は、当サイトに

正規分布群と非正規分布群を比較することは可能か

という検索ワードで飛んできた方がいたために書き始めました。なので、この質問への回答も記載します。

avatar

てん

片方の群が正規分布で、もう片方の群が非正規分布なら、そもそも同一分布じゃないじゃん！！！

avatar

てん

分布型も違うから、ノンパラのWilcoxon検定の前提も満たしてないじゃん！！！

それでも、強いて平均値の差を証明したいなら、非正規分布な群で有ることが明らかである以上、Wilcoxon検定を適用するのが現実的な対応になるかなと思います。

どのようなデータに苦しんでいるのか、ぜひ教えてください

もっといい回答ができると思います

avatar

くまひろ

でわでわ

おまけ：アイキャッチ画像がなぜ黒ビールなのか？

avatar

てん

Studentのt検定を発表したWilliam Sealy Gossetはギネスビール社の社員だったんですよね～

Student-t検定の前に行う正規性の検定・不等分散性の検定の必要性について考えてみたよ

正規性の検定は使うか

使いません

代替として考えうること

ヒストグラム

歪度 と 尖度

ヒストグラム

歪度

-2～2：特に気にせず正規性問題無しとして進めます

-4～-2, 2～4：変数変換を検討し始めます、ただし変数変換によって尺度上解釈が難しくなることが多いので悩ましいです

～-4, 4～：できる限り変数変換の適用を行います。変数変換が尺度上も解釈しやすいケースが増えてきます

尖度

-∞～1：無視何もしません

1～3：歪度やヒストグラムも同時に見てみて、特に気になることがなければ何もしません

3～：ヒストグラムを確認します。外れ値に該当しそうなデータの取扱を検討します。

不等分散性の検定は使うか

Studentのt検定の前処理としては使いません

まとめ

おまけ：アイキャッチ画像がなぜ黒ビールなのか？

歪度　と　尖度