2-8 統計的分析法の使い方

明治大学情報コミュニケーション学部教授
メタ超心理学研究室 石川 幹人

 ここでは,ESPカードを使った実験に即して,統計的分析法を概説し,その意義と注意点について述べる。より詳細な統計的分析法に関しては,他の統計の参考書を参照されたい。超心理学の話題に沿った入門的な参考書としては,筆者が執筆した次の本がある。

 石川幹人著『サイコロとEXCELで体感する統計解析』(共立出版)

<1> 仮説検定

 PSIの存在を実験により統計的に証明するには,実験中に「PSIが発揮されている」という主張が,実験結果からいかに強く支持されて「PSIは発揮されてない」という従来の説を打ち負かすか,にかかっている。これは「仮説検定」と呼ばれる統計的分析手順で行なえる。仮説検定では,従来説に基づく具体的な仮説「PSIは発揮されてないので,ESPカードが当たったとしても,それは単なる偶然に過ぎない」(帰無仮説)を設定し,それに対して主張したい仮設「ESPカードが当たったのは,PSIの発揮による必然であった」(対立仮説)を対立させる。前者の(帰無)仮説を統計的な検討によって「ありえない」と棄却し(無に帰する),その代替として主張する(対立)仮説を認めさせるカラクリとなっている。
 そのカラクリでは,帰無仮説が正しいとして理論的に計算すると,実験結果が起きる確率は極めて小さい,そんな「めったに起きない」ことが起きたと考えるよりも,帰無仮説が誤りであると考えて対立仮説を受け入れたほうがよい,と論理展開される。帰無仮説が捨てられたら,必ず所望の対立仮説が受け入れられるように,実験はデザインされてなければならない。帰無仮説は捨てられたものの,「ESPカードが当たったのは表が透けて見えていたからだ」などと,別な対立仮説が浮上してきては実験は失敗である。

<2> p値の計算

 帰無仮説が正しいとしたときの,実験結果が起きる確率はp値と呼ばれ,統計的な計算が必要である。一般には難しい数学を必要とするのだが,ESPカードの場合の計算は比較的簡単である。まず理論的なバラつきの度合いである「標準偏差」を求める。当たりかハズレかの二者択一の実験であると(二項分布に従うので)特別の公式があり,当たりの確率×ハズレの確率×試行回数を計算した値の平方根である。今,ESPカードの実験を100試行したとすると,0.2×0.8×100のルートをとって,4になる。これは,100試行のうちの当たりの期待数(理論的に期待される平均)は20枚であるが,4枚ぐらいのバラつきは普通に起きる(16〜24枚になることが7割くらいある)ことを示している。
 標準偏差が求まったら,Z値(古くは「臨界比」や「CR」とも呼ばれた)を計算する。実際に当たった数から当たりの期待数を引いて標準偏差で割ればよい。たとえば,28個当たった場合は,(28-20)/4でZ=2となる。少し考えると分かるが,当たった数が期待数に一致するとZ=0,標準偏差分だけ大きいとZ=1,逆に小さいとZ=-1となる(これらの値にそれぞれ50,60,40を対応させたのが「偏差値」であり,Z値の仲間である)。Z値からp値を求めるのは,難しい積分(標準正規確率分布の累積)を計算しなければならないが,下の表から概算できる。28個当たった場合は,Z=2であるから,P=0.025である。ただし,この計算は(二項分布の正規分布による)近似であるので,試行回数が100以上で十分大きいときにしか使えない。

Z値とp値の対応表
Z値 p値
0.00 0.500000000
0.25 0.401293726
0.50 0.308537533
0.75 0.226627280
1.00 0.158655260
1.25 0.105649839
1.50 0.066807229
1.75 0.040059114
2.00 0.022750062
2.25 0.012224433
2.50 0.006209680
2.75 0.002979819
3.00 0.001349967
3.25 0.000577086
3.50 0.000232673
3.75 0.000088445
4.00 0.000031686
4.25 0.000010696
4.50 0.000003401
4.75 0.000001018
5.00 0.000000287
5.25 0.000000076
5.50 0.000000019
5.75 0.000000004
6.00 0.000000001

 表にはZ値がプラスの場合しかないが,マイナスの場合は期待数未満しか当たってないのだから,p値を算出するまでもなく,対立仮説は支持されてないことが分かる。

<3> 有意水準との比較

 繰返すと,p値は,帰無仮説が正しいとした場合に,今注目している実験結果(あるいはそれ以上の驚くべきこと)が得られる確率である。すなわち,28個以上当たるようなことは,0.023(2.3%)の確率でしか起きない,と理論計算されたわけである。
 次に,この確率が十分小さいかが検定される。十分小さければ,帰無仮説は,この実験結果を説明するのに不十分で,捨てられるべきものと見なされる。ここでの基準は,p値が有意水準よりも小さいことである。有意水準は普通5%であり,それより小さければ「p値が有意である」(または該当の対立仮説が有意である)と言い,帰無仮説が棄却されて対立仮説が受容される。
 p値が有意水準より小さくないときは「有意でない」と言い,帰無仮説は捨てられない。これは帰無仮説が正しいことを必ずしも意味しない。この実験の範囲では(データが少なくて)どちらとも言えないという場合も含むからである。この背後には,帰無仮説は従来の定説であり,十分な証拠がない限りはそちらの説が受け入れられる(タイプ1エラーの最小化)という考え方がある。

<4> 両側検定

 ESPにはワザとミスするという傾向(4-1)をもつ人がいる。その場合も考慮すると,期待数よりもかなり少なく当てた結果もPSIの発揮だと考えられる。こうした仮定に立つ場合は,最初の仮説をあらかじめ,「PSIは発揮されてないので,ESPカードが当たってもハズレても,それは単なる偶然に過ぎない」(帰無仮説)と「ESPカードがたくさん当たるかたくさんハズレるのは,PSIの発揮によるためだ」(対立仮説)のように設定しておく(実験が終わった後で仮説を変えてはならない)。そして,Z値が大きくても小さくても有意になるかどうかの判定ができるとする。このように,Z値がプラスの場合とマイナスの場合の両方で検定する仮説検定を,「両側検定」という。それに対して,Z値がプラスの場合だけ(あるいはマイナスの場合だけ)を検定する仮説検定を「片側検定」という。
 両側検定のp値(両側p値)を求めるには,単に先の表のp値を2倍すればよい。マイナスのZ値に対応するp値も,プラスにした(絶対値をとった)Z値に対応する欄のp値の2倍の値である。このp値を有意水準と比較するのである。例をあげれば,100試行中28枚当てるのも,12枚しか当てないのも,同じp値で0.046であり,かろうじて5%未満になる。28枚以上か,12枚以下の場合にのみ有意になる。先の片側検定では,27枚(Z=1.75)でもすでに有意であったが,両側検定になると有意ではない。このように,対立仮説によって実験結果が有意かどうかが違ってくるので,注意を要する。

<5> 試行数と独立性

 ESPカードの場合,平均して20%が偶然に当たることになる。ESP能力のある人が,偶然平均(期待値)よりも5ポイント多く,25%当てられるとする。その場合,100試行しかしないと,25枚の当たり数で(上の議論にあるように)有意でないが,400試行するとZ=2.5(各自計算されたい)で(両側検定でも)有意になる。このように,試行数を増やすと微小な影響も検出できるのが,統計的分析の特徴である。
 ただ,各試行は統計的に「独立」(相互に無関係)でなければならない。同じターゲットを多くの被験者で透視を行なっていると,まぐれ当たりが他の要因で積み重なること(積重ね効果)がある(2-1)。それらを「独立」であるとして,上の計算を行なうとp値が小さく算出されるので,注意が必要である。

<6> 危険率と統計的証明

 先に挙げた有意水準は5%であった。考えてみれば,5%(20分の1)は結構大きい。実験や調査を20回繰返せば,平均して1回は偶然にも対立仮説が有意になってしまうのだ。つまり,5%の確率で,誤って正しくない対立仮説を,正しいと主張してしまう危険性がある。この意味で有意水準のことを「危険率」と呼ぶこともある。
 5%という危険率(有意水準)は緩い基準であると認識せねばならない。人間や社会に関する研究では,いろいろな影響が複雑に絡み合うので,緩い基準を採用して,わずかな可能性も拾い出す研究を奨励する。ときには誤りもあるという危険性を甘受するのである。その後に,追加の実験や調査をして,さらに確実な仮説に固めていくといった方法をとっている。一方で,誤りが許されない医薬品の開発や,多額のお金がかかった経営判断では,危険性は低くしなければならない。そのため有意水準を0.1%とするとかの対策をとって,なるべく確実な結果を出すようにしている。このように有意水準の値は,研究分野や研究目的によって異なるのである。
 有意水準をクリアして受容された対立仮説は,「統計的に証明された」などと呼ばれることがある。だが,この言い方は誤解を招きやすい。統計的な証明は,論理的な証明とは異なり,つねに幾ばくかの危険率を背負っているのである。どんなに厳密な実験であっても,そのわずかの確率で「たまたま」対立仮説が受容されている可能性が残されている。

<7> PSIの特性研究の場合の仮説

 上の仮説は,PSIの存在証明に関して例を示したが,PSIは存在すると認めたうえで,PSIの特性研究をする場合の仮説設定を示しておこう。たとえば,「PSIを信じる人は,信じない人よりもESPスコアが良い」という主張を検定する場合は,次のような仮説設定になる。帰無仮説は「PSIを信じるか信じないかには関係なくPSIは発揮され,たとえ両者のESPスコアに差があったとしても,それは単なる偶然に過ぎない」,対立仮説は「PSIを信じる人は,信じない人よりもESPスコアが良いという必然的関係がある」となる。
 この場合,PSIを信じる人と,信じない人に分けて,どれだけ当たったかハズレたかを分類し,カイ自乗検定(カイ自乗値を求めてからp値を求める仮説検定)を行なう。

<8> 相関関係

 最後に統計分析上の重要な概念をもうひとつ挙げておこう。それは「相関」である。2つの変数間に一方が増えると片方も増えるという関係が見られるとき,それらの間に「(正の)相関」があると言う。逆に,一方が増えると片方が減るという関係が見られるとき,それらの間に「負の相関」があると言う。例えば,100m走のタイムと走り幅跳びの距離とには負の相関関係がある。筋力や俊敏性が高い人は,100m走のタイムは小さいし,走り幅跳びの距離は大きい傾向がある。
 相関の度合いは通常「相関係数」で表わす。相関係数とは(その求め方は説明しないが)-1から1まで変化する値であり,0のとき相関無し(無相関),1に近づくほど強い正の相関,-1に近づくほど強い負の相関を表現する。
 相関関係は,必ずしも両者が直接の因果関係(原因と結果の関係)になっている訳ではない。全日本国民を母集団としたとき,身長と国語の成績の間には正の相関があるが,身長を高くしたら国語ができるようになるわけではないし,国語を勉強すると身長が高くなるわけでもない。20歳くらいまでは,年齢とともに身長が伸びるし,国語もできるようになるだけである。年齢が両者の共通した原因となっている。因果関係については,また後で議論する(5-8)。

<X> 付記

 本項の内容はSSPにおけるパーマー氏の講演と,先頭に掲げた筆者の文献をもとにしている。


超心理学講座のトップへ戻る] [用語解説を見る] [次に読み進む