用語集
統計学の基礎入門コースで使われる主要な用語(72語)をまとめています。
- アンスコムのカルテット (あんすこむのかるてっと)
- 1973 年に統計学者フランシス・アンスコムが作った 4 つのデータセット。平均・分散・相関係数・回帰直線がすべて同じなのに、散布図はまったく違う形を示し、「数字だけ信じず散布図も見るべき」という教訓を伝える例として知られる。
- → レッスン7
- 一元配置分散分析 (いちげんはいちぶんさんぶんせき)
- 1 つの要因(店舗・広告・部署など)の水準ごとに、連続値の平均を比較する分散分析の基本形。3 群以上の平均比較に使い、t 検定の繰り返しによる多重比較問題を回避する。
- → レッスン6
- 因果 (いんが)
- 一方が他方の原因になっている関係。相関とは別物で、相関は因果の必要条件であって十分条件ではない。因果を主張するには、ランダム化比較試験・自然実験・因果推論の手法などが必要。
- → レッスン7
- 大数の法則 (たいすうのほうそく)
- 同じ条件で観測を繰り返すと、観測の平均値は観測回数を増やすほど母集団の真の平均に近づく、という基本定理。「サンプル数が多いほど推定が安定する」直感の数学的な根拠になる。
- → レッスン4
- 帯 (範囲)
- → 「信頼区間」「四分位範囲」を参照
- 帰無仮説 (きむかせつ)
- 「効果がない」「差がない」「変わらない」という主張。仮説検定では、まず帰無仮説を仮定したうえで、データから「これくらいの差が偶然起きる確率(p 値)」を計算する。背理法に近い論理構造を取る。
- → レッスン5
- 検出力 (けんしゅつりょく)
- 本当に差があるときに、それを正しく検出できる確率(1 − β)。第二種の過誤を犯さない確率と言い換えられる。標本サイズ・効果量・有意水準で決まる。目安として 0.8 がよく使われる。
- → レッスン5
- 効果量 (こうかりょう)
- 差の「大きさ」を語る指標。Cohen's d、Pearson's r、η² など、検定によって使われる指標が変わる。p 値だけでは「差があるか」しか語れず、効果量とセットで見るのが基本。
- → レッスン5
- 古典的確率 (こてんてきかくりつ)
- すべての場合の数が同じくらい起きるとして、「目的の場合の数 ÷ 全体の場合の数」と決める確率の捉え方。サイコロやよくシャッフルされたトランプの例が典型例。
- → レッスン3
- カイ二乗検定 (かいにじょうけんてい)
- カテゴリーデータの比率や独立性を判断する検定。適合度検定(観測分布と理論分布の一致)と独立性検定(2 変数の関連の有無)の 2 つの代表的な使い方がある。
- → レッスン6
- 最小二乗法 (さいしょうにじょうほう)
- 回帰直線を引くときの代表的な方法。実際のデータ点と直線の予測値との縦方向のずれ(残差)の 2 乗の合計を最小にする線を選ぶ。ガウスが 19 世紀初頭に天文学の観測誤差処理のために用いた古典的手法。
- → レッスン7
- 散布図 (さんぷず)
- 2 つの変数の値を、横軸・縦軸の座標として点で示した図。相関係数だけでは捉えきれない関係の形(非線形・外れ値の影響など)を視覚的に確認できる。アンスコムのカルテットが示すように、相関を語る前に必ず描くべき図。
- → レッスン7
- サバイバー・バイアス
- 過去のデータで「生き残ったもの」だけしか見えていない問題。第二次世界大戦中の帰還戦闘機の被弾箇所分析、「成功した経営者の習慣」「生き残った投資家のスタイル」などが典型例。選択バイアスの一種。
- → レッスン8
- シンプソンのパラドックス
- データを「全体」と「サブグループ」で見たときに、結論が逆転する現象。1951 年にエドワード・シンプソンが論じた。集約された全体だけ見ると、サブグループの構造を見落とすことがある。
- → レッスン8
- 信頼区間(しんらいくかん)
- 点推定値のまわりに置かれる、不確かさを表す区間。95% 信頼区間は「同じ手続きで標本を取り直して区間を作る作業を多数回繰り返すと、そのうち 95% が母集団の真の値を含む」という意味で、「真の値がこの区間にある確率が 95%」とは厳密には異なる。
- → レッスン4
- 選択バイアス
- 標本が母集団からランダムに取れていないとき、推定値が真の値から系統的にズレる現象。回答バイアス、生存バイアス(サバイバー・バイアス)、自己選択バイアスなど、さまざまな形で現れる。
- → レッスン4
- 対立仮説 (たいりつかせつ)
- 「効果がある」「差がある」「変わった」という主張。帰無仮説を否定する形で立てられ、検定の結果として帰無仮説が棄却されたときに、「対立仮説を採択する」と表現される。
- → レッスン5
- 対応のある t 検定(たいおうのあるてぃーけんてい)
- 同じ対象を 2 回観測して、その差を判断する t 検定。研修の前後で同じ社員を測る、改善の前後で同じ工程を測るなど、ビフォーアフター構造に使う。個人差の影響を取り除けるため、独立 2 群の t 検定より検出力が高くなる傾向がある。
- → レッスン6
- 中心極限定理 (ちゅうしんきょくげんていり)
- 元のデータの分布が何であっても、そこからランダムに取った標本の平均は、標本サイズが十分大きければ正規分布に近づく、という驚くべき性質。推測統計の多くの手法が、この定理に支えられている。
- → レッスン4
- 多重共線性 (たじゅうきょうせんせい)
- 重回帰分析で、説明変数同士に強い相関がある状態。回帰係数が不安定になり、変数の効果を分けて推定するのが難しくなる。相関の強い変数を削る、正則化回帰を使うなどの対処がある。
- → レッスン7
- 多重比較問題 (たじゅうひかくもんだい)
- 複数回の検定を繰り返すと、第一種の過誤(偽陽性)の確率が累積する問題。3 群以上の平均比較で t 検定を繰り返すと、本来差がないのに「少なくとも 1 つ有意」が出る確率が膨らむ。分散分析やボンフェローニ法などで回避する。
- → レッスン6
- 二項分布 (にこうぶんぷ)
- 試行が独立に n 回繰り返され、各試行の結果が「成功/失敗」の 2 つだけ、成功確率 p が毎回同じ、という条件で成り立つ離散分布。100 個の製品検査での不良品数、メール広告の開封数などが典型例。
- → レッスン3
- 箱ひげ図 (はこひげず)
- データの中央値、第 1・第 3 四分位、ばらつき範囲、外れ値を 1 つの図で示すグラフ。複数グループの比較に強い。中央の線は平均ではなく中央値であることに注意。
- → レッスン2
- 外れ値 (はずれち)
- ほかのデータ点から大きく離れた値。平均や標準偏差に強い影響を与えるため、中央値や四分位範囲を併用して実態を捉える。慣習として、第 1 四分位 - 1.5 × IQR より下、第 3 四分位 + 1.5 × IQR より上を外れ値とする「テューキーの方法」がよく使われる。
- → レッスン2
- p 値ハッキング(ぴーちはっきんぐ)
- 有意な結果を得るためにデータや解析を意図的または無自覚に操作する行為の総称。繰り返し検定の早期終了、サブグループの事後探索、変数の取捨選択、外れ値の恣意的除去などが典型。事前解析計画が対策の基本。
- → レッスン8
- HARKing(はーきんぐ)
- Hypothesizing After the Results are Known の頭文字で、結果を見てから仮説を立て、最初からその仮説を持っていたかのように報告する行為。仮説検定の論理を崩す重大な誤用。
- → レッスン8
- 分散分析 (ぶんさんぶんせき)
- 3 群以上の連続値の平均を一度に比較する検定。R. A. Fisher が 1920 年代に開発。多重比較問題を回避する設計で、一元配置・二元配置などのバリエーションがある。
- → レッスン6
- 標準誤差 (ひょうじゅんごさ)
- 標本平均が母集団平均からどれくらいズレているかの不確かさ。おおよそ「標準偏差 ÷ √標本サイズ」で表され、標本サイズを 4 倍にすると標準誤差は半分になる。
- → レッスン4
- ピアソン相関係数 (ぴあそんそうかんけいすう)
- 2 つの連続変数の「直線的な関係」の強さを表す指標。-1 〜 +1 の範囲を取り、+1 で完全な正の線形相関、-1 で完全な負の線形相関、0 で線形関係なし。非線形関係や外れ値に弱いため、散布図と併用が必須。
- → レッスン7
- 頻度主義的確率 (ひんどしゅぎてきかくりつ)
- 同じ試行を非常に多く繰り返したとき、目的の結果が出る割合がある値に近づいていく、と考える確率の捉え方。本コースの推測統計が主軸とする立場。
- → レッスン3
- マンホイットニーの U 検定(まんほいっとにーのゆーけんてい)
- データの正規性が崩れているときに使うノンパラメトリック検定の代表。順位に基づく検定で、2 群の中央値の差を判断する。本コースでは概念紹介のみ。
- → レッスン6
- ANOVA
- Analysis of Variance(分散分析)の略。1920 年代に R. A. Fisher が開発した、3 群以上の連続値の平均を一度に比較する検定の総称。本コースでは一元配置 ANOVA を中心に紹介。
- → レッスン6
- ASA p 値声明
- 米国統計学会(American Statistical Association)が 2016 年に発表した、p 値の使い方に関する声明。「p 値だけで科学的結論や政策決定をしてはいけない」「p 値はモデルや仮定の妥当性に依存する」「効果量や信頼区間も併用すべき」が主旨。本コースのスタンスもこの声明と一致する。
- → レッスン5
- Cohen's d
- 2 群の平均の差を標準偏差で割った値で、t 検定の代表的な効果量指標。慣習的な目安として 0.2 を小、0.5 を中、0.8 を大とするが、分野・文脈次第で解釈が変わる。
- → レッスン5
- Open Science Collaboration (OSC)
- 心理学の主要論文 100 本を再実験するプロジェクトを 2015 年に実施した国際研究グループ。約 36% しか再現されず、効果量も半分程度に縮小していたことを報告し、再現性危機の議論を広げた。
- → レッスン8
- p 値(ぴーち)
- 帰無仮説が正しいと仮定したとき、観測した結果以上に「極端な」データが偶然起きる確率。「帰無仮説が正しい確率」ではない。0.05 を慣習的な有意水準とすることが多いが、業界や用途で違う。
- → レッスン5
- R² (決定係数)
- 回帰分析で、目的変数 y のばらつきのうち、説明変数 x で説明できる割合(0 〜 1)。1 に近いほど x の予測力が高い。説明変数を増やせば機械的に上がるため、「自由度調整済み R²」で補正することもある。
- → レッスン7
- t 検定(てぃーけんてい)
- 連続値の平均を比較する代表的な検定。1908 年に William Sealy Gosset(ペンネーム「Student」)が、ギネス・ビール工場で品質管理のために考案した。1 標本/独立 2 群/対応のあるの 3 種類のバリエーションがある。
- → レッスン6
該当する用語が見つかりません。