本文へスキップ
スキルアップカレッジ

用語集

統計学の基礎入門コースで使われる主要な用語(72語)をまとめています。

アンスコムのカルテット (あんすこむのかるてっと)
1973 年に統計学者フランシス・アンスコムが作った 4 つのデータセット。平均・分散・相関係数・回帰直線がすべて同じなのに、散布図はまったく違う形を示し、「数字だけ信じず散布図も見るべき」という教訓を伝える例として知られる。
→ レッスン7
一元配置分散分析 (いちげんはいちぶんさんぶんせき)
1 つの要因(店舗・広告・部署など)の水準ごとに、連続値の平均を比較する分散分析の基本形。3 群以上の平均比較に使い、t 検定の繰り返しによる多重比較問題を回避する。
→ レッスン6
因果 (いんが)
一方が他方の原因になっている関係。相関とは別物で、相関は因果の必要条件であって十分条件ではない。因果を主張するには、ランダム化比較試験・自然実験・因果推論の手法などが必要。
→ レッスン7
大数の法則 (たいすうのほうそく)
同じ条件で観測を繰り返すと、観測の平均値は観測回数を増やすほど母集団の真の平均に近づく、という基本定理。「サンプル数が多いほど推定が安定する」直感の数学的な根拠になる。
→ レッスン4
帯外れ値 (おびはずれち)
→ 「外れ値」を参照
→ レッスン2
(範囲)
→ 「信頼区間」「四分位範囲」を参照
確率 (かくりつ)
ある事象が起きる「割合」「起こりやすさ」を表す数値。古典的確率、頻度主義的確率、主観確率の 3 つの捉え方があり、本コースの推測統計は頻度主義の立場を主軸とする。
→ レッスン3
確率変数 (かくりつへんすう)
結果がいくつかありえて、それぞれに確率がついている数。観測する前は値が確定していないが、観測後は 1 つの値になる。確率分布とセットで扱う。
→ レッスン3
確率分布 (かくりつぶんぷ)
確率変数がどの値をどれくらいの確率で取るかをまとめたもの。離散分布(数えられる値)と連続分布(連続的な値)の 2 種類に分類される。
→ レッスン3
帰無仮説 (きむかせつ)
「効果がない」「差がない」「変わらない」という主張。仮説検定では、まず帰無仮説を仮定したうえで、データから「これくらいの差が偶然起きる確率(p 値)」を計算する。背理法に近い論理構造を取る。
→ レッスン5
検出力 (けんしゅつりょく)
本当に差があるときに、それを正しく検出できる確率(1 − β)。第二種の過誤を犯さない確率と言い換えられる。標本サイズ・効果量・有意水準で決まる。目安として 0.8 がよく使われる。
→ レッスン5
効果量 (こうかりょう)
差の「大きさ」を語る指標。Cohen's d、Pearson's r、η² など、検定によって使われる指標が変わる。p 値だけでは「差があるか」しか語れず、効果量とセットで見るのが基本。
→ レッスン5
古典的確率 (こてんてきかくりつ)
すべての場合の数が同じくらい起きるとして、「目的の場合の数 ÷ 全体の場合の数」と決める確率の捉え方。サイコロやよくシャッフルされたトランプの例が典型例。
→ レッスン3
カイ二乗検定 (かいにじょうけんてい)
カテゴリーデータの比率や独立性を判断する検定。適合度検定(観測分布と理論分布の一致)と独立性検定(2 変数の関連の有無)の 2 つの代表的な使い方がある。
→ レッスン6
偽陰性 (ぎいんせい)
→ 「第二種の過誤」を参照
→ レッスン5
偽陽性 (ぎようせい)
→ 「第一種の過誤」を参照
→ レッスン5
観測値 (かんそくち)
実際に取った 1 つの数字。確率変数(観測前の可能性の集合)と区別される。
→ レッスン3
過誤 (かご)
仮説検定で起こる判断の誤り。第一種の過誤(差がないのに「ある」と判断する偽陽性、確率 α)と第二種の過誤(差があるのに「ない」と判断する偽陰性、確率 β)がある。
→ レッスン5
最頻値 (さいひんち)
データの中で最も多く出てくる値。カテゴリーや離散値の「典型的な値」を直感的に伝える。連続値で全データが 1 回ずつしか出ないケースでは、ほぼ意味を持たない。
→ レッスン2
最小二乗法 (さいしょうにじょうほう)
回帰直線を引くときの代表的な方法。実際のデータ点と直線の予測値との縦方向のずれ(残差)の 2 乗の合計を最小にする線を選ぶ。ガウスが 19 世紀初頭に天文学の観測誤差処理のために用いた古典的手法。
→ レッスン7
散布図 (さんぷず)
2 つの変数の値を、横軸・縦軸の座標として点で示した図。相関係数だけでは捉えきれない関係の形(非線形・外れ値の影響など)を視覚的に確認できる。アンスコムのカルテットが示すように、相関を語る前に必ず描くべき図。
→ レッスン7
サンプリング
母集団から標本を取り出すこと。ランダムサンプリングが推測統計の手法すべての前提となる。
→ レッスン4
サバイバー・バイアス
過去のデータで「生き残ったもの」だけしか見えていない問題。第二次世界大戦中の帰還戦闘機の被弾箇所分析、「成功した経営者の習慣」「生き残った投資家のスタイル」などが典型例。選択バイアスの一種。
→ レッスン8
残差 (ざんさ)
回帰分析で、実際のデータ点と回帰直線の予測値との縦方向のずれ。最小二乗法は残差の 2 乗の合計を最小化する。残差プロットで回帰の前提(線形性など)を確認できる。
→ レッスン7
シンプソンのパラドックス
データを「全体」と「サブグループ」で見たときに、結論が逆転する現象。1951 年にエドワード・シンプソンが論じた。集約された全体だけ見ると、サブグループの構造を見落とすことがある。
→ レッスン8
信頼区間(しんらいくかん)
点推定値のまわりに置かれる、不確かさを表す区間。95% 信頼区間は「同じ手続きで標本を取り直して区間を作る作業を多数回繰り返すと、そのうち 95% が母集団の真の値を含む」という意味で、「真の値がこの区間にある確率が 95%」とは厳密には異なる。
→ レッスン4
重回帰分析 (じゅうかいきぶんせき)
説明変数が複数(x₁, x₂, ...)の回帰分析。多変数で目的変数を予測・説明する。多重共線性の問題に注意が必要。
→ レッスン7
主観確率 (しゅかんかくりつ)
人の信念の度合いとして確率を捉える考え方。一回限りの事象にも確率を当てはめられる立場で、ベイズ統計の基礎になる。
→ レッスン3
説明変数 (せつめいへんすう)
回帰分析で、予測や説明に使う側の変数(x)。独立変数とも呼ばれる。目的変数 y を予測・説明するために置かれる。
→ レッスン7
選択バイアス
標本が母集団からランダムに取れていないとき、推定値が真の値から系統的にズレる現象。回答バイアス、生存バイアス(サバイバー・バイアス)、自己選択バイアスなど、さまざまな形で現れる。
→ レッスン4
事前分布/事後分布(じぜんぶんぷ/じごぶんぷ)
ベイズ統計の重要な概念。観測前の信念を表す確率分布(事前分布)を、観測されたデータの尤度で更新して、事後分布を得る。
→ レッスン8
対立仮説 (たいりつかせつ)
「効果がある」「差がある」「変わった」という主張。帰無仮説を否定する形で立てられ、検定の結果として帰無仮説が棄却されたときに、「対立仮説を採択する」と表現される。
→ レッスン5
単回帰分析 (たんかいきぶんせき)
説明変数が 1 つの回帰分析。散布図に「最もよく当てはまる直線」を引いて、変数の関係を式で表現する。最小二乗法が標準的に使われる。
→ レッスン7
対応のある t 検定(たいおうのあるてぃーけんてい)
同じ対象を 2 回観測して、その差を判断する t 検定。研修の前後で同じ社員を測る、改善の前後で同じ工程を測るなど、ビフォーアフター構造に使う。個人差の影響を取り除けるため、独立 2 群の t 検定より検出力が高くなる傾向がある。
→ レッスン6
中央値 (ちゅうおうち)
データを小さい順に並べたときに、真ん中に来る数字。外れ値に強い「中心」の指標で、歪んだ分布や外れ値があるデータで実態を捉えやすい。
→ レッスン2
中心極限定理 (ちゅうしんきょくげんていり)
元のデータの分布が何であっても、そこからランダムに取った標本の平均は、標本サイズが十分大きければ正規分布に近づく、という驚くべき性質。推測統計の多くの手法が、この定理に支えられている。
→ レッスン4
適合度検定 (てきごうどけんてい)
カイ二乗検定の 1 つで、観測された分布が想定した理論的な分布と一致しているかを判断する検定。
→ レッスン6
独立性検定 (どくりつせいけんてい)
カイ二乗検定の 1 つで、2 つのカテゴリー変数が独立か(互いに関係ないか)を判断する検定。
→ レッスン6
第一種の過誤 (だいいっしゅのかご)
帰無仮説が本当は正しいのに、誤って棄却してしまう判断ミス。「偽陽性」とも呼ばれる。確率は α(有意水準)で抑える。
→ レッスン5
第二種の過誤 (だいにしゅのかご)
帰無仮説が本当は誤りなのに、保留してしまう判断ミス。「偽陰性」とも呼ばれる。確率は β で表され、検出力(1 − β)と相補的。
→ レッスン5
多重共線性 (たじゅうきょうせんせい)
重回帰分析で、説明変数同士に強い相関がある状態。回帰係数が不安定になり、変数の効果を分けて推定するのが難しくなる。相関の強い変数を削る、正則化回帰を使うなどの対処がある。
→ レッスン7
多重比較問題 (たじゅうひかくもんだい)
複数回の検定を繰り返すと、第一種の過誤(偽陽性)の確率が累積する問題。3 群以上の平均比較で t 検定を繰り返すと、本来差がないのに「少なくとも 1 つ有意」が出る確率が膨らむ。分散分析やボンフェローニ法などで回避する。
→ レッスン6
二項分布 (にこうぶんぷ)
試行が独立に n 回繰り返され、各試行の結果が「成功/失敗」の 2 つだけ、成功確率 p が毎回同じ、という条件で成り立つ離散分布。100 個の製品検査での不良品数、メール広告の開封数などが典型例。
→ レッスン3
箱ひげ図 (はこひげず)
データの中央値、第 1・第 3 四分位、ばらつき範囲、外れ値を 1 つの図で示すグラフ。複数グループの比較に強い。中央の線は平均ではなく中央値であることに注意。
→ レッスン2
外れ値 (はずれち)
ほかのデータ点から大きく離れた値。平均や標準偏差に強い影響を与えるため、中央値や四分位範囲を併用して実態を捉える。慣習として、第 1 四分位 - 1.5 × IQR より下、第 3 四分位 + 1.5 × IQR より上を外れ値とする「テューキーの方法」がよく使われる。
→ レッスン2
バイアス
推定値が母集団の真の値から系統的にズレる現象。選択バイアス、サバイバー・バイアス、回答バイアス、自己選択バイアスなど、さまざまな種類がある。
→ レッスン4
p 値ハッキング(ぴーちはっきんぐ)
有意な結果を得るためにデータや解析を意図的または無自覚に操作する行為の総称。繰り返し検定の早期終了、サブグループの事後探索、変数の取捨選択、外れ値の恣意的除去などが典型。事前解析計画が対策の基本。
→ レッスン8
HARKing(はーきんぐ)
Hypothesizing After the Results are Known の頭文字で、結果を見てから仮説を立て、最初からその仮説を持っていたかのように報告する行為。仮説検定の論理を崩す重大な誤用。
→ レッスン8
母集団(ぼしゅうだん)
推測統計で、知りたい対象の全体。しばしば直接観測できず、標本を通じて推測する。
→ レッスン4
標本 (ひょうほん)
母集団から取り出した一部のデータ。標本サイズと取り方(ランダム性)が推定の精度を左右する。
→ レッスン4
標本平均 (ひょうほんへいきん)
標本から計算された平均値。母集団平均の推定値として使われる。中心極限定理により、標本平均の分布は標本サイズが十分大きければ正規分布に近づく。
→ レッスン4
分散 (ぶんさん)
ばらつきを表す指標で、「平均からのずれの 2 乗を平均したもの」。元のデータと単位が違うため、実用的には標準偏差(分散の平方根)の方がよく使われる。
→ レッスン2
分散分析 (ぶんさんぶんせき)
3 群以上の連続値の平均を一度に比較する検定。R. A. Fisher が 1920 年代に開発。多重比較問題を回避する設計で、一元配置・二元配置などのバリエーションがある。
→ レッスン6
標準偏差 (ひょうじゅんへんさ)
分散の平方根。「ばらつきの典型的な大きさ」として、元のデータと同じ単位で扱える。正規分布の 68-95-99.7 ルールなど、推測統計の語彙の中核。
→ レッスン2
標準誤差 (ひょうじゅんごさ)
標本平均が母集団平均からどれくらいズレているかの不確かさ。おおよそ「標準偏差 ÷ √標本サイズ」で表され、標本サイズを 4 倍にすると標準誤差は半分になる。
→ レッスン4
ピアソン相関係数 (ぴあそんそうかんけいすう)
2 つの連続変数の「直線的な関係」の強さを表す指標。-1 〜 +1 の範囲を取り、+1 で完全な正の線形相関、-1 で完全な負の線形相関、0 で線形関係なし。非線形関係や外れ値に弱いため、散布図と併用が必須。
→ レッスン7
頻度主義的確率 (ひんどしゅぎてきかくりつ)
同じ試行を非常に多く繰り返したとき、目的の結果が出る割合がある値に近づいていく、と考える確率の捉え方。本コースの推測統計が主軸とする立場。
→ レッスン3
比率の検定 (ひりつのけんてい)
2 群の比率(例:施策 A と B のコンバージョン率)の差を判断する検定。A/B テストでよく使われ、Z 検定やカイ二乗検定(独立性)で扱う。
→ レッスン6
マンホイットニーの U 検定(まんほいっとにーのゆーけんてい)
データの正規性が崩れているときに使うノンパラメトリック検定の代表。順位に基づく検定で、2 群の中央値の差を判断する。本コースでは概念紹介のみ。
→ レッスン6
有意水準 (ゆういすいじゅん)
仮説検定で、帰無仮説を棄却するかどうかの線引きの値。α で表され、慣習的に 0.05 がよく使われる。「第一種の過誤を犯す確率の上限」を意味する。
→ レッスン5
ランダムサンプリング
母集団のすべての要素が等しい確率で標本に選ばれるような取り方。推測統計の手法すべての前提となる。これが守られていないと選択バイアスが生じる。
→ レッスン4
連続分布 (れんぞくぶんぷ)
連続的な値(小数・分数を含む)を取る確率変数の分布。正規分布、t 分布、F 分布、カイ二乗分布などが代表的。
→ レッスン3
離散分布 (りさんぶんぷ)
数えられる値(整数など)を取る確率変数の分布。二項分布、ポアソン分布、幾何分布などが代表的。
→ レッスン3
ANOVA
Analysis of Variance(分散分析)の略。1920 年代に R. A. Fisher が開発した、3 群以上の連続値の平均を一度に比較する検定の総称。本コースでは一元配置 ANOVA を中心に紹介。
→ レッスン6
ASA p 値声明
米国統計学会(American Statistical Association)が 2016 年に発表した、p 値の使い方に関する声明。「p 値だけで科学的結論や政策決定をしてはいけない」「p 値はモデルや仮定の妥当性に依存する」「効果量や信頼区間も併用すべき」が主旨。本コースのスタンスもこの声明と一致する。
→ レッスン5
Cohen's d
2 群の平均の差を標準偏差で割った値で、t 検定の代表的な効果量指標。慣習的な目安として 0.2 を小、0.5 を中、0.8 を大とするが、分野・文脈次第で解釈が変わる。
→ レッスン5
Open Science Collaboration (OSC)
心理学の主要論文 100 本を再実験するプロジェクトを 2015 年に実施した国際研究グループ。約 36% しか再現されず、効果量も半分程度に縮小していたことを報告し、再現性危機の議論を広げた。
→ レッスン8
p 値(ぴーち)
帰無仮説が正しいと仮定したとき、観測した結果以上に「極端な」データが偶然起きる確率。「帰無仮説が正しい確率」ではない。0.05 を慣習的な有意水準とすることが多いが、業界や用途で違う。
→ レッスン5
(決定係数)
回帰分析で、目的変数 y のばらつきのうち、説明変数 x で説明できる割合(0 〜 1)。1 に近いほど x の予測力が高い。説明変数を増やせば機械的に上がるため、「自由度調整済み R²」で補正することもある。
→ レッスン7
t 検定(てぃーけんてい)
連続値の平均を比較する代表的な検定。1908 年に William Sealy Gosset(ペンネーム「Student」)が、ギネス・ビール工場で品質管理のために考案した。1 標本/独立 2 群/対応のあるの 3 種類のバリエーションがある。
→ レッスン6
α (あるふぁ)
有意水準。仮説検定で帰無仮説を棄却するかどうかの線引きの値。「第一種の過誤を犯す確率の上限」と解釈される。
→ レッスン5
β(べーた)
第二種の過誤(差があるのに「ない」と判断する偽陰性)を犯す確率。検出力 1 − β と対の関係にある。
→ レッスン5
← 統計学の基礎入門 に戻る