統計学の基礎入門
公開日:
コース概要
「統計学」と聞くと数式や記号を思い浮かべて身構えてしまう方は多いのではないでしょうか。本コースは、その身構えを解いて、統計学を「数字の不確かさを扱う技術」として体系的に学べる入門コースです。データ分析入門コースが「データの読み方とビジネス判断への活用」を中心に扱ったのに対し、本コースは推測統計の領域に踏み込みます。確率分布・標本と母集団・仮説検定・主要な検定の使い分け・相関と回帰までを 8 レッスンで学び、最後に「p 値ハッキング」「再現性危機」など統計学の限界と倫理にも踏み込みます。数式は最小限に抑え、「考え方・直感・誤用の避け方」を中心に組み立てました。ビジネスの現場で「データを根拠に意思決定する」「他人の数値主張を吟味する」「A/B テストや顧客サーベイの結果を読む」ために必要十分な統計の考え方を、運用できる粒度で持ち帰っていただける構成です。
学習の流れ
レッスン 1〜2 は「土台」として、統計学の役割(記述と推測)と、記述統計の基本指標(平均・中央値・分散・標準偏差・箱ひげ図)を本コースの言葉で再整理します。レッスン 3〜4 は「推測の準備」として、確率と確率分布、標本と母集団の関係、中心極限定理、信頼区間を学びます。レッスン 5〜6 は「推測の中核」、仮説検定の論理と主要な検定(t 検定・カイ二乗・分散分析)の使い分けを扱います。レッスン 7 は「変数の関係」として、相関と回帰、相関と因果の区別を学びます。レッスン 8 で「統計の誤用と倫理」、p 値ハッキング・選択バイアス・再現性危機を直視し、ベイズ統計の入口とコース修了後の学習方向を案内します。前半(1〜2)が「土台」、中盤(3〜6)が「推測統計の中核」、後半(7〜8)が「関係と倫理」という三段構えです。
このコースで学べること
- ✓ 記述統計と推測統計の違いを理解し、「不確かさを扱う学問」としての統計学を捉え直す
- ✓ 中心の指標(平均・中央値・最頻値)とばらつきの指標(分散・標準偏差・四分位範囲)を、場面に応じて使い分けられる
- ✓ 確率分布の基本(二項分布・正規分布)と、なぜ正規分布が多用されるかを理解する
- ✓ 標本と母集団の関係、中心極限定理、信頼区間を「自分の言葉で」説明できる
- ✓ 仮説検定の論理(帰無仮説・対立仮説・p 値・有意水準・第一種/第二種の過誤)を理解し、誤用を避けられる
- ✓ t 検定・カイ二乗検定・分散分析の使い分けを、変数の種類と標本数から判断できる
- ✓ 相関と回帰の意味を理解し、「相関があれば因果がある」のような誤解を避けられる
- ✓ p 値ハッキング・選択バイアス・再現性危機など、統計の誤用と限界を直視する姿勢を持つ
対象者
「数値や統計データを根拠に意思決定したい」「A/B テストや顧客サーベイの結果を正しく読みたい」「他人の数値主張に騙されないようになりたい」と感じている社会人。マーケ・営業・人事・経営企画・プロダクト・カスタマーサクセスなど、データを「使う」側のすべての職種
レッスン一覧
-
1
統計学とは何か——記述統計と推測統計、何を支える学問か
統計学の 2 つの役割(記述と推測)、「不確かさを扱う」という核、なぜ推測が必要か、本コースの守備範囲、数式の扱い方を整理する
-
2
データのばらつきを捉える——記述統計のまとめ直し
中心の指標(平均・中央値・最頻値の使い分け)、ばらつきの指標(分散・標準偏差・四分位範囲)、外れ値と歪み、箱ひげ図の読み方を学ぶ
-
3
確率と確率分布——統計学の言葉を整える
確率の基本、確率変数、離散分布と連続分布、二項分布、正規分布(68-95-99.7 ルール)、なぜ正規分布が多用されるかを学ぶ
-
4
標本と推測——見えない母集団を推測する
母集団と標本、ランダムサンプリング、中心極限定理、標本平均の分布、標準誤差、信頼区間(95% の正確な意味)を学ぶ
-
5
仮説検定の考え方——「偶然か必然か」を判断する
帰無仮説と対立仮説、p 値の正確な意味と誤解、有意水準、第一種・第二種の過誤、効果量、統計的有意性と実用的有意性の区別を学ぶ
-
6
主要な検定の使い分け——t 検定、カイ二乗、分散分析
1 標本/2 標本 t 検定、対応のある t 検定、カイ二乗適合度・独立性検定、一元配置分散分析の入口、検定の選び方フローチャートを学ぶ
-
7
相関と回帰——変数の関係を測り、予測する
ピアソン相関係数の意味と限界、相関と因果の区別、単回帰分析、決定係数 R²、残差プロット、多変数回帰の入口、多重共線性を学ぶ
-
8
統計の誤用と倫理——p 値ハッキング、選択バイアス、再現性危機
p 値ハッキング・HARKing、選択バイアス、サバイバー・バイアス、シンプソンのパラドックス、心理学の再現性危機、ベイズ統計の入口、コース修了後の学習方向を案内する
-
✓
総復習テスト
全レッスンの内容を振り返るテスト
このコースの用語集(72語)
- アンスコムのカルテット
- 1973 年に統計学者フランシス・アンスコムが作った 4 つのデータセット。平均・分散・相関係数・回帰直線がすべて同じなのに、散布図はまったく違う形を示し、「数字だけ信じず散布図も見るべき」という教訓を伝える例として知られる。
- 一元配置分散分析
- 1 つの要因(店舗・広告・部署など)の水準ごとに、連続値の平均を比較する分散分析の基本形。3 群以上の平均比較に使い、t 検定の繰り返しによる多重比較問題を回避する。
- 因果
- 一方が他方の原因になっている関係。相関とは別物で、相関は因果の必要条件であって十分条件ではない。因果を主張するには、ランダム化比較試験・自然実験・因果推論の手法などが必要。
- 大数の法則
- 同じ条件で観測を繰り返すと、観測の平均値は観測回数を増やすほど母集団の真の平均に近づく、という基本定理。「サンプル数が多いほど推定が安定する」直感の数学的な根拠になる。
- 帯外れ値
- → 「外れ値」を参照
- 帯
- → 「信頼区間」「四分位範囲」を参照