Leverages データ戦略ブログ

インハウスデータ組織のあたまのなか

【統計検定】難易度と参考書籍の総まとめ!!

はじめに

こんにちは、レバレジーズ株式会社データ戦略室 アナリティクスグループ リーダーの丸山です!
最近弊社内の一部メンバーで統計検定を受けようというムーブメントが起きているので、この機会に各級で必要となるレベル感や参考書籍についてまとめようと決意しました。
n番煎じされたネタではありますが、書籍については網羅的に記載しようと思いますので是非読んでいってください!

統計検定の種別について

日本統計学会の公式サイトによると、級別のレベルについては以下のように整理されています。
また、2021年には「データサイエンス基礎・発展」という資格も登場しています。

検定種別 試験内容
1級 実社会の様々な分野でのデータ解析を遂行する統計専門力
準1級 統計学の活用力 ─ 実社会の課題に対する適切な手法の活用力
2級 大学基礎統計学の知識と問題解決力
3級 データの分析において重要な概念を身に付け、身近な問題に活かす力
4級 データや表・グラフ、確率に関する基本的な知識と具体的な文脈の中での活用力

この後の記事では、データ分析の実務者の観点で各級のレベルと参考になる書籍を整理していきます!
レベルについては転職やキャリア観点でのコメントもしています。
※データサイエンス基礎・発展や統計検定4級については割愛します。前者はそこまで浸透していないため、後者はデータ分析者として求めるスキル水準には明確に達していないためです。

統計検定3級

レベル

総括すると、「データの扱いをする上での最低限のリテラシーがある」というレベル感です。
少し厳し目のコメントにはなってしまいますが、3級を取っているからデータの専門職としてスキルがあると判断されることはまずないと考えています。
データ系職種以外の企画職の方で統計検定3級を取っている人がいたら、「この人には話が伝わりやすいなぁ」と思うような感覚です。
上記から、データ系職種の中途採用市場においても3級を取ったことが評価されることは少ないと思います(データ分析未経験やポテンシャルの求人であっても)。

ネガティブなことばかり書いているように見えるかもしれませんが、初学者の人がとっかかりとして勉強することには意味があると思うので、そこは誤解なきようお願いします。
データ分析専門で業務をするのであれば、これをとっかかりにしてステップアップが前提になる資格だと考えています(なので参考書籍は省略します)。

統計検定2級

レベル

「データアナリストとして最低限のリテラシーがある」というレベル感です。
資格取得は転職時のアピールポイントになるという側面もありますが、データ分析経験者が2級を取得している場合、最低限の知識と学習習慣が担保されている安心感があります(ただ、資格取得そのものが大きなプラスにはならないという所感です)。
未経験者がデータ系職種での転職を行うケースでは、「分析業務をする上での素地はあるんだな」「アナリストになるために一定頑張ったんだな」などとポジティブに捉えてもらえることが多いと思います。
データサイエンティストとして分析の専門性を活かしてキャリア構築したいというモチベーションがある方は、2級の知識をベースとして、より高度な知識が必要になると思います。

参考書籍

完全独習 統計学入門

中学数学のような基本的な数式のみで、検定の考え方について説明してくれる書籍です。
統計に限らず初学者向けの書籍だと「難しいところは厳密性を軽視して説明をする」という傾向がみられると思うのですが、この本はわかりやすさと説明の正確さが両立されているのが個人的な評価ポイントです。
2級向けの書籍というより、3級→2級への橋渡し的な役割になるかもしれません。

統計学入門 (基礎統計学Ⅰ)

いわゆる赤本と呼ばれる有名な書籍です。
統計学の考え方・数学的背景が丁寧かつ網羅的に記載されています。
これ1冊を理解できれば2級には合格できますが、初学者にはやや読みづらいかもしれません(他の簡易な入門書を読んで概要を理解しつつ、もう少し細かく理解したい時に教科書的に使うのがおすすめです)。

入門統計解析

前述の赤本がとっつきづらいと感じた方は、こちらの方が読みやすいかもしれません。

データ分析に必須の知識・考え方 統計学入門

資格の勉強という意味では不要かもしれませんが、実務で分析をするときの注意点や検定におけるp-hackingの問題など、より実践的な内容が記載された良書なので記載してみました。

統計検定準1級

レベル

「データアナリスト・サイエンティストとして一人前の知識がある」というレベルになり、転職市場において準1級以上は資格取得が明確にプラスになるかと思います。
分析者が実務で使う可能性のある手法を網羅的に学ぶことができるので、業務との親和性が高い資格だと考えています。
具体的には、業務に必要な手法選択およびその解釈が不自由なくできるようになると思います(実装はまた別ですが)。
また、準1級で対象となる分析手法について理解するためには、行列や微分積分など多少の数学の知識が必要になってきます。この点は2級との大きな差分になるかと考えています。

準1級はしっかりと勉強をしないと取得が難しい資格なので、個人的には保有している方に対して「未知の知識や領域をインプットをすることに抵抗がない & (他の方との比較で)スピード感を持って習得してくれそう」だというイメージを持ちます。

参考書籍

自然科学の統計学 (基礎統計学)

人文・社会科学の統計学 (基礎統計学)

前述した赤本と同じシリーズで、通称青本緑本と呼ばれている書籍です。
赤本は統計学の基礎をまとめた書籍であるのに対して、この2冊は中級者向けの書籍になるかと思います。
青本では、最尤法やサンプルサイズ、乱数の性質などについて説明がされています。
緑本は、タイトルから想像できる通り、経済学や心理学の分野での統計の利活用についてメインで説明されています。
また、準1級に関しては範囲が広くなるので、公式のワークブックを利用しながら全体感を把握し、深く理解したい分野は個別の書籍を読んで勉強するのが効率的かと思います。
以下は分野ごとの書籍説明になります。

ベイズ

完全独習 ベイズ統計学入門

かなり初学者向けです。

データ解析のための統計モデリング入門

一般化線形モデル・階層ベイズモデルについて説明がされた良書。
実装はWinBUGSを前提としているので、資格勉強とは別にコードを動かしたい場合はPython用の新しい書籍を買った方が良いかもしれません。

多変量解析

多変量解析法入門

回帰分析・主成分分析・クラスター分析など、多変量データの分析方法が網羅的に説明されています。 数式の変形が丁寧なので、理論が非常にわかりやすいのが特徴です。

時系列分析

現場ですぐ使える時系列データ分析

経済・ファイナンスデータの計量時系列分析

1冊目が初学者向け、2冊目はより上級者向け(説明も理論寄り)になると思います。

統計検定1級

レベル

統計学の専門家」という位置付けになります。
個人的な所感としては、試験内容も大学院の入試に近いイメージを持っており、他の級とは毛色が少し異なります。 行列や微分積分を理解していないと試験問題に手をつけるのも難しいと思います。

「実務で統計検定1級の知識が必要か?」と問われると、正直実務で使う機会は少ないと考えています(確率分布から作った統計量の不偏性や一致性を証明する...みたいな設問も1級では出題されますが、業務とはギャップがあります)。
統計検定1級には数理と応用の2種類の試験があり、特に数理の方の試験は上記のギャップが大きいという所感です。
ただ、以下のような観点で他のデータアナリスト・データサイエンティストとの差別化はできますし、価値の高い資格であることに間違いはないと思います。

  • 習得した知識を使って、書籍や論文の内容をインプットし業務に適用する
  • 専門家の視点で他の分析者のやっている業務のレビューを行う

参考書籍

私自身が1級レベルの統計学の知識を持っていないので、より知見のある方の意見やブログ記事を参考にしてもらえると嬉しいです。

こちらの記事では、「統計学の専門性を上げる際に役に立つ書籍」としてtwitterやブログでよく取り上げられるものを紹介するにとどめます。

現代数理統計学の基礎

新装改訂版 現代数理統計学

数理統計学: 基礎から学ぶデータ解析

※補足: この3冊についてはまだ私も通読できていません(3冊目は弊社のデータサイエンティストのマネージャーから紹介してもらいました)。ただ、本記事で紹介したそれ以外の書籍については1回以上読んだものになります。

おわりに

分析者が業務をする上で必要な専門性を身に付けられているかどうかの目安として、統計検定という資格は非常に有用なものだと考えています(とはいえ、転職市場においては「分析を用いて実務でどのような価値を創出しているか」がより大事になってきますし、弊社の中途採用においても資格のみを見て評価にバイアスがかかることが無いようにはしています)。

そんなわけで資格が全てではないですが、受験を考えている方はぜひ本記事を参考にして自己学習していただけると嬉しいです。