IT社員3人組によるリレーブログ

某IT企業に勤める同期3人が、日常で思ったことを記録していきます (twitter: @go_mount_blog)

統計検定のススメ

どうもkoheiです

一気に寒くなりましたね

 

今日は資格「統計検定」のお話をします。

f:id:go-mount:20181210210207j:plain

統計検定とは?

www.toukei-kentei.jp

 

統計検定とは、日本統計学会が認定する統計学に関する知識や活用力を評価する試験です。2011年に発足したばかりで、比較的まだ歴史の浅いものになります。試験は難易度に応じて4級~1級まであります。

 

自分は統計検定2級までは取得しました。まだ準一級以上は勉強中の身です。 

 

データサイエンティストを示す資格はなに?と聞かれたときに、明確にこれ持ってればデータサイエンティストだよっていうものはないですが、統計検定はその中の一つには含まれると思います。

 

試験の種別試験内容

統計検定 1級

実社会の様々な分野でのデータ解析を遂行する統計専門力

「統計数理」と「統計応用」の二種類の試験がある。

統計検定 準1級 統計学の活用力 ─ データサイエンスの基礎
統計検定 2級 大学基礎統計学の知識と問題解決力
統計検定 3級 データの分析において重要な概念を身に付け、身近な問題に活かす力
統計検定 4級 データや表・グラフ、確率に関する基本的な知識と具体的な文脈の中での活用力

  

試験を受ける方法は次の二通り

  • 年二回(例年6月と11月)の試験を指定の会場で受験する
  • CBTと呼ばれるコンピュータ試験を申し込んで受験する(2,3級のみ)

料金は下記の通り。コンピュータ受験のほうがちょっと高いですが、自由に試験タイミングを選べます。

 種類  年二回の会場受験  CBT方式
統計検定 1級 10000円
(統計数理+統計応用の場合。一つなら6000円)
無し
統計検定 準1級 8000円 無し
統計検定 2級 5000円 7000円
統計検定 3級 4000円 6000円
統計検定 4級 4000円 無し

 

2級まで、コンピュータ受験可能ということで、2級まではすべて選択式の問題。

準一級からは記述式の問題も含まれます。

 

なんで受けたの?

データサイエンスというお仕事柄、統計学が関連するシーンは非常に多いです。

例えば、

商品Aについて11月2週間だけキャンペーンを実施したが、既存の場合と売り上げに差があったのか知りたい。効果があるなら今後も続けたい

といったとき、単純に平均値を比較して売り上げが高かったとしても、もともと売り上げ幅にばらつきがあり、たまたまその2週間だけ売り上げが高かった可能性もあります

そこで使うのが統計学です。これまでの売り上げのばらつきまで考慮して、偶然2週間だけ売り上げが伸びたのか、それとも確かな差が出ているので今後キャンペーンを続けるべきか、判断することができます。

 

このように大量データから平均、分散、標準偏差、中央値、確率分布等、統計知識を使った判断が必要になるケースが多く、基本知識として必要な部分が多いと思ったからです。

 

どんな問題があるの?

過去の問題は公式サイトから閲覧可能です。

統計検定2級に関していえば、おおよそは

  • 箱ひげ図、散布図といった図表の読み取り
  • 期待値や確率計算や正規分布、二項分布といった確率分布に関する問題
  • 仮説検定
  • 回帰を使った予測
  • 統計ソフトの結果の読み取り

などが項目として挙げられます。

 

どうやって勉強したの?

 もともと大学時代に勉強していたこともあり、ひたすら過去問にチャレンジしました。 

日本統計学会公式認定 統計検定 2級 公式問題集[2015〜2017年]

日本統計学会公式認定 統計検定 2級 公式問題集[2015〜2017年]

 

が、これは事前に統計知識がある人向けです。あんまりオススメしません。

amazonのレビューも低め。。。)

 

例えば、

{\displaystyle f(x)={\frac {1}{\sqrt {2\pi \sigma ^{2}}}}\exp \!\left(-{\frac {(x-\mu )^{2}}{2\sigma ^{2}}}\right)\quad (x\in \mathbb {R} )}

をみて、「あーこれ、正規分布ね。」

くらいは知ってる前提だと思います。

 

正規分布とかよくわかりません、というところから勉強するには

まずこうした基礎知識を勉強する必要があります。

かといって、統計学の教科書とか見だすと数式の羅列であまり面白くありません。

 

統計学は当然数式の羅列な部分はあるのですが、確率という概念を扱う以上、まずイメージの湧きやすい入門書から入って感覚的につかむことをお勧めします。

 

ネット上でも有名な本としては、このあたりでしょうか

マンガでわかる統計学 素朴な疑問からゆる~く解説 (サイエンス・アイ新書)

マンガでわかる統計学 素朴な疑問からゆる~く解説 (サイエンス・アイ新書)

 

 

完全独習 統計学入門

完全独習 統計学入門

 

 

役に立った?

とりあえずの2級でしたが、出題範囲はある程度統計学の内容を網羅しているので、全体の知識整理になります。

とくに検定の知識は実務でも利用するケースが多く、どのようなデータに対して、どんな検定手法を使うべきか、考えるよい材料になりました。

 

まとめ

ということで、今日は統計検定について書いてみました。

データサイエンティストを目指す人にとっても、またそうでない人にとっても統計学は関わることが多い学問だと思います。

普段何気なく、平均値とか比較している方、少し統計入門の本を読んでみつつ、興味があれば試験を受けてみてはいかがでしょうか?

 

ではでは