2022年12月に統計検定 データサイエンス基礎を受験し無事合格した。本記事では難易度や具体的にどのように勉強していったかについてまとめてある。
文系が統計検定データサイエンス基礎に合格した話
勉強法
統計検定 データサイエンス基礎を勉強するにあたり、ポイントが大きく2つある。それは①統計の知識と②Excelでのデータハンドリングである。
①統計の知識に関しては、統計検定2級程度の知識があれば十分だと言える。事前に統計検定2級を取得できていれば申し分ないが、もしなくても3級レベル(高校レベル)の確率の知識があれば簡単に補うことができる。
オススメは以下の本である。一般向けに書かれた本であるため表現は平易でありながら、重要なポイントをしっかりと抑えてある。この本の内容を一通り理解しておけば、データサイエンス基礎に合格できるだけのレベルに達することができる。
予想学習時間:20時間
②Excelでのデータハンドリング
目安としては、ピポットテーブルを難なく作成できるスキル。ピポットテーブルが使えなくとも答えにたどり着くことができるが、問題数に対する時間を考えるとやはりピポットテーブルが使えた方が望ましい。
ピポットテーブルが意外に必要な関数や小技は以下の記事がとても参考になる。
出題メモ
当日出題された内容のメモを簡単に残しておく。
出題テーマと内容
[1]店舗売上→ソート、累積度数、パレード図
[2]人口→1万人あたり、相関係数、単回帰
[3]医療→69歳以下、既往化、重症化、相関係数、条件付き確率、and、クラーメルの連相関係数
[4]不良品→期待値、二項分布の分散、ベイズの定理
[5]歩数→ピボット、母分散、平均、欠損値
[6]解かなかったやつ→信頼区間
[7]企業利益→従業員一人あたりの利益、割合、四分位数
[8]テキスト→ピボット、絶対度数
・大問8つ(4〜5問/大問)で90分と時間が厳しい
・ピボットテーブルの活用が重要
・クラーメルの連相関係数の定義や、四分位数のExcel関数(四分位数)は問題に記載されていた