メニュー
yu-to
管理者
本ブログを運営しているyu-toと申します。

高校数学の解説や公務員試験問題の解説、データサイエンスについての記事を書いていきます!

「データサイエンス×教育」に興味があり、日々勉学に励んでいます。

少しでも役に立つ情報の発信をしていきますのでぜひ読んでください。

また、同志からのお声がけはとても励みになります。ぜひ、コメントやメール、SNS等でご連絡ください!
カテゴリー
統計学初学者サポートこちらをクリック

【データサイエンス】データアナリストおすすめ本

目次

データアナリストってなにをするの?

データアナリストに似た職業でデータサイエンティストやデータエンジニアという職業もあります。

ビジネスにおけるそれぞれの立ち位置は会社の規模によっても様々です。データアナリストという立場でありながらデータ収集やデータの編集などを行う場合もありますし、データサイエンティストとして経営者などのステークホルダーとコミュニケーションをとる場合もあります。

以下の図を見て、「データアナリストはデータ編集を行うSQLの勉強はしなくてもいいんだ!」と変な解釈はしないでください。大前提としてデータを扱う人はどうであれ常に勤勉である必要があります。常に学ぶ姿勢を忘れずに、下の図はあくまでも参考程度に思ってください。

データアナリストに必要なスキル

データアナリストに必要なスキルは、ビジネスの流れに応じて変わります。

問題定義ではビジネス理解問題解決能力が重要です。

問題定義やその解決方法を見出すためには、データ分析が必要になる場合があります。
データ分析では統計学の基礎統計学の応用(統計検定2級程度)的な知識が求められます。

最後に、結果を伝えるためにはデータ可視化のスキルが活躍します。各フェーズでの適切なスキル活用が、成功につながります。

また、機械学習モデルの構築やモデルのチューニングなど、データサイエンティストになるためにはさらなる高度なプログラミングスキルが必要になります。今回はデータアナリストに焦点を当てているため軽めに触れています。

  • 問題解決能力
  • ビジネスの理解
  • 統計学の基礎
  • 統計学の応用
  • データ可視化
  • プログラミングスキル

必要スキル①:問題解決能力

データアナリストは、問題を定義し、それに対する分析アプローチを考え、最適な解決策を見つけ出すことが求められます。そのため、論理的な思考力やデータに基づく意思決定能力が必要です。

データアナリストとして、必要な意思決定とは?必要な思考力とは?そういった疑問に対する答えをくれる書籍を選びました。

読みやすさ★★★★★:データ分析・AIを実務に活かす データドリブン思考

どれだけデータ分析に長けていても、それを正しく伝える力がないと意味がありません。そもそもデータ分析を用いた意思決定に懐疑的な意向を示す会社も少なくありません。場合によっては、そういった文化を作るところから始める必要があります。この本はそのための手順書といっても過言ではないでしょう。

1章 データ分析をビジネスの成功につなげる
2章 データドリブン思考を身につける
3章 データドリブンな企業に変革する

読みやすさ★★★★☆:AI・データ分析プロジェクトのすべて

データ分析を進めるための手順がわかるだけでなく、データ分析者と企業との意向の違いをどう埋めていくのかがわかりやすく示されています。

データ分析を用いたプロジェクトマネジメントの内容でもあるので「必要スキル②:ビジネスの理解」とも重複する部分もありますが、データ分析プロジェクトを進めるためには、”データ収集よりも課題設定から”といった切り口から章が始まるくらい問題解決力に関わる内容も含まれています。

第1部 プロジェクトの準備
第2部 プロジェクトの入り口
第3部 プロジェクトの実行
第4部 プロジェクトの出口

読みやすさ★★★☆☆:分析者のためのデータ解析学入門

データ分析には欠かせない「データの見方」を図を用いながら解説しています。

後半に行くにつれて、クラスタリングや回帰分析などの統計手法の説明も含まれるため、少し難しく感じるかもしれません。カラーでの図が特徴的でサラッと見ることができるのでおすすめです。

第一部 データの性質に関する基礎知識
観測は簡単ではない/誤差とばらつき/データに含まれるバイアス/交絡因子と因果関係/データサンプリングの方法論

第二部 データの分析に関する基礎知識
データの扱い/一変数データの振る舞い/変数の間の関係を調べる/多変量データの解釈する/数理モデリングの要点

第三部 データの解釈・活用に関する基礎知識
データ分析の罠/データ解釈の罠/データ活用の罠

必要スキル②:ビジネスの理解

単にデータを分析するだけでなく、ビジネス全体の状況を理解し、そのデータがどのようにビジネスに役立つのかを考えるスキルが必要です。ビジネスの文脈を理解することで、データに基づいた戦略的な意思決定を支援できます。

また、単にビジネスのことを理解するだけでなく、ご自身の業界の理解も重要です。データアナリストとしてステークホルダーとコミュニケーションをとる上で、業界ごとの”当たり前”や”タブー”などの肌感を持っておくことはとても重要です。

読みやすさ★★★★☆:プロダクトマネジメントのすべて

データ分析をビジネスに活用したいなら外せない1冊です。
質の高いデータ分析は質の高いプロダクトからです。この本は、質の高いプロダクトを組み立てるための基本要素が詰め込まれたものとなっています。

プロダクトの重要要素は、Core/Why/What/Howで構成されています。私自身、個人、会社の組織内であってもプロダクトやプロジェクトを立ち上げる時はこの本で紹介されている構成を活用しています。

PartⅠ プロダクトの成功
PratⅡ プロダクトを育てる
PartⅢ ステークホルダーをまとめ、プロダクトチームを率いる
PartⅣ プロダクトの置かれた状況を理解する
PartⅤ プロダクトマネージャーと組織の成長
PartⅥ プロダクトマネージャーに必要な基礎知識

読みやすさ★★★★☆:データ分析の教科書

1つ上の『プロダクトマネジメントのすべて』と重複する部分はありますが、こちらの本はデータ分析に特化したものになっています。

データ収集/前処理、統計解析、結果報告のためのレポーティング&プレゼンについて説明されているのが特徴的です。統計解析については難しい数式が省かれているため、数式に対して苦手意識が強い方も見やすくなっている一方で、深いところまで理解したい人はこのあとの「必要なスキル③:統計学の基礎」や「必要なスキル④:統計学の応用」で学ぶと良いでしょう。

第1章 DX時代のデータ利活用
第2章 「データ分析」ステップの全体像
第3章 【STEP1&2】解くべき問いの明確化・分析ストーリー作成
第4章 データ分析に必要なビジネス知識(前半)
第5章 データ分析に必要なビジネス知識(後半)
第6章 【STEP3】データ収集・前処理
第7章 【STEP4】データの比較を通じた解釈・考察
第8章 データ分析の幅を広げる「統計解析」
第9章 【STEP5】レポーティング&プレゼン
第10章 AI・機械学習の基礎理解

読みやすさ★★★☆☆:マネジメント 基本と原則

マネジメントを本格的に学びたいならこの1冊。

データアナリストとしてプロダクトやプロジェクトを実行していく上で、全体像を俯瞰して見る力は重要なスキルとなります。

この本を読むことで、企業とは?事業とは?事業の目標とは?を知ることができ、経営者や管理職との会話をスムーズなものにしてくれるでしょう。

第1章 企業の成果
第2章 公的機関の成果
第3章 仕事と人間
第4章 社会的責任
第5章 マネージャー
第6章 マネジメントの技能
第7章 マネジメントの組織
第8章 トップマネジメント
第9章 マネジメントの戦略

必要スキル③:統計学の基礎

データアナリストとして、統計学は非常に重要なスキルです。データの分析や解釈において、統計的手法を用いて結果を導き出すことが求められます。回帰分析、仮説検定、確率分布などの基本的な統計的概念を理解していることが必須です。

ここでの「統計学の基礎」というのは、高校数学で習うような統計学や統計学を学ぶための線形代数や微積分などを指しながら書籍を紹介していきます。

読みやすさ★★★★★:完全独習統計学入門

超基礎です!中学数学だけで理解できるように作られていますし、ところどころに練習問題が設けられているので、統計学を今からまさに学び始めるという方にはぴったりの本となっています!

第1部 速習!標準偏差から検定・区間推定まで
第2部 観測データから背後に広がる巨大な世界を推測する

読みやすさ★★★★★:確率分布と統計的推測

こちらは高校数学Bの確率分布と統計的推測という単元についての本となります。

本来高校生向けの本なだけあってかなりわかりやすいですし、実際に問題を解きながら少しずつ理解することができます。

平均、分散、標準偏差/平均と分散の公式/平均と分散の公式の重要な応用/二項分布/標準正規分布/正規分布と標準正規分布/二項分布と正規分布/標本調査と標本平均/標本平均と正規分布/母平均の推定/母比率の推定/確率密度関数の定義と目的/連続型確率変数の平均と分散/補足

読みやすさ★★★★☆:妥協しないデータ分析のための微積分+線形代数入門

統計学でよく見かける数学がすべてこの1冊に!

因子分析や主成分分析で活用される線形代数、確率分布を詳細に知るために活用される微積分など、統計学を学ぶために必要な数学を学ぶことができます。

大学時代などで一度学んだ方も、さらっと復習できるので1冊持っていて損はありません。

第1部 線形代数の基礎
第2部 微分積分の基礎
第3部 微分積分とデータ分析
第4部 線形代数とデータ分析
第5部 微分積分と線形代数を活用したデータ分析

読みやすさ★★★☆☆:完全独習 ベイズ統計学入門

ベイズ統計学は本来はすごく奥が深く難しい分野です。

しかし、この本については難しい数式がほとんど書かれておらず、前半に関してはほぼほぼ図と簡単な比の計算で説明されています。

ご自身の会社でもすぐに応用できる場面があるかもしれないくらいわかりやすい本になっています。ただ、根気のいる分野なので、データ分析を学ぶ際の”最初の1冊”には適しません。

第1部 速習!ベイズ統計学のエッセンスを理解する
第2部 完全独習!「確率論」から「正規分布による推定」まで

読みやすさ★★★☆☆:効果検証入門

こちらの本は「因果推論」という分野の入門書です。

企業は、事業の発展に向けて日々様々な施策をうっています。その施策の効果があったのか否かを検証することはその事業の存続にも関わる大きなテーマです。

施策実施の前後で数値を比べればいいじゃん。と思ったあなたはこの入門書を読むべきです。難しさを認識している人もどのようにして検証するのがベストなのかをぜひ学んでみてください。

1章 セレクションバイアスとRCT
2章 介入効果を測るための回帰分析
3章 傾向スコアを用いた分析
4章 差分の差分法(DID)とCausalImpact
5章 回帰不連続デザイン(RDD)

必要スキル④:統計学の応用

データアナリストとして、統計学は非常に重要なスキルです。データの分析や解釈において、統計的手法を用いて結果を導き出すことが求められます。回帰分析、仮説検定、確率分布などの基本的な統計的概念を理解していることが必須です。

ここでの「統計学の応用」というのは、統計検定2級レベルの統計スキルと定義しています。統計検定2級を取得するための書籍を紹介していきます。

読みやすさ★★★☆☆:統計学入門(基礎統計学)

困った時に見る統計学の教科書です。ビジネスで活用できる統計手法に関する解説はほとんどこの1冊にまとまっています。なので、困った時の辞書として持っておくと良いです。

この本を理解するためには、基本的な線形代数や微積分を理解しておく必要があります。また、回帰分析に関する説明が少し浅めであることに注意が必要です。

第1章 統計学の基礎/第2章 1次元のデータ/第3章 2次元のデータ/第4章 確率/第5章 確率変数/第6章 確率分布/第7章 多次元の確率分布/第8章 大数の法則と中心極限定理/第9章 標本分布/第10章 正規分布からの標本/第11章 推定/第12章 仮説検定/第13章 回帰分析

読みやすさ★★☆☆☆:日本統計学会公式認定 統計検定2級 公式問題集[CBT対応版]

統計検定2級の過去問題です。統計検定は「意味がない」という意見もネットでは散見されますが、意味があるものにするか否かは自分次第です。

私は2級を取得することで、会社のデータの見方が変わりましたし、与えられた分析結果の有意性を判断できるようになりました。

Part1 統計検定2級受験ガイド
Part2 分野・項目別の問題・解説
Part3 模擬テスト

必要スキル⑤:データ可視化

データを分かりやすく伝えるために、グラフやチャートを用いたデータ可視化のスキルも必要です。

ExcelやTableauなどのビジュアライゼーションツールを使用して、データの傾向やインサイトを視覚的に表現できることが求められます。

グラフやチャートなどを提示するのが目的になってしまうケースを散見します。データの可視化はデータ分析をしたという証明や分析力の証明として使うものではなく、あくまでもステークホルダーにわかりやすく伝えるためのツールであることは忘れてはいけません。

読みやすさ★★★★★:データ可視化の基本が全部わかる本

データ可視化は膨大なデータから意思決定に役立つ洞察を導き出すための必要不可欠なスキルです。

同時に、専門外の方へ知識を伝えたり説得するためのコミュニケーション術としても活用できます。

この本は、情報デザイン、コンピュータサイエンス、データサイエンス、統計学、記号学、インタラクションデザイン、ストーリーテリングなどさまざまな分野に分散しているデータ可視化の知見を統合し、ビジネスの最前線で役立つ内容に整理しています。ツール不要でプログラミング言語に依存しない記述なので、本質的な理解につながる内容です。

読みやすさ★★★★☆:データ視覚化のデザイン

和書でデータビジュアライゼーション・視覚化に鋭く絞った本は日本では殆どなく、一年の歳月をかけて自分で書いてみました。

これまで培ってきたデータ視覚化のノウハウ、ベストプラクティス、アンチパターン等を整理分類してエッセンスを抽出し、具体的なビジネス課題の事例をあげながら、できるかぎり丁寧に解説した本になっています。

必要スキル⑥:プログラミングスキル

データを効果的に操作するために、プログラミングスキルも欠かせません。特に、データ処理や分析に特化したPythonやRのスキルが求められます。また、SQLを使ってデータベースからデータを抽出するスキルも重要です。

高度なプログラミングスキルは、機械学習モデルの構築や機械学習モデルのチューニングなど、大きなデータセットを用いる際に必要なスキルになります。

ビジネスでデータを活用するためには、必要スキル⑥よりも必要スキル①〜⑤を優先的に習得すると良いでしょう。

読みやすさ★★★☆☆:リーダブルコード

リーダブルコードはあくまで「こう書きなさい」と押し付け口調ではなく「こう書いた方がもっとよくなるよ」といった丁寧な語り口で書かれています。

リーダブルコードで優れたコードとは「他の人が読んだ時に、コードの意味を理解するまでの時間を短くできるコード」と定義されている。

第Ⅰ部 表面上の改善
第Ⅱ部 ループとロジックの単純化
第Ⅲ部 コードの再構成
第Ⅳ部 選抜テーマ

読みやすさ★★★☆☆:Kaggleで磨く機械学習の実践力

データアナリストの役割によっては、機械学習の手法を使ってデータのパターンを予測するスキルも求められます。回帰分析、クラスタリング、分類などの基本的なアルゴリズムを理解し、実装できることが重要です。

Kaggleなどで提供されるデータセットを活用してモデルを構築し、実践的な経験を積むのも一つの方法です。

第1章 実務に必要なスキルとは
第2章 Kaggleの概要
第3章 Kaggleを学習ツールに
第4章 ベースライン作成
第5章 特徴量エンジニアリング
第6章 モデルチューニング
第7章 2値分類のコンペ
第8章 回帰問題のコンペ
第9章 データサイエンティストの未来

まとめ

データアナリストになるためには、統計学やプログラミング、データ可視化、ビジネスの理解など、幅広いスキルが必要です。

似たような職業にデータサイエンティストというものがあります。データアナリストとデータサイエンティストの境界線はかなり曖昧です。

また、これらの職業に学びのゴールはありません。

常に、時代の流れに合わせたデータ活用術を学んでいく姿勢こそが最大のスキルと言えるでしょう。

  • URLをコピーしました!
目次