メニュー
yu-to
管理者
本ブログを運営しているyu-toと申します。

高校数学の解説や公務員試験問題の解説、データサイエンスについての記事を書いていきます!

「データサイエンス×教育」に興味があり、日々勉学に励んでいます。

少しでも役に立つ情報の発信をしていきますのでぜひ読んでください。

また、同志からのお声がけはとても励みになります。ぜひ、コメントやメール、SNS等でご連絡ください!
カテゴリー
統計学初学者サポートこちらをクリック

【統計学の基礎】ポアソン分布

目次

データアナリストへの道

少し数字に強い理系大学卒から駆け出しデータアナリストになるまでに、実際に読んだ50冊以上の本から厳選して、基本的な理論から実践的スキルまでを身につけられるようにデータ分析初学者向けにまとめました。>>記事を読む

ポアソン分布とは

ポアソン分布は、一定の時間内や空間内に起こる稀な事象の発生回数をモデル化する確率分布です。

この分布は特に、低確率(\(p\) が小)で起こる出来事の回数(\(n\) が大)を予測する際に有用です。本記事では、ポアソン分布の特徴、基本式、そして実際の応用例について解説します。

ポアソン分布の式

$$P(X = k) = \frac{{\lambda^k e^{-\lambda}}}{{k!}}$$

  • \(P(X = k)\):事象が \(k\) 回発生する確率を示します。
  • \(\lambda\):一定期間内の平均発生回数(事象の期待値)を示します。
  • \(k\):事象の発生回数で、\(0, 1, 2, …\) などの非負整数です。
  • 期待値:ポアソン分布の期待値(平均)は \(\lambda\) です。
  • 分散:分散も \(\lambda\) です。

※期待値と分散は、それぞれの公式からも求められますし、モーメント母関数から求めることも可能です。

ポアソン分布の特徴

ポアソン分布は、以下のような特徴を持ちます。

  • 稀な事象に対する分布
    短い期間や限られた空間内で稀に発生する事象(例えば、交通事故、電話の着信回数など)を表現するために用いられます。
  • 非負整数の発生回数
    ポアソン分布は、ある特定の期間内に何回発生するか(0回、1回、2回…)という非負整数の回数を扱います。
  • 平均発生率 \(\lambda\)
    事象が発生する平均回数 \(\lambda\)(ラムダ)が分布の唯一のパラメータです。この値が大きくなると、事象がより頻繁に発生するようになります。また、\(\lambda\) により分布が決まります。
  • 時間や空間が独立
    ポアソン分布では、異なる時間や空間での発生は独立であり、一つの発生が別の発生に影響を与えません。

ポアソン分布の導出

ポアソン分布の導出は、二項分布から派生する形で得られます。

二項分布は、ある特定の試行回数 \(n\) に対して、成功確率 \(p\) の事象が \(k\) 回発生する確率を表しますが、ポアソン分布は、非常に少ない確率で多数回発生する事象に対して使われます。具体的には、低確率かつ大きな試行回数に対する近似として導かれます。

STEP
二項分布の式

\(P(X = k) = \binom{n}{k} p^k (1 – p)^{n – k}\)

  • \(n\):試行回数
  • \(k\):成功回数
  • \(p\):各試行での成功確率
  • \(\binom{n}{k}\):二項係数で、\(k\) 回成功する組み合わせの数
STEP
試行回数 \(n\) が大きく、成功確率 \(p\) が小さいと仮定する
  • 試行回数が非常に大きい:\(n\to\infty\)
  • 成功確率は非常に小さく:\(p\to 0\)
  • 平均発生回数:\(np = \lambda\) となるように設定する。
STEP
二項分布を再定義する

これらの条件のもとで、二項分布の確率をポアソン分布に近似するために以下のように式を変形していきます。

$$P(X = k) = \binom{n}{k} p^k (1 – p)^{n – k}$$

ここで、\(p = \frac{\lambda}{n}\) とし、 \(n \to \infty\) の極限を考えます。このとき、式は次のようになります。

$$P(X = k) = \frac{n!}{k!(n-k)!} \left(\frac{\lambda}{n}\right)^k \left(1 – \frac{\lambda}{n}\right)^{n-k}$$

STEP
\(n \to \infty\) の極限をとる

次に、 \(n\) が非常に大きい場合の近似を適用します。

$$\frac{n!}{k!(n-k)!} \approx \frac{n^k}{k!}$$

\((1 – \frac{\lambda}{n})^{n-k}\) の近似

$$\left(1 – \frac{\lambda}{n}\right)^n \to e^{-\lambda} \quad \text{($n \to \infty$)}$$

この結果、式全体は次のようになります。

$$P(X = k) = \frac{\lambda^k e^{-\lambda}}{k!}$$

ポアソン分布の応用例

ポアソン分布は多くの実世界の問題に応用されます。以下に、いくつかの代表的な応用例を挙げます。

電話センターでの着信回数

ポアソン分布は、電話センターで一定の時間内に着信が何回あるかをモデル化するために使われます。例えば、\(1\) 時間あたりに平均 \(10\) 件の着信がある場合、\(1\) 時間に \(20\) 件以上の着信がある確率をポアソン分布で計算できます。

交通事故の発生

ある特定の地域で、\(1\) 日に発生する交通事故の回数を予測するためにポアソン分布が使われます。平均して \(1\) 日に \(3\) 件の事故が発生する地域で、\(1\) 日に \(5\) 件以上の事故が発生する確率を計算することができます。

製造業における欠陥品の発生

製造業では、一定の期間に発生する欠陥品の数をポアソン分布でモデリングします。例えば、\(1\) 日あたりに発生する欠陥品の平均が \(2\) 個の場合、\(1\) 日に \(3\) 個以上の欠陥品が発生する確率をポアソン分布を使って計算できます。

自然現象の発生

自然現象(例えば、一定期間内に観測される地震の回数や、ある森林内での動物の目撃回数など)のモデル化にもポアソン分布が使われます。

おわりに

ポアソン分布は、一定の時間や空間内で発生する稀な事象の回数をモデル化するための強力なツールです。

特に、事象が独立して発生する場合に有効であり、多くの分野で利用されています。ポアソン分布の特徴とその式を理解することで、実際のデータ分析や確率計算に応用できる場面が広がります。

さいごまで読んでいただきありがとうございました!

このブログは統計学を学びたい学生/社会人向けに記事を書いています。

【最新】こちらの記事がおすすめ!

>>

  • URLをコピーしました!
目次