ベルヌーイ分布とは

ベルヌーイ分布は、結果が「成功」か「失敗」のいずれか2つの排他的な事象しかあり得ない試行の結果を表す、離散確率分布のことです。

ベルヌーイ分布の概要と目的

ベルヌーイ分布(Bernoulli Distribution)は、統計学や機械学習において、最も単純でありながら非常に重要な確率分布の一つです。これは、1回限りの試行(ベルヌーイ試行)の結果をモデル化するために使用されます。この試行では、成功(例:コインの表が出る)の確率をp、失敗(例:コインの裏が出る)の確率を1−pと定義します。

主な目的は、成功か失敗かの二者択一の結果を持つ事象の確率をシンプルに表現することです。これにより、二項分布などのより複雑な確率分布の基礎となり、多くのモデルの出発点となります。

ベルヌーイ分布の数学的表現

ベルヌーイ分布の確率質量関数(Probability Mass Function: PMF)は、以下の式で表されます。

 P(X=k) = p^k (1-p)^{1-k} \quad \text{for } k \in {0, 1}

  • X: ベルヌーイ試行の結果を表す確率変数。
  • k: 試行の結果。k=1が「成功」、k=0が「失敗」を表します。
  • p: 成功の確率。0≤p≤1

この式は、以下のことを意味します。

  • 「成功」する確率(k=1)はpです。
  • 「失敗」する確率(k=0)は1−pです。

ベルヌーイ分布の期待値(平均)と分散は、それぞれ以下のようになります。

  • 期待値: E[X]=p
  • 分散: Var(X)=p(1−p)

ベルヌーイ分布の具体例と応用

ベルヌーイ分布は、日常生活やIT分野の様々な事象をモデル化するのに利用できます。

  • 例1: コイントス
    • コインの表が出ることを「成功」(k=1)、裏が出ることを「失敗」(k=0)と定義します。
    • 公平なコインであれば、成功の確率p=0.5のベルヌーイ分布に従います。
  • 例2: スパムメールの判定
    • 送られてきたメールが「スパムである」(成功)か、「スパムでない」(失敗)かを判定するタスクは、ベルヌーイ分布でモデル化できます。
    • この場合、pは、あるメールがスパムである確率を表します。
  • 例3: サービスの利用
    • あるユーザーが特定のウェブサービスに「登録する」(成功)か、「登録しない」(失敗)かを予測する際にも、この分布が使えます。

ベルヌーイ分布は、二者択一の結果を扱うシンプルなモデルですが、これを複数回繰り返す試行(例:10回コイントスする)を扱う二項分布の基礎となります。また、ベイズの定理やロジスティック回帰分析といった、より高度な統計モデルや機械学習アルゴリズムの理解にも不可欠な概念です。

関連用語

機械学習 | 今更聞けないIT用語集
ベイズ最適化 | 今更聞けないIT用語集
AIソリューション

お問い合わせ

システム開発・アプリ開発に関するご相談がございましたら、APPSWINGBYまでお気軽にご連絡ください。

APPSWINGBYの

ソリューション

APPSWINGBYのセキュリティサービスについて、詳しくは以下のメニューからお進みください。

システム開発

クラウドネイティブ技術とアジャイル手法を駆使し、市場投入スピード(Time-to-Market)を最大化。「進化し続けるアプリケーション」を開発します。初期リリースを最速化し、拡張性と柔軟性を備えた、ビジネスの成長に追従できるアプリケーションを開発します。

DX・AI戦略支援

「何から手を付けるべきか分からない」「AIを導入したいが、費用対効果が見えない」といった経営課題に対し、技術とビジネスの両面から解を導き出します。 絵に描いた餅で終わる戦略ではなく、エンジニアリングの実装能力に基づいた、「実現可能で、勝てる技術戦略」を策定します。


リファクタリング・リアーキテクチャ

「システムが古くて改修できない」「障害が頻発する」といった技術的負債を解消します。既存資産の徹底的な診断に基づき、コードのクリーン化(リファクタリング)や、クラウドへの移行(リアーキテクチャ)を行い、システムの寿命を延ばしコストを最適化します。