条件付き確率分布

確率論において、条件付き確率分布(じょうけんつきかくりつぶんぷ、: conditional probability distribution)とは、確率変数 XY があり、X の値が特定の値であることを知ったときの Y確率分布のことである。

条件付き累積分布関数・条件付き確率質量関数・条件付き確率密度関数などから、条件付き確率条件付き期待値などが計算できる。

条件付き累積分布関数

確率変数 X と事象 A が与えられたときに P ( A ) > 0 {\displaystyle P(A)>0} の時に条件付き累積分布関数(conditional cumulative distribution function)は以下のように定義する[1]:p. 97

F X | A ( x ) P ( X x A ) P ( A ) . {\displaystyle F_{X|A}(x)\triangleq {\frac {P(X\leq x\cap A)}{P(A)}}.}

条件付き離散確率分布

離散確率変数の場合、条件付き確率質量関数(conditional probability mass function)は P ( X = x ) > 0 {\displaystyle P(X=x)>0} の時に以下のように定義する。

p Y | X ( y x ) P ( Y = y X = x ) = P ( X = x   Y = y ) P ( X = x ) {\displaystyle p_{Y|X}(y\mid x)\triangleq P(Y=y\mid X=x)={\frac {P(X=x\ \cap Y=y)}{P(X=x)}}}

条件付き連続確率分布

連続確率変数で連続確率分布の場合、条件付き確率密度関数(conditional probability density function)は f X ( x ) > 0 {\displaystyle f_{X}(x)>0} の時に以下のように定義する。

f Y ( y X = x ) = f X , Y ( x , y ) f X ( x ) {\displaystyle f_{Y}(y\mid X=x)={\frac {f_{X,Y}(x,y)}{f_{X}(x)}}}

f X , Y ( x , y ) {\displaystyle f_{X,Y}(x,y)} は X と Y の同時分布で、 f X ( x ) {\displaystyle f_{X}(x)} 周辺分布である。

X と Y の確率密度関数は以下の関係が成立する。

f Y ( y X = x ) f X ( x ) = f X , Y ( x , y ) = f X ( x Y = y ) f Y ( y ) {\displaystyle f_{Y}(y\mid X=x)f_{X}(x)=f_{X,Y}(x,y)=f_{X}(x\mid Y=y)f_{Y}(y)}

連続確率分布の条件付き分布の概念は見た目よりも直観的では無い。 f X ( x ) = 0 {\displaystyle f_{X}(x)=0} の時、ボレル-コルモゴロフのパラドックス(英語版)は座標変換に対して確率密度関数が必ずしも不変では無いことを示している。

写像の条件付き確率分布表現

条件付き確率分布 Y | X f ( Y | X ) {\displaystyle Y_{|X}\sim f(Y|X)} は確率論的(: stochastic)な X {\displaystyle X} Y {\displaystyle Y} の対応付けを表現する[2]。一方で写像 Y = f ( X ) {\displaystyle Y=f(X)} は決定論的(: deterministic)に(一意な) X {\displaystyle X} Y {\displaystyle Y} の対応付けを表現する。この写像は条件付き確率分布でも以下のように表現できる[3]

Y | X f ( Y | X ) = δ ( Y f θ ( X ) ) {\displaystyle Y_{|X}\sim f(Y|X)=\delta (Y-f_{\theta }(X))}

すなわちディラックのデルタ関数 δ ( ) {\displaystyle \delta ()} を用いた Y = f θ ( X ) {\displaystyle Y=f_{\theta }(X)} 点でのみ非ゼロの値をもつ確率密度関数として表現できる。

参照

  1. ^ Park,Kun Il (2018). Fundamentals of Probability and Stochastic Processes with Applications to Communications. Springer. ISBN 978-3-319-68074-3 
  2. ^ "stochastic ... mapping from input X to a novel representation Y ... mappings q(Y|X)" Vincent. (2010). Stacked Denoising Autoencoders: Learning Useful Representations in a Deep Network with a Local Denoising Criterion.
  3. ^ "a deterministic mapping from X to Y, that is, representation Y is to be computed by ... q(Y|X;θ) = δ(Y − fθ(X)) (where δ denotes Dirac-delta)" Vincent. (2010). Stacked Denoising Autoencoders: Learning Useful Representations in a Deep Network with a Local Denoising Criterion.
確率の歴史
確率の定義
客観確率
  • 統計的確率
  • 古典的確率
  • 公理的確率
主観確率
確率の拡張
基礎概念
モデル
確率変数
確率分布
関数
用語
確率の解釈
問題
法則・定理
測度論
確率微分方程式
確率過程
情報量
応用
数理ファイナンス
系統学
カテゴリ カテゴリ
  • 表示
  • 編集