本文总结了概率论的基础知识,主要是一些定义。
概率空间
事件域
定义 1:对于试验 S,样本空间为 Ω,用 F 表示 Ω 的某些子集构成的集合,如果 F 满足下面的条件,就称之为 Ω 的事件域或者 σ 域:
- Ω∈F
- A∈F⟹Aˉ∈F
- Aj∈F⟹∪j=1nAj∈F
这样,我们称 F 中的元素为事件,(Ω,F) 为可测空间。也就是说 F 中的每个元素(都是集合)是可测的。
概率测度
补充一下测度的知识:
数学上,测度(Measure)是一个函数,它对一个给定集合的某些子集指定一个数,这个数可以比作大小、体积、概率等等。 传统的积分是在区间上进行的,后来人们希望把积分推广到任意的集合上,就发展出测度的概念,它在数学分析和概率论有重要的地位。
接下来在可测空间上引入概率测度。
定义 2:设 (Ω,F) 是可测空间,P 是定义在 F 上的函数,如果 P 满足下面的条件,就称之为 F 上的概率测度:
- 非负性:∀A∈F,P(A)≥0
- 完全性:P(Ω)=1
- 可列可加性:对于 F 中互不相容的事件 A1,A2,...,P(∪j=1∞Aj)=∑j=1∞P(Aj)
概率测度简称概率,我们称 (Ω,F,P) 为概率空间。
对于 A⊂Ω,如果 P(A)=1,就称 A 以概率 1 发生或者几乎处处发生,或者几乎必然(almost surely, 反义词是 almost never)。维基百科 举了几个很好的例子,比如,向边长为 1 的靶子扔飞镖,用 A 表示『击中对角线』,B 表示『不击中对角线』。A 发生的概率为 0,但是可能发生,因此叫『几乎不发生』,B 发生的概率为 1,但是可能不发生,因此叫『几乎必然』。这在连续性事件概率模型中是常见的,就像在数轴上取一个点,取中每个点的概率均为 0,但是仍然是有可能发生的。
将任意事件变换为不相容事件
对于任何概率测度存在的的子集 A1,A2,...(无需互不相容),定义 A0=∅,并且:
Bj=Aj−∪i=1j−1Ai,j=1,2,...
则:
- Bj 互不相容,且测度存在
- 可列并 ∪j=1nBj=∪j=1nAj,j=1,2,...
首先证明 Bj1 与 Bj2 互不相容(不妨设 j1<j2):
Bj1∩Bj2=(Aj1−∪i=1j1−1Ai)∩(Aj2−∪i=1j2−1Ai)=∅
结果等于空集是很显然的,因为左边的集合一定是 Aj1 的子集,而右边的集合又一定不包含 Aj1 中的任何元素。
然后证明第二条性质,采用归纳法证明:
奠基:
∪j=11Bj=A1−A0A0=∅A1
∪j=12Bj=(A2−A1)∪(A1−A0)A0=∅(A2−A1)∪A1=A2∪A1
归纳:
已知
∪j=1k−1Bj=∪j=1k−1Aj
则有:
∪j=1kBj=(Ak−∪j=1k−1Aj)∪(∪j=1k−1Aj)=∪j=1kAj
概率的性质
性质 1:P(A−B)=P(A)−P(B)
证明:
P(A)=P(A−B+B)=P(A−B)+P(B),P(B)≥0
性质 2:P(A∪B)=P(A)+P(B)−P(A+B)
证明:
P(A∪B)=P(A+AˉB)=P(A)+P(AˉB)=P(A)+P(AˉB)+P(AB)−P(AB)=P(A)+P(B)−P(A+B)
性质 3:P(∪i=1nAi)≤∑i=1nP(Ai)
证明:
由性质 2 不断进行归纳即可得到。
**性质 4:**Jordan 公式:pk=∑1≤j1<j2<⋯<jk≤nP(Aj1Aj2Aj3⋯Ajk),即是从 n 个事件中选取 k 个的概率总和。有 P(∪i=1nAi)=∑k=1n(−1)k−1pk,便于记忆:奇整偶负。
证明:
引入示性函数,对于事件集合 A,对所有样本空间 Ω 中的元素 ω,在 A 中则取 1,否则取 0:
IA(ω)={1,ω∈A0,ω∈/A∀ω∈Ω
现在要证明:
P(∪i=1nAi)=k=1∑n(−1)k−11≤j1<j2<⋯<jk≤n∑P(Aj1Aj2Aj3⋯Ajk)
就是要证明:
I∪i=1nAi(ω)=k=1∑n(−1)k−11≤j1<j2<⋯<jk≤n∑IAj1Aj2Aj3⋯Ajk(ω),∀ω∈Ω
证明过程如下:
I∪i=1nAi(ω)=1−I∪i=1nAi(ω)=1−I∩i=1nAi(ω)=1−IA1(ω)IA2(ω)⋯IAn(ω)=1−[1−IA1(ω)][1−IA2(ω)]⋯[1−IAn(ω)]=l0k=1∑n(−1)k−11≤j1<j2<⋯<jk≤n∑IAj1Aj2Aj3⋯Ajk(ω),∀ω∈Ω
常用分布
泊松分布
泊松分布的概率分布为:
P(X=k)=k!λke−λ,k=1,2,⋯,n,⋯
它的均值和方差分别为:
E(X)=λD(X)=λ
证明过程需要用到 ea 的泰勒展开:
ea=t=0∑∞t!at
E(X)=k∑kP(X=k)=k=0∑∞kk!λke−λ=e−λk=0∑∞kk!λk=e−λk=1∑∞kk!λk消去阶乘中的一个ke−λk=1∑∞(k−1)!λk移出一个λλe−λk=1∑∞(k−1)!λk−1t=k−1λe−λt=0∑∞t!λt=λe−λeλ=λ
D(X)=E∣(X−μ)2∣=k∑(k−μ)2P(X=k)=
发现应算算不下去,改用:
D(X)=E(X2)−[E(X)]2
E(X2)=k∑k2P(X=k)=k=0∑∞k2k!λke−λ
发现 k2 不太好消,改用 k(k−1):
E[X(X−1)]=k=0∑∞k(k−1)k!λke−λ=e−λk=2∑∞(k−2)!λk=λ2e−λt=0∑∞t!λt=λ2e−λeλ=λ2
E(X2)−E(X)=λ2
E(X2)=λ2+λ
D(X)=E(X2)−[E(X)]2=λ2+λ−λ2=λ
练习
维纳过程
W(t) 是 c2=σ2 的维纳过程,X(t)=W2(t)。
则有均值函数
mX(t)=E{W2(t)}=D[W(t)]+E[W(t)]2这里假设W(0)=0,则W(t)∼N(0,σ2t)σ2t
自相关函数
RX(s,t)=E{W2(s)W2(t)},假设s>t想办法利用独立增量过程的性质E{[W(s)−W(t)+W(t)]2⋅W2(t)}=E{[W(s)−W(t)]2W2(t)+2[W(s)−W(t)]W3(t)+W4(t)}=E{[W(s)−W(t)]2}⋅E[W2(t)]+2E[W(s)−W(t)]⋅E[W3(t)]+E[W4(t)]=σ2(s−t)⋅σ2t+0+E[W4(t)]
单独来计算一下 E[W4(t)],可以参考 Proving E[X4]=3σ4,因为:
W(t)−W(0)W(t)∼N(0,σ2t)∼N(0,σ2t)
有:
fW(t)(x)=2πσ2t1exp{−2σ2tx2}
进而:
E[W4(t)]=∫−∞+∞fW(t)(x)⋅x4dx=∫−∞+∞2πσ2tx4exp{−2σ2tx2}dx=∫−∞+∞22πσ2tx3exp{−2σ2tx2}dx2=∫−∞+∞−2πx3σ2texp{−2σ2tx2}d[−2σ2tx2]=∫−∞+∞−2πx3σ2tdexp{−2σ2tx2}分部积分{−2πx3σ2t⋅exp{−2σ2tx2}}∣∣∣∣∣−∞+∞−∫−∞+∞exp{−2σ2tx2}d{−2πx3σ2t}=∫−∞+∞2π3x2σ2texp{−2σ2tx2}dx=∫−∞+∞22π3xσ2texp{−2σ2tx2}dx2=∫−∞+∞−2π3xσ2tσ2texp{−2σ2tx2}d[−2σ2tx2]=∫−∞+∞−2π3xσ2tσ2tdexp{−2σ2tx2}分部积分{−2π3xσ2tσ2t⋅exp{−2σ2tx2}}∣∣∣∣∣−∞+∞−∫−∞+∞exp{−2σ2tx2}d[−2π3xσ2tσ2t]=−∫−∞+∞−2π3σ2tσ2texp{−2σ2tx2}dx=3σ4t2∫−∞+∞2πσ2t1exp{−2σ2tx2}dx=3σ4t2
这里用到了 Gaussian integral:
∫−∞∞e−x2dx=π
∫−∞∞e−(2σ2tx)2d2σ2tx=π
2σ2t1∫−∞∞e−(2σ2tx)2dx=π
∫−∞∞e−(2σ2tx)2dx=π2σ2t
复随机过程
已知实随机过程 X(t) 具有自相关函数 RX(s,t),令
Y(t)=X(t+a)−X(t)
求 RY(s,t):
RY(s,t)=E[Y(s)Y(t)]=E{[X(s+a)−X(s)][X(t+a)−X(t)]}=E[X(s+a)X(t+a)−X(s+a)X(t)−X(s)X(t+a)+X(s)X(t)]=RX(s+a,t+a)−RX(s+a,t)−RX(s,t+a)+RX(s,t)
二阶矩过程
二阶矩过程的均值函数和相关函数必然存在。
定义: 随机过程 {X(t),t∈T},如果 ∀t∈T,E[X2(t)]<∞,则称 {X(t),t∈T} 是二阶矩过程。
{E[X(t)]}2=E[X2(t)]−D[X(t)]<∞
所以:
E[X(t)]<∞
均值函数存在。
R(s,t)=E[X(s)X(t)]=...
这里需要用到柯西不等式:
(u⋅v)2≤(u⋅u)(v⋅v)(i=1∑nxiyi)2≤i=1∑nxi2j=1∑nyj2(∫abf⋅gdx)2≤∫abf2dx∫abg2dx
回到上面的式子继续证明,我们用到第二个柯西不等式,有:
E2(XY)≤E(X2)E(Y2)
R(s,t)=E[X(s)X(t)]≤{E[X2(s)]E[X2(t)]}21<∞
所以自相关函数存在。
在随机过程是二阶矩的前提之下,相关函数 RX(s,t) 具有以下性质:
-
共轭对称性
RX(s,t)=RX(t,s),s,t∈T
很显然,因为存在,所以相等
-
非负定性
对 ∀n≥1,∀t1,⋯,tn∈T 和 ∀λ1,⋯,λn,有:
k=1∑nl=1∑nRX(tk,tl)λkλl≥0
证明:
=====k=1∑nl=1∑nRX(tk,tl)λkλlk=1∑nl=1∑nE[X(tk)λkX(tl)λl]E[k=1∑nl=1∑nX(tk)λkX(tl)λl]E[[k=1∑nX(tk)λk][l=1∑nX(tl)λl]]E⎣⎡[k=1∑nX(tk)λk][l=1∑nX(tl)λl]⎦⎤E⎣⎡∣∣∣∣∣k=1∑nX(tk)λk∣∣∣∣∣2⎦⎤