第一章、随机变量
随机变量
w是随机实验的结果,X(w)为随着w的取值变化而变化的变量,就是随机变量。
随机变量由其分布函数来描绘。分布函数为F(x) = P(X<=x);由此推出其密度函数f(x)为F(x)的导数;
随机变量的两个重要数字特征为,期望:EX=xf(x)在实数范围内的积分;方差:VarX=(X-EX)^2的期望=E(X^2)-(EX)^2;记住,泊松分布e^(- λ)* (λ^x)/x!的均值和方差都是λ,而指数分布( λe^(-λx), x>=0 )的均值为1/λ,方差为1/λ^2。
非负随机变量的期望也可由其分布函数获得,即EX=Sum(P(X>=K)) (离散随机变量); 或者EX=(1-F(x))的积分 (连续随机变量)。
联合分布
由多个随机变量的联合分布f(x,y),可得各自的分布:f(x) =在所有可能的y值上的f(x,y)的和。
如果f(x,y)=f(x)*f(y),则称x,y相互独立。相应的就有E(XY)=EX*EY,E(e^X*e^Y)=E(e^X)E(e^Y)等,总之两者都可以扯开算。
协方差Cov(X,Y)=E((X-EX)(Y-EY))=E(XY)-EX*EY,相关系数为Cov(x,y)/sqrt(VarX*VarY)描述X与Y的相关程度。
Var(X+Y)=VarX+VarY+2Cov(X,Y),Var(aX)=(a^2)VarX
变换
矩母函数E(e^(tX))是一种变换。它的n阶导数取t=0就是X的K阶原点矩E(X^n)。
Laplace变换E(e^(-st))是非负的随机变量的一种变换。Laplace变换的n阶导数取s=0乘(-1)^n也是X的K阶原点矩E(X^n)。
指数分布的矩母函数为λ/(λ-t),Laplace变换为λ/(λ+s)。
矩母函数和Laplace变换的一个共同特点是可以用它来求X+Y的分布。当X,Y相互独立时, X+Y的矩母函数可以表示为X的矩母函数和Y的矩母函数的积。通过这个方法可以得到,多个独立的指数分布的和为Γ分布(λ^k)*(x^(k-1))*(e^(-λx))/(k-1)!;泊松分布的和还是泊松分布;正态分布的和还是正态分布。
概率母函数E(s^X)为离散随机变量的另一种变换。它在以后会有用途。
条件概率
当X和Y相互不独立时,它们的依赖性由条件概率表述:f(x|y)=f(x,y)/f(y)。
E(X)=Sum(E(X|Y=y)*P(Y=y))在当随机变量出现轮回的时候,比如求可能倒退的前进平均到达次数时,用递归推导的方法很有用。
指数分布
指数分布的最重要特点就是它的分布是无记忆的,即P(x>s+t|x>=t)=P(x>s)。就是说,指数分布的随机变量未来值的长大情况和它已经长多大一点关系都没有。
失效率
X表示系统的年龄,则f(x)/(1-F(x))表示在年龄为x的系统即将失效的速率。
顺序统计量
在独立的Xi(i:1..n)按大小顺序排列的前提下,它们的联合分布函数为n!*f(xi)的积。
随机过程
随机变量随时间演变,即随机过程。
样本函数x(t)和X(Ti) n维联合分布函数是描述随机过程的两种方法。
随机过程的数字特征为t的函数,包括期望函数u(t)、方差函数D(t)、相关函数r(t1,t2)=E(Xt1*Xt2的共轭)、协方差函数R(t1,t2)。有R(t1,t2)=r(t1,t2)-EXt1*EXt2。
齐次泊松过程
计数过程Nt(在时间段(0,t]内发生的事件的数目)是一个随机过程。
增量为E=λt的泊松分布,且增量独立、平稳的随机过程为齐次泊松过程。
在(0,t]内没有事件的概率为e^(-λt)。
齐次泊松过程的到达时间间隔为独立、同分布的,满足E=1/λ的指数随机变量,即到达是无记忆的。
而由此也可得,第n个事件的来到时刻,即Sum(Xi)为Γ分布。
而如果已知(0,t]上发生了一次事件,则以平稳独立增量的性质,可知这次事件的发生时间在(0,t]上一定是均匀分布的。推广到n个事件发生的条件下,各事件发生时间的顺序统计量有n!/t^n。
如果齐次泊松过程事件的归类和事件发生的时间相关,概率为P(t),那么该类事件的发生依旧为泊松过程,E=λ*P(t)在时间段上的积分。
更新过程
更新函数m(t)=ENt。长时间后,更新发生的速率将等于1/u。
马尔科夫链(时间、状态都离散)
Pij只与当前时刻的状态有关,与以前的状态都无关。
转移概率P平稳的马氏链为时齐马氏链。
C-K方程:P^(m+n)=P^m*P^n
马氏链从某一确定状态进入另一吸收态的概率和平均时间用条件概率/均值列方程,然后求,很方便。
马氏链状态的分类包括:周期/非周期、常返/非常返。
相互互达的状态为一类。类性质是指这样一种性质,只要类中一个状态有此的性质,则类的所有状态就都具有此的性质。周期性和常返性都是类性质。
闭集指集合中的状态都不会转出去的集合。不含闭的真子集的马氏链为不可约马氏链。
不可约有限马氏链状态全正常返。
马氏链状态空间可分解为有限个常返子集和非常返子集之和。
正常返、非周期的状态为遍历态。
马氏链的极限分布是指,不论链从什么状态出发,经过无穷多次跳转后,到达状态j的极限概率总为常数。这样的马氏链为遍历链。Pj为马氏链的极限分布。
如果马氏链不可约、所有状态为遍历态,则它为遍历链。
马氏链的平稳分布是指,存在这样一个状态的概率分布Pj,在状态转换后,状态的概率分布不变。
对不可约、非周期的马氏链而言,有平稳分布正常返遍历链有极限分布。而且,平稳分布就是极限分布。
因为不可约有限马氏链状态全正常返,所以,不可约、非周期、有限的马氏链必有平稳分布。
分支过程建立了子孙后代一代代繁衍的模型。这里,概率母函数P(s)发挥了作用。通过Pn(s)=Pn-1(P(s)),或者Pn(s)=P(Pn-1(s)),就可以求出n代时个体数目的分布概率情况。而它的EXn=(EX1)^n。X0为祖宗,X0=1。当EX1<=1时,群体绝种概率为1,当EX1>1时,绝种概率为s=P(s)在[0,1)上的唯一解。
连续时间马氏链(时间连续、状态离散)
P(Xt+s=j|Xs=i, Xs-1=k, xxx)=P(Xt+s=j|Xs=i),则为连续时间马氏链。
P(Xt+s=j|Xs=i)=Pij(t) 与s无关,则为齐次的马氏链。按定义,齐次马氏链的状态转移与起始点无关,所以它在某一状态的逗留时间为无记忆的。所以必服从qi的指数分布。
描述齐次马氏链的数学表示是转移概率矩阵Pij(t)。
同样有C-K方程:P(s+t)=P(s)*P(t)。
Pij(t)在t=0的右导数qii, qij表示了状态的转移速率。记Q=(qij)为链的转移强度矩阵。这里qii = - qi,因为qi其实是状态的逃离速率,或通过强度。
齐次泊松过程是连续时间马氏链。qii=-λ, qi,i+1=λ。
求齐次链转移概率矩阵Pij(t)的方法是向前方程P’(t)=P(t)Q和向后方程P’(t)=QP(t)。
与离散时间马氏链一样,不可约、有限状态、连续马氏链也有极限概率Pi,而且满足平衡方程:qi*Pi=sum(所有其它状态j的Pj*qji) 。
生灭过程中,状态的变化也符合马氏规律,即只与当前状态有关,而与过去的所有状态都无关。其中,qi,i-1= iu为灭率,qi,i+1=iλ为生率,而qi,i=1-iu-iλ。
通过平衡方程可以得到生灭过程的极限概率Pi+1=(λi/ui+1)Pi。
平稳过程
平稳就是说过程的统计特性不随时间变化而变化。
如果EXt、E(Xt*Xt+s)都与t无关,且EX^2为有限值,称这个过程为宽平稳过程。
如果平稳随机过程在时间趋向无穷大时的时间平均/协方差平均与t无关的话,称该平稳随机过程的期望/协方差具有遍历性。
均值遍历性定理要求离散时间平稳过程的协方差R(n) (n=0,1,2,…直到无穷)的均值为0,连续时间平稳过程的在0到2T上(1-t/2T)*R(t)的积分/T在T趋向于无穷时为0。
推论1,如果|R(t)|在负无穷大到正无穷大上的积分小于无穷大,则均值遍历。
推论2,如果平稳过程在t趋向于无穷大时R(t)->0,则均值遍历。
平稳过程功率谱密度
1