随机过程（下）-连续时间过程

泊松过程、生灭过程、更新过程、布朗运动。

泊松过程

大名鼎鼎的泊松过程定义为满足下式的随机过程： $$ \begin{gather} \lim_{h\to 0} P_{k,k+1}(h)=\lambda h,\\ \lim_{h\to 0}P_{k,k}(h)=1-\lambda h,\\ X(0)=0. \end{gather} $$ 其中 $\lambda>0$ 为参数，称为强度。

性质：

$T_k\sim Exp(\lambda)$，$T_k$ 之间独立
$S_n\sim \Gamma(n,\lambda)$，
$X(t+u)-X(u)\sim Pois(\lambda t)$，
在 $X(t)=n$ 的条件下，$S_1,\cdots,S_n$ 联合分布是均匀分布的次序统计量，具体地，设 $0\le s_1\le\cdots\le s_n\le t$， $$ P(S_i\le s_i,i=1,\cdots,n|X(t)=n)=\frac{n!}{t^n}\int_{0}^{s_1}\cdots\int_{x_{n-1}}^{x_n}dx_n\cdots dx_1. $$

这意味着已知某时段发生的事件个数时，事件发生的时间是均匀的。

泊松过程可以推广到两个分支：出生-死亡过程和更新过程，我们一一介绍。

出生-死亡过程

我们仍然考虑平稳过程。时间连续，状态离散的马尔可夫过程满足 $$ P_{ij}(t)=P{X(t+u)=j|X(u)=i}. $$ 只要给出了这个式子，随机过程就定义好了。

我们先从特殊的过程开始，逐渐推广到一般的出生-死亡过程。我们用 $X(t)$ 表示 $t$ 时刻存活的数量，$T_k$ 表示第 $k$ 个事件和第 $k+1$ 个事件之间的等待时间，$S_k$ 表示第 $k$ 个事件发生时间。具体地，$T_0=0$, $T_k=\inf {t>T_{k-1}:X(t)\ne X(T_{k-1})}$，$S_k=\sum_{i=0}^{k-1}T_i$.

纯出生过程

我们推广泊松过程，允许每个事件发生后强度发生变化（也就是“出生率”和“人口数”有关）。设 ${\lambda_k}>0$ 为参数， $$ \begin{gather} \lim_{h\to 0} P_{k,k+1}(h)=\lambda_k h,\\ \lim_{h\to 0}P_{k,k}(h)=1-\lambda_k h.\\ \end{gather} $$ 一般来说我们要求 $X(0)=0$，这样比较简洁（也可以令 $X(0)=N$，这不本质）。类似地，可以证明 $T_k$ 之间独立且 $$ T_k\sim Exp(\lambda_k). $$ 于是可以得到 $S_n$ 的特征函数 $$ \varphi_n(t)=\prod_{k=0}^{n-1}\frac{\lambda_k}{\lambda_k-it}. $$

$X(t)$ 的分布

我们来考虑计算 $P_n(t)=P(X(t)=n)$. 利用 $P_0(t+h)=P_0(t)P_0(h)=P_0(t)(1-\lambda_0 h+o(h))$，有 $$ P’0(t)=\lim{h\to 0}\frac{P_0(t+h)-P_0(t)}{h}=\lambda_0P_0(t). $$ 类似地，$P_n(t+h)=P_n(t)P_0(h)+P_{n-1}(t)P_1(h)=P_n(t)(1-\lambda_n h)+P_{n-1}(t)\lambda_{n-1}h+o(h)$, 所以 $$ P’n(t)=\lambda{n-1}P_{n-1}(t)-\lambda_n P_n(t),\quad n\ge 1. $$ 我们得到了齐次线性微分方程组，边界条件 $P_0(0)=1,P_{n}(0)=0,n\ge 1$. 就可以确定下来了。虽然有通用解法，但其实只有特殊情况我们才能写出显式表示，一般情况下只能得到 $P_0(t)=e^{-\lambda_0t}$.

另一种常用的求分布方法是转化到 $S_n(t)$，我们将在 Yule 过程中用到并在附录介绍。

Yule 过程

出生率和人口数成正比，也即 $\lambda_n=n\beta$，$\beta>0$ 为参数。特别地，我们需要假设 $X(0)=N$（否则就一直是0了）。

如果你实在绕不明白，可以令 $Y(t)=X(t)-N$，这样 $Y(t)$ 就是满足 $Y(0)=0$ 的出生过程了。

它的分布是 $$ P(X(n)=t)=\binom{n-1}{n-N}e^{-N\beta t}(1-e^{-\beta t})^{n-N},\quad n\ge N. $$ 我们在附录给出推导过程。

出生-死亡过程

来来来，接着推广。现在寿命不是无限的了，还允许死亡。但死亡也要按照基本法：足够短的时间内只能有一个人生或死。这就是出生-死亡过程，其严格定义为同时满足以下几条的随机过程（$\lambda_i,\mu_i$ 为参数）：

$\lim_{h\to0} P_{i,i+1}(h)=\lambda_ih$,
$\lim_{h\to0} P_{i,i-1}(h)=\mu_i h,\ i\ge1$,
$\lim_{h\to0} P_{i,i}(h)=(1-\lambda_i-\mu_i)h$,
$P_{ij}(0)=\delta_{ij}$,
$\mu_0=0,\lambda_0>0,\mu_i,\lambda_i>0,i=1,2,\cdots$.

我们记初始状态 $P(X(0)=i)=q_i$. 根据 Markov 性，规定了初始状态参数，这个过程就确定了。

$X(t)$ 的分布

我们可以定义类似于转移矩阵的东西，叫做 infinitesimal generator： $$ A=\begin{pmatrix} -\lambda_0 & \lambda_0 & 0 & \cdots\\ \mu_1 & -(\lambda_1+\mu_1) & \lambda_1 & \cdots \\ 0 & \mu_2 & -(\lambda_2+\mu_2) & \cdots\\ \vdots & \vdots & \vdots & \ddots \end{pmatrix}. $$ 若记 $P(h)=(P(X(h)=0),P(X(h)=1),\cdots)$，则有 $P(t+h)=P(t)(I+A)h+o(h)$，于是有齐次线性微分方程组： $$ \begin{gather} P’(t)=P(t)A,\\ P(0)=(q_0,q_1,\cdots), \end{gather} $$ 解微分方程即可确定 $X(t)$ 的分布。

等待时间 $T_k$

类似地，我们可以得到 $T_k\sim Exp(0,\lambda_k+\mu_k)$.

更新过程

定义

泊松过程我们让 $T_k$ 是指数分布。如果令 $T_k>0$ 独立同分布，就得到了更新过程。 $X(t)=\sharp{n:0\le S_n\le t}$. 更新函数定义为 $M(t)=\mathrm EX(t)$. 这是更新过程中一个很重要的东西。

用 $F_n(x)$ 表示 $S_n$ 的分布函数，则满足卷积方程 $$ F_n(x)=\int_0^x F_{n-1}(x-y)dF(y). $$ 可以证明 $$ P(X(t)=k)=F_k(t)-F_{k+1}(t),\quad t\ge0. $$ 并且 $$ M(t)=\sum_{n=1}^\infty F_n(t). $$ 我们有三个比较关心的随机变量：

剩余寿命（excess or residual lifetime）：$\gamma_t=S_{N(t)+1}-t$,
年龄（current life / age）：$\delta_t=t-S_{N(t)}$,
总寿命（total life）：$\beta_t=\gamma_t+\delta_t$.

更新方程与更新定理

这里水很深，有一套专门的更新理论。我们就只介绍关键的定理。

首先可以证明 $M(t)<\infty$，并且有结论 $$ M(t)=F(t)+\int_0^t M(t-y)dF(y). $$ 我们可以定义更一般地更新方程。

定义（更新方程，renewal equation） 设 $a(t)$ 和 $F(x)$ 已知，如下关于 $A(t)$ 的方程称为更新方程： $$ A(t)=a(t)+\int_0^t A(t-x)dF(x),\quad t\ge 0. $$ 更新过程的很多问题，最后都会得到一个这样的方程，所以研究它的解很重要。如下几个定理都是围绕更新方程的解展开的。

定理设 $a(t)$ 有界，则上述更新方程存在唯一的有限区间内有界的解 $$ A(t)=a(t)+\int_0^t a(t-x)dM(x). $$ 其中 $M(x)=\sum_{n=1}^\infty F_n(x)$ 为更新函数。

下一个定理我们要做一些铺垫。

定义（格点分布，arithmetic） 随机变量 $X$ 是 arithmetic 的，如果存在 $\lambda>0$ 使得 $\sum_{n\in\mathbb{Z}} P(X=nd)=1$. 此时称 $F$ is arithmetic with span $\lambda$.

讲义上的定义较为复杂，但说的是一个意思：
定义（point of increase） 设 $F$ 是分布函数。对 $a\in\mathbb{R}$，如果 $\forall\varepsilon>0$ 都有 $F(a+\varepsilon)-F(a-\varepsilon)>0$，则称 $a$ 点是 a point of increase.
这个定义推广了递增函数的定义，允许在该点崩坏掉。最典型的就是 $X=a$ 的分布函数，$a$ 就是 a point of increase.
定义（arithmetic） 如果存在 $\lambda$ 使得分布函数 $F$ 在且只在 $0,\pm\lambda,\pm2\lambda,\cdots$ 上 point of increase，则称 $F$ 是 arithmetic 的。

定义（directly Riemann integrable） 设 $g:\mathbb{R}^+\to\mathbb{R}$，对 $\delta>0,n=1,2,\cdots$，设

$$ \begin{align} &\underline{m}_n=\inf{ g(t):(n-1)\delta\le t\le n\delta},\\ &\overline{m}n=\sup{ g(t):(n-1)\delta\le t\le n\delta},\\ &\underline\sigma(\delta)=\delta\sum{n=1}^\infty \underline{m}n,\quad \overline\sigma(\delta)=\delta\sum{n=1}^\infty \overline{m}_n. \end{align} $$

这个公式我怎么编辑它都显示不出，本地明明没问题，我弃疗了……自己在脑中编译一下吧

若 $\underline\sigma(\delta)$ 和 $\overline\sigma(\delta)$ 对任意的 $\delta>0$ 绝对收敛，且 $\lim_{\delta\to0}\left(\overline\sigma(\delta)-\underline\sigma(\delta)\right)=0$，则称 $g$ directly Riemann integrable.

注：
讲义的定义有瑕疵，应该用 $\inf$ 而不是 $\min$，除非给 $g$ 加别的条件才能保证最大值最小值存在。
这是比黎曼可积更强的条件，因为它要求上和和下和对任意的 $\delta$ 都收敛，而不只是 $\delta\to 0$ 的行为。

定理（Basic renewal theorem） 设 $F$ 是正随机变量的分布函数，期望为 $\mu$（有限或无限）. 设函数 $a(t),t\ge0$ 是 directly Riemann integrable 的。考虑以下更新方程： $$ A(t)=a(t)+\int_0^t A(t-x)dF(x),\quad t\ge 0. $$

若 $F$ 不是 arithmetic 的，则 $$ \lim_{t\to\infty} A(t)=\left{ \begin{align} &\frac{1}{\mu}\int_0^\infty a(x)dx,&\text{若 }\mu<\infty,\\ &0,&\text{若 }\mu=\infty. \end{align} \right. $$
若 $F$ is arithmetic with span $\lambda$，则 $\forall 0\le c\le \lambda$， $$ \lim_{n\to\infty} A(c+n\lambda)=\left{ \begin{align} &\frac{\lambda}{\mu}\sum_{n=0}^\infty a(c+n\lambda),&\text{若 }\mu<\infty,\\ &0,&\text{若 }\mu=\infty. \end{align} \right. $$

设 $h>0$，如果令 $a(y)=I(0\le y< h)$，稍加分析可以得到下面有关更新过程的结论。

定理设 $F$ 是正随机变量的分布函数，期望为 $\mu$，设 $M(t)=\sum_{k=1}^\infty F_k(t)$，$h>0$，则

若 $F$ 不是 arithmetic 的，则 $$ \lim_{t\to\infty}(M(t+h)-M(t))=\frac{h}{\mu}. $$
若 $F$ is arithmetic with span $\lambda$，当 $h$ 是 $\lambda$ 的整数倍时上述结论成立。

上述定理可以推出如下初等更新定理。

定理（初等更新定理，Elementary renewal theorem） 令 ${X_i}$ 是更新过程，$\mu=\mathrm EX_1<\infty$，则 $$ \lim_{t\to\infty}\frac{1}{t}M(t)=\frac{1}{\mu}. $$ 它表明更新函数增长速度恰好是时间间隔的倒数，非常直观。

布朗运动

考虑时间连续、状态连续的马尔可夫过程。记 $p(x,t|x_0)$ 为条件分布 $X(t+t_0)|X(t_0)=x_0$ 的概率密度函数。只要确定了 $X(0)$ 的分布和 $p(x,t|x_0)$，这个马尔可夫过程就唯一确定了。

一维布朗运动的定义是：

$X(t+s)-X(s)\sim N(0,\sigma^2 t)$（通常令 $\sigma^2=1$）,
$\forall t_1<t_2<t_3<t_4$, $X(t_4)-X(t_3)$ 和 $X(t_2)-X(t_1)$ 独立,
$X(0)=0$. 轨道函数 $X(t)$ 在 $t=0$ 处连续。

显然其转移概率是 $$ p(x,t|x_0)=\frac{1}{\sqrt{2\pi t}\sigma}e^{-(x-x_0)^2/(2\sigma^2 t)}. $$ 定理对 $t_1<t<t_2$，给定 $X(t_1)=A,X(t_2)=B$ 时 $X(t)$ 的条件分布服从 $N\left(A+\dfrac{B-A}{t_2-t_1},\dfrac{(t_2-t)(t-t_1)}{t_2-t_1}\right)$. 证明略。

首达时间 $T_a$ 定义为 $X(0)=0$ 时第一次到达 $a$ 的时间。我们有结论 $$ f_{T_a}(t)=\frac{a}{\sqrt{2\pi}}t^{-3/2}e^{-a^2/(2t)}. $$ 其推导见附录。利用此结论，我们可以得到下面的定理。

**定理 ** 轨道 $X(t)$ 在 $(t_0,t_1)$ 内有至少一个 0 的概率是 $$ \alpha=\frac{2}{\pi}\arccos\sqrt{\frac{t_0}{t_1}}. $$

附录

Yule 过程求 $P(X(t)=n)$

讲义通过解微分方程求的，但那个微分方程按照一般流程计算极其复杂，多少需要一点目测猜解的功力。我们这里给出基于 $S_n$ 密度函数的推导，大力出奇迹即可。

令 $Y(t)=X(t)-N$，则 $Y(t)$ 为纯出生过程，$\lambda_k=(N+k)\beta$. 我们先利用特征函数来求 $S_n$ 的密度函数 $f_{S_n}$，即 $$ \begin{align} f_{S_n}(x)&=\frac{1}{2\pi}\int_{-\infty}^\infty e^{-itx}\prod_{k=0}^{n-1}\frac{(N+k)\beta}{(N+k)\beta-it}dt.\\ \end{align} $$ 记上面被积函数为 $g(t),t\in\mathbb{C}$. 其有 $n$ 个奇点，为 $t_k=-i(N+k)\beta,\ k=0,\cdots,n-1$. 留数为 $$ \begin{align} Res(g,t_k)&=\frac{1}{-i}e^{-(N+k)\beta x}(-1)^k\frac{(N+n-1)!}{(N-1)!(n-1-k)!k!}\beta\\ &=i\beta\frac{(N+n-1)!}{(N-1)!(n-1)!}e^{-N\beta x}(1-e^{-\beta x})^{n-1}. \end{align} $$ 于是 $$ \begin{align} \sum_{k=0}^{n-1}Res(g,t_k)&=i\beta\frac{(N+n-1)!}{(N-1)!(n-1)!}e^{-N\beta x}\sum_{k=0}^{n-1}(-1)^k\binom{n-1}{k}e^{-k\beta x}\\ &=i\beta n\binom{N+n-1}{N-1}e^{-N\beta x}(1-e^{-\beta x})^{n-1}. \end{align} $$

设路径 $L_1$ 为沿实轴 $-r$ 到 $r$，$L_2$ 为下半圆 $re^{i\theta},\pi\le\theta\le 2\pi$. 当 $r$ 充分大时，利用留数定理， $$ \begin{align} \int_{-L_1+L_2}g(z)dz&=2\pi i\sum_{k=0}^{n-1} Res(g,t_k).\\ \end{align} $$ 令 $r\to\infty$，得 $$ \begin{align} f_{S_n}(x)&=-\int_{L_2}g(z)dz\\ &=\beta n\binom{N+n-1}{N-1}e^{-N\beta x}(1-e^{-\beta x})^{n-1}.\\ \end{align} $$ 然后可以办正事了， $$ \begin{align} P(Y(t)=n)&=P(S_n\le t< S_{n+1})\\ &=\int_0^t P(S_n\le t <S_{n+1}|S_n=x)f_{S_n}(x)dx\\ &=\int_0^t P(T_n>t-x)f_{S_n}(x)dx\\ &=\int_0^t e^{-(N+n)\beta (t-x)}\beta n\binom{N+n-1}{N-1}e^{-N\beta x}(1-e^{-\beta x})^{n-1}dx\\ &=\beta n\binom{N+n-1}{N-1}e^{-(N+n)\beta t}\int_0^t e^{n\beta x}(1-e^{-\beta x})^{n-1}dx. \end{align} $$ 设上面最后一步积分为 $I$. 令 $y=e^{\beta x}$，有 $$ I=\int_1^{e^{\beta t}}y^n(1-\frac{1}{y})^{n-1}\frac{1}{\beta y}dy=\frac{1}{n\beta}(e^{\beta t}-1)^n. $$ 于是 $$ P(Y(t)=n)=\binom{N+n-1}{N-1}e^{-N\beta t}(1-e^{-\beta t})^{n}. $$ 终于， $$ P(X(t)=n)=P(Y(t)=n-N)=\binom{n-1}{N-1}e^{-N\beta t}(1-e^{-\beta t})^{n-N}. $$

所以说，本科的基础课都好好学，早晚会用上的…… 不说了，我接着复习复分析去了……

布朗运动首达时间

感觉 lecture notes 写的不是很清楚。首先有 $$ P(T_a\le t)=P(\max_{0\le u\le t} X(u)\ge a). $$ 然后考虑样本轨道集合 $A={X(u):\max_{0\le u\le t} X(u)\ge a}$. 对 $A$ 中每个轨道 $X(u)$，记首次达到 $a$ 的时刻为 $\tau<t$，考虑反射 $$ \tilde X(t)=\left{ \begin{align} &X(t)\qquad & t <\tau,\\ &a-[x(t)-a]\qquad &t>\tau. \end{align} \right. $$ 如果 $X(t)>a$，则 $\tilde X(t)<a$，反之亦然，所以 $P(\max_{0\le u\le t} X(u)\ge a)=2P(X(t)> a)$. 然后就好算了。