• Markov Chain, MC

离散时间马尔科夫链

  • Discrete-Time MC, DTMC

定义

状态空间 :一个有限或者可数无限的集合,表示系统可能处于的所有状态

时间索引 :离散的时间值,通常表示为

随机过程 :在时间 时系统所处的状态

马尔可夫性质:系统的未来状态只依赖于当前状态,而与过去状态无关

齐次性:转移概率不随时间变化

  • Homogeneity

转移概率矩阵

大小,其中 是状态空间的维度

含义:元素 表示从状态 转移到状态 的概率

性质

  • (概率的非负性)
  • (每行的和为1)

n步转移概率:从状态 经过 步转移到状态 的概率,记为

  • Chapman-Kolmogorov 方程:
    • 从  到  经过  步,可以看作先经过  步到中间状态 ,再从  经过  步到 ,然后对所有可能的中间状态  求和

初始分布和状态分布

初始分布 :一个行向量,表示在时间 时系统处于每个状态的概率

  • 其中

n步之后的状态分布

稳态分布

  • Stationary Distribution
  • 平衡分布(Equilibrium Distribution)

如果一个 DTMC 是不可约 (irreducible)(任何状态都可以到达任何其他状态)和非周期 (aperiodic)(从任何状态回到自身所需的时间步长没有公约数),那么它会收敛到一个唯一的稳态分布 ,满足:

例子:天气模型

假设天气只有两种状态:晴朗 (S) 和下雨 (R)。

转移概率矩阵为:

这意味着:

  • 如果今天晴朗,明天有 90% 的概率晴朗,10% 的概率下雨
  • 如果今天下雨,明天有 30% 的概率晴朗,70% 的概率下雨

稳态分布 满足:

解方程组可得 。这意味着长期来看,有 75% 的时间是晴朗的,25% 的时间是下雨的。

连续时间马尔科夫链

  • Continuous-Time MC, CTMC

定义

状态空间 :一个有限或者可数无限的集合,表示系统可能处于的所有状态

时间索引 :连续的时间值,通常为

随机过程 :在时间 时系统所处的状态

马尔可夫性质:系统的未来状态只依赖于当前状态,而与过去状态无关

齐次性:转移概率不随时间变化

  • Homogeneity

其中  是从状态  经过时间  转移到状态  的概率

状态停留时间

CTMC 的核心特点是系统在每个状态中停留的时间是随机的,并且服从指数分布

如果系统进入状态 ,它会停留一段时间 ​,其中 

  • 时从状态 离开的总速率(或生成速率)
  • 系统离开状态 转移到状态 的概率为 (对于

瞬时转移速率矩阵

  • Generator Matrix

大小,其中 是状态空间的维度

非对角元素 ):表示从状态 转移到状态 的速率

  • 在极小的时间间隔  内,从状态  转移到状态  的概率近似为 

对角线元素​ :表示从状态  离开的总速率的负值

  • 表示从状态  离开的总速率

性质(每行的和为0)

与 DTMC 的关系:可以近似认为 ,其中 是 Kronecker delta(当  时为 1,否则为 0)

转移概率函数

表示在时间 从状态 转移到状态 的概率

Kolmogorov 微分方程

  • 向前方程(Forward Equations):
    • 初始条件 (单位矩阵)
  • 向后方程(Backward Equations):
    • 初始条件

这些方程的解是:

这是一个矩阵指数函数

初始分布和状态分布

初始分布 :一个行向量,表示在时间  时系统处于每个状态的概率

时间  时的状态分布 

或者通过微分方程:

稳态分布

  • Stationary Distribution
  • 平衡分布(Equilibrium Distribution)

如果一个 CTMC 是不可约的,那么它会收敛到一个唯一的稳态分布 ,满足:

例子:单服务台排队系统 (M/M/1 队列)

假设有一个服务台,顾客以泊松过程到达(到达速率 ),服务时间服从指数分布(服务速率 ),状态 表示系统中排队的顾客数量

  • 从状态 到状态 (新顾客到达)的速率是
  • 从状态 到状态 (顾客被服务完成离开)的速率是
  • 从状态 保持到状态 的速率是
  • 从状态 离开的速率是 (没有顾客离开):
  • 其他

稳态分布 满足

对于 M/M/1 队列,稳态分布是几何分布:

其中 是系统利用率

离散与连续的联系

均质化

  • Uniformization

CTMC 可以通过均匀化技术转化为 DTMC

选择一个足够大的速率 (大于所有状态的离开速率 ),然后构造一个 DTMC,在每个时间步,系统要么保持当前状态,要么以速率 转移到状态 (或者以概率 保持在当前状态)

这个 DTMC 的一步转移概率矩阵 为:

然后,CTMC 的 可以表示为:

这表明 CTMC 的状态在时间 的分布可以看作是 DTMC 经过泊松分布次数的步骤后的状态分布

极限关系

DTMC 可以看作是 CTMC 在非常小的时间间隔 内的近似

如果 是 DTMC 的转移概率,那么可以定义

时,这个 矩阵就趋近于 CTMC 的瞬时转移速率矩阵

隐马尔可夫模型

蒙特卡洛马尔可夫链