摊还分析 Amortized Analysis


下面以带有额外 MULTIPOP 操作的栈的实例为例,分别对摊还分析中最常用的三种技术进行介绍。最后定义一种特殊的操作序列,并通过以上三种方法对其摊还代价进行分析。

聚合分析 Aggregate Analysis


证明对所有 nn,一个 nn 个操作的序列最坏情况下花费的总时间为 T(n)T(n)。因此,在最坏情况下,每个操作的平均代价(或摊还代价)为 T(n)/nT(n)/n



在此基础上,增加一个新的栈操作 MULTIPOP,时间 O(min(s,k))O(min(s, k))

1  while not STACK-EMPTY(S) and k > 0
2     POP(S)
3     k = k - 1


问题:以一个由 n 个 PUSH、POP、MULTIPOP 操作的序列作用于一个空栈 S,总运行时间?

虽然这个分析是正确的,但我们通过单独分析每个操作的最坏情况得到的总最坏情况时间 O(n2)O(n^2) 并不是一个确界。

考察出现这种情况的原因,我们发现:这 3 种操作不是平行的,而是互相影响的。换言之,只有我们每次通过 PUSH 创造 “机会” 给 POP 和 MULTIPOP,POP 和MULTIPOP 才能 “消费” 这些机会,而不存在无限制的消费。



因此,对一个非空的栈,可以执行的 POP 操作的次数(包括了 MULTIPOP 中调用 POP 的次数)最多与 PUSH 操作的次数相当,即最多 n 次。

对任意的 n 值,任意一个由 n 个 PUSH、POP 和 MULTIPOP 组成的操作序列,最多花费 O(n)O(n) 时间。故一个操作的平均时间为 O(n)/n=O(1)O(n)/n=O(1)

核算法 Accounting Method






 操作  实际代价  摊还代价 PUSH12POP10MULTIPOPmin(k,s)0\begin{array}{|c | c |c |}\hline \textbf{ 操作 } & \textbf{ 实际代价 } & \textbf{ 摊还代价 } \\ \hline \text{PUSH} & \mathbf{1} & \mathbf{2} \\ \hline \text{POP} & \mathbf{1} & \mathbf{0} \\ \hline \text{MULTIPOP} & \min (\boldsymbol{k}, \boldsymbol{s}) & \mathbf{0} \\ \hline \end{array}

对 PUSH 操作赋予代价 2 元:1 元支付压栈操作的实际代价,剩余的 1 元存为信用

当执行一个 POP/MULTIPOP 操作时,不再多缴纳费用,而是从存储的信用取出 1 元/ k 元来支付其实际代价。

势能法 Potential Method


并不将预付代价表示为数据结构中特定对象的信用,而是表示为 “势能”,或简称 “势”,将势能释放即可用来支付未来操作的代价


势能法工作方式如下。我们将对一个初始数据结构 D0D_{0} 执行 nn 个操作。对每个 i=1,2,,ni=1,2, \cdots,n,令 cic_{i} 为第 i 个操作的实际代价,令 DiD_{i} 为在数据结构 Di1D_{i-1} 上执行第 i 个操作得到的结果数据结构。

势函数 Φ\Phi 将每个数据结构 DiD_{i} 映射到一个实数 Φ(Di)\Phi\left(D_{i}\right),此值即为关联到数据结构 DiD_{i} 的势。

第 i 个操作的摊还代价 c^i\hat{c}_{i} 用势函数 Φ\Phi 定义为:

c^i=ci+Φ(Di)Φ(Di1)\hat c_{i}=c_{i}+\Phi(D_{i})- \Phi(D_{i-1})

因此,每个操作的摊还代价等于其实际代价加上此操作引起的势能变化。则 n 个操作的总摊还代价为

i=1nc^i=i=1n(ci+Φ(Di)Φ(Di1))=i=1nci+Φ(Dn)Φ(D0)\begin{aligned} \sum_{i=1}^{n} \hat c_{i} &= \sum_{i=1}^{n}\left(c_{i} + \Phi\left(D_{i}\right)- \Phi\left(D_{i-1}\right)\right) \\ &= \sum_{i=1}^{n} c_{i} + \Phi\left(D_{n}\right)- \Phi\left(D_{0}\right) \end{aligned}



因此用 Φ\Phi 定义的 n 个操作的总摊还代价即为实际代价的一个上界

下面计算不同栈操作的摊还代价。如果第 i 个操作是 PUSH 操作,此时栈中包含 s 个对象,则势差为


则由题意,PUSH 操作的摊还代价为

c^i=ci+Φ(Di)Φ(Di1)=1+1=2\hat c_{i}=c_{i}+\Phi\left(D_{i}\right)-\Phi\left(D_{i-1}\right)=1+1=2

假设第 i 个操作是 MULTIPOP(S, k),将 k=min(k,s)k^{\prime}=\min (k, s) 个对象弹出栈。对象的实际代价为 kk^{\prime},势差为


因此,MULTIPOP 的摊还代价为

c^i=ci+Φ(Di)Φ(Di1)=kk=0\hat c_{i}=c_{i}+\Phi\left(D_{i}\right)-\Phi\left(D_{i-1}\right)=k^{\prime}-k^{\prime}=0

类似地,普通 POP 操作的推还代价也为 0。每个操作的摊还代价都是 O(1)O(1),因此,n 个操作的总摊还代价为 O(n)O(n)。由于我们已经论证了 Φ(Di)Φ(D0)\Phi\left(D_{i}\right) \geqslant \Phi\left(D_{0}\right),因此 n 个操作的总推还代价为总实际代价的上界,所以 n 个操作的最坏情况时间为 O(n)O(n)


假定我们对一个数据结构执行一个由 n 个操作组成的序列,当 i 严格为 2 的幂时,第 i 个操作的代价为 i,否则代价为 1。

Exercise 1 (CLRS 17.1-3)


Solution: Let nn be arbitrary, and have the cost of operation ii be c(i)c(i). Then we have,

i=1nc(i)=i=1lgn2i+in is not a power of 21i=1lgn2i+n=21+lgn1+n2n1+n3nO(n).\begin{aligned} \sum_{i = 1}^n c(i) & = \sum_{i = 1}^{\left\lceil\lg n\right\rceil} 2^i + \sum_{i \leqslant n \text{ is not a power of } 2} 1 \\ & \leqslant \sum_{i = 1}^{\left\lceil\lg n\right\rceil} 2^i + n \\ & = 2^{1 + \left\lceil\lg n\right\rceil} - 1 + n \\ & \leqslant 2n - 1 + n \\ & \leqslant 3n \in O(n). \end{aligned}

To find the average, we divide by nn, and the amortized cost per operation is O(1)O(1).

Exercise 2 (CLRS 17.2-2)


Solution: Let ci=c_i = cost of ithi\th operation.

 ci={iif i is an exact power of 2,1otherwise. c_i = \begin{cases} i & \text{if $i$ is an exact power of $2$}, \\ 1 & \text{otherwise}. \end{cases}

Charge 33 (amortized cost c^i\hat c_i) for each operation.

OperationCostActual costCredit remaining131223233315434453166318731108385931710319\begin{array}{cccc} \textbf{Operation} & \textbf{Cost} & \textbf{Actual cost} & \textbf{Credit remaining} \\ \hline 1 & 3 & 1 & 2 \\ 2 & 3 & 2 & 3 \\ 3 & 3 & 1 & 5 \\ 4 & 3 & 4 & 4 \\ 5 & 3 & 1 & 6 \\ 6 & 3 & 1 & 8 \\ 7 & 3 & 1 & 10 \\ 8 & 3 & 8 & 5 \\ 9 & 3 & 1 & 7 \\ 10 & 3 & 1 & 9 \\ \vdots & \vdots & \vdots & \vdots \end{array}

Since the amortized cost is 33 per operation, i=1nc^i=3n\sum\limits_{i = 1}^n \hat c_i = 3n.

We know from Exercise 1 that i=1nc^i<3n\sum\limits_{i = 1}^n \hat c_i < 3n.

Then we have

i=1nc^ii=1ncicredit=amortized costactual cost0.\sum_{i = 1}^n \hat c_i \geqslant \sum_{i = 1}^n c_i \Rightarrow \text{credit} = \text{amortized cost} - \text{actual cost} \geqslant 0.

Since the amortized cost of each operation is O(1)O(1), and the amount of credit never goes negative, the total cost of nn operations is O(n)O(n).

Exercise 3 (CLRS 17.3-2)


Solution: Define the potential function Φ(D0)=0\Phi(D_0) = 0, and Φ(Di)=2i21+lgi\Phi(D_i) = 2i - 2^{1 + \lfloor \lg i \rfloor} for i>0i > 0. For operation 1,

c^i=ci+Φ(Di)Φ(Di1)=1+2i21+lgi0=1.\begin{aligned}\hat c_i &= c_i + \Phi(D_i) - \Phi(D_{i - 1}) \\ &= 1 + 2i - 2^{1+ \lfloor \lg i \rfloor} - 0 \\ &= 1.\end{aligned}

For operation i(i>1)i(i > 1), if ii is not a power of 2, then

c^i=ci+Φ(Di)Φ(Di1)=1+2i21+lg1(2(i1)21+lg(i1))=3.\begin{aligned} \hat c_i &= c_i + \Phi(D_i) - \Phi(D_{i - 1}) \\ &= 1 + 2i - 2^{1 + \lfloor \lg 1 \rfloor} - (2(i - 1) - 2^{1 + \lfloor \lg(i - 1) \rfloor})\\ &= 3. \end{aligned}

If i=2ji = 2^j for some jNj \in \mathbb N, then

c^i=ci+Φ(Di)Φ(Di1)=i+2i21+j(2(i1)21+j1)=i+2i2i2i+2+i=2.\begin{aligned} \hat c_i &= c_i + \Phi(D_i) - \Phi(D_{i - 1}) \\ & = i + 2i - 2^{1 + j}-(2(i - 1) - 2^{1 + j - 1}) \\ &= i + 2i - 2i - 2i + 2 + i \\ &= 2. \end{aligned}

Thus, the amortized cost is 3 per operation.