多個維度的 DP - NTUCPC Guide

Chapter III. 漸入佳境

基礎動態規劃

多個維度的 DP

作者：baluteshih

先備知識：狀態與轉移

狀態不足

讓我們來看看下面這道題目：

例題

Vacation

Source:AtCoder Educational DP Contest Problem C

Taro 的暑假明天就開始了，他決定現在為暑假制定計畫。

暑假共有 $N$ 天。對於第 $i$ 天，Taro 會選擇以下活動之一來進行：

A：在海裡游泳，獲得 $a_i$ 點快樂值。
B：在山裡抓蟲，獲得 $b_i$ 點快樂值。
C：在家裡做作業，獲得 $c_i$ 點快樂值。

由於 Taro 很容易感到無聊，他不能連續兩天或以上進行相同的活動。

請找出 Taro 所能獲得的最大快樂值總和。

條件限制

$2\leq N \leq 10^5$
$1 \leq a_i, b_i, c_i \leq 10^4$

我們先來「設計狀態」，若貿然的令 $dp[i]$ 是考慮第 $i$ 天結束的最大快樂值總和時，就會發現一個嚴重的問題──我們在轉移的時候不知道如何判斷是否連續兩天做了一樣的活動！

左想右想，把狀態敘述得再清楚好像都解決不了這個問題，那該怎麼辦呢？

其實，我們在設計狀態的時候可以不要拘泥於「一個 dp 式」，俗話說的好，一個不夠那就用兩個，如果還不夠──那就用三個。

我們就宣告三個 dp 式：$dpa[i], dpb[i], dpc[i]$，分別代表

$dpa[i]$ 是經過了前 $i$ 天，且第 $i$ 天選擇了活動 A 的最大快樂值總和。
$dpb[i]$ 是經過了前 $i$ 天，且第 $i$ 天選擇了活動 B 的最大快樂值總和。
$dpc[i]$ 是經過了前 $i$ 天，且第 $i$ 天選擇了活動 C 的最大快樂值總和。

那如何寫出轉移式呢？當然是互相轉移囉！拿 $dpa$ 做為舉例：

$$
dpa[i] = \max(dpb[i - 1] + a_i, dpc[i - 1] + a_i)
$$

沒錯，因為如果第 $i$ 天選擇了活動 A，那麼唯一的限制就是第 $i-1$ 天不可以有活動 A。因此，有了 $dpb$ 和 $dpc$ 的幫助，我們就可以某種程度上「指定」第 $i-1$ 天的活動，來迴避連續兩天做一樣活動的狀況。

附上程式碼供參考

#include <iostream>
#include <algorithm>
using namespace std;

const int MAXN = 100005;

int a[MAXN], b[MAXN], c[MAXN];
int dpa[MAXN], dpb[MAXN], dpc[MAXN];

int main() {
    ios::sync_with_stdio(0), cin.tie(0);
    int n;
    cin >> n;
    for (int i = 1; i <= n; ++i) 
        cin >> a[i] >> b[i] >> c[i];
    for (int i = 1; i <= n; ++i) {
        dpa[i] = max(dpb[i - 1] + a[i], dpc[i - 1] + a[i]);
        dpb[i] = max(dpc[i - 1] + b[i], dpa[i - 1] + b[i]);
        dpc[i] = max(dpa[i - 1] + c[i], dpb[i - 1] + c[i]);
    }
    cout << max({dpa[n], dpb[n], dpc[n]}) << "\n";
}

二維 DP

很多個 dp 式到底是怎樣？

在前一個章節，我們提到設計動態規劃演算法的第一步是「設計狀態」，但我們好像一口氣就設計了不只一種狀態，這樣真的合理嗎？其實我們不妨用這種方式去想：

$dp[i][j]$ 是經過了前 $i$ 天，且第 $i$ 天選擇了第 $j$ 種活動的最大快樂值總和。
- 這裡的 $j=0, 1, 2$ 分別就對應到活動 A, B, C。

沒錯！就是直接把 dp 狀態想成「二維」的就好了。還記得我們在介紹「狀態」這個用語時有提到，其實 dp 的狀態是用少少的幾個參數定義出來的，因此當然不會永遠都只有一個 $i$ 囉。

甚至用這種方式去實作的話，就可以把程式碼再寫得美一些：

#include <iostream>
#include <algorithm>
using namespace std;

const int MAXN = 100005;

int happiness[MAXN][3];
int dp[MAXN][3];

int main() {
    ios::sync_with_stdio(0), cin.tie(0);
    int n;
    cin >> n;
    for (int i = 1; i <= n; ++i) 
        for (int j = 0; j < 3; ++j)
            cin >> happiness[i][j];
    for (int i = 1; i <= n; ++i) {
        for (int j = 0; j < 3; ++j)
            for (int k = 0; k < 3; ++k)
                if (j != k)
                    dp[i][j] = max(dp[i][j], dp[i - 1][k] + happiness[i][j]);
    }
    cout << *max_element(dp[n], dp[n] + 3) << "\n";
}

雖然比起之前的程式碼長，但陣列的版本看起來不會有一堆長得一樣的片段。這樣的好處除了可以輕鬆應付「當活動種類數變多」的狀況外，若 dp 轉移式變得複雜，當我們不小心寫錯時，要進行修改就不用每行都改一遍了。

增加維度的思考方式

讓我們來重新複習一下這題：

例題

股票买卖 V

Source:洛谷 U425829

給定一個長度為 $N$ 的序列，序列中的第 $i$ 個數字 $a_i$ 表示一個給定股票在第 $i$ 天的價格。

請設計一個演算法計算出最大利潤。在滿足以下條件的情況下，你可以盡可能地完成數次交易（多次買賣一支股票）:

你不能同時參與多筆交易（你必須在再次購買前出售掉之前的股票）。
賣出股票的隔天無法買入股票，需要多等 $1$ 天才可以買。

條件限制

$N \leq 10^5$
$a_i \leq 10^4$

在前一個章節，我們的做法是先定義好狀態之後，試著整理轉移式才能將時間複雜度優化至 $O(N)$。有沒有直接一點的 $O(N)$ 做法呢？

這時候我們就能利用「增加維度」的方式，來直接的辦到這件事！

我們定義兩種狀態，$dp[i][0]$ 和 $dp[i][1]$：

$dp[i][0]$ 代表到了第 $i$ 天結束後，手上沒有持有股票的最大獲利
$dp[i][1]$ 代表到了第 $i$ 天結束後，手上持有股票的最大獲利

這樣轉移該如何運作呢？

針對 $dp[i][0]$，前一天會有兩種可能：要嘛前一天也沒有股票，要嘛前一天還有股票。因此，對於這兩種狀況，我們就能依序寫出 $dp[i - 1][0]$ 和 $dp[i - 1][1]$ 的子問題，其中因為後者還要「賣股票」，所以要多加上 $a_i$，寫出來就是
$$
dp[i][0] = \max(dp[i - 1][0], dp[i - 1][1] + a_i)
$$

而對 $dp[i][1]$，前一天會有兩種可能：要嘛前一天也有股票，要嘛前一天沒有股票。這裡的概念也差不多，但對於後者，要多注意多等 $1$ 天的問題，所以要取 $dp[i - 2][0]$ 這個子問題，寫出來就是
$$
dp[i][1] = \max(dp[i - 1][1], dp[i - 2][0] - a_i)
$$

讀者可以想成是我們在模擬第 $i$ 天當下「可能做出的決策」。還記得我們說動態規劃的狀態就是在「描繪出答案被構建出來的過程」，而轉移就是在「描述過程之間是如何轉換的」：

在前一個章節的做法中，我們是在把買賣股票「每一組買賣」都當成一種過程的變化，也因此，每一次轉移跨越的天數就會是 $O(N)$ 級別的。
在現在的做法裡，我們是在把「每一天的決定」當成一種過程的變化，而一天的決定通常只取決於前一天或前兩天的結果，所以每一次轉移跨越的天數就會是 $O(1)$。

上述是筆者針對這兩種做法的解釋，並沒有唯一的解釋方法，讀者在這部分的意義上可以自行多加思考看看，相信可以對這樣子的變化有多一層的理解。

當然，這兩種做法並沒有絕對是誰好誰壞的問題，總是有題目可以讓其中一種做法有明顯的優勢在。因此很多時候在解題時，我們會需要多方嘗試各種不同的狀態設計，並思考相應的轉移意義，才能找到解出題目的正確方向。

附上程式碼給讀者自行比對：

#include <iostream>
using namespace std;

const int MAXN = 100005;

int arr[MAXN], dp[MAXN][2];

int main() {
    ios::sync_with_stdio(0), cin.tie(0);
    int n;
    cin >> n;
    for (int i = 1; i <= n; ++i)
        cin >> arr[i];
    const int INF = 1e9;
    dp[0][1] = -INF;
    dp[1][0] = 0;
    dp[1][1] = -arr[1];
    for (int i = 2; i <= n; ++i) {
        dp[i][0] = max(dp[i - 1][0], dp[i - 1][1] + arr[i]);
        dp[i][1] = max(dp[i - 1][1], dp[i - 2][0] - arr[i]);
    }
    cout << dp[n][0] << "\n";
}

多維遞迴

例題

组合数

Source:洛谷 U159710

Darko 最近學習了組合數的相關知識，他的朋友向他提出了 $q$ 個問題，每個問題是問從 $n$ 個不同元素中選出 $m$ 個放成無順序的一堆的方案數。

Darko 需要依次回答每一個問題，由於答案可能很大，他每次只需要回答這次的答案對 $10^9+7$ 取模的結果。

條件限制

$q\leq 10^4$
$0\leq m\leq n\leq 1000$

相信讀者對這道問題並不陌生，其實這就是在問我們高中學習的組合數問題，也就是 $C^n_m$。

當然，若讀者熟悉基礎數學 / 基礎數論中提到的模逆元的話，就會知道對於每一組 $n, m$ 的詢問，都可以在經過 $O(n)$ 的預處理後以 $O(1)$ 時間內回答任何一組詢問。但若題目要求的模數不是質數，或甚至當 $n, m$ 比模數還大時，就會出現問題。

因此，我們可以利用組合數的遞迴性質，也就是：

$$
C^n_m = C^{n-1}_m + C^{n-1}_{m-1}
$$

這個式子又被稱為巴斯卡恆等式，要直觀解釋的話，可以想成 $n$ 個元素選出 $m$ 個的方法可以來自：

拿第 $n$ 個元素，因此剩下對應到一個「$n-1$ 個元素、選 $m-1$ 個」的子問題。
不拿第 $n$ 個元素，因此剩下對應到一個「$n-1$ 個元素、選 $m$ 個」的子問題。

因此，取這兩種「狀態」的總和，就可以直接得到上面的「轉移式」。

#include <iostream>
using namespace std;

const int MOD = 1e9 + 7;
const int MAXN = 1005;

int C[MAXN][MAXN];

int main() {
    ios::sync_with_stdio(0), cin.tie(0);
    C[0][0] = 1;
    for (int i = 1; i < MAXN; ++i) {
        C[i][0] = 1;
        for (int j = 1; j <= i; ++j)
            C[i][j] = (C[i - 1][j] + C[i - 1][j - 1]) % MOD;
    }
    int q;
    cin >> q;
    while (q--) {
        int n, m;
        cin >> n >> m;
        cout << C[n][m] << "\n";
    }
}

將其實作成程式碼，讀者就可以發現我們在過程中只有用到加法，也因此對於任意的模數都不成問題！

最長共同子序列

看完數方法數的例子，我們就來看看最佳化問題的例子。

例題

Longest Common Subsequence

Source:NCOJ 818

JOI 君很喜歡字串，有一天，他收到了別人送的禮物，兩個字串 $A, B$！
於是 JOI 君很好奇，這兩個字串的最長共同子序列長度是多少？

一個字串 $T$ 是一個字串 $S$ 的子序列，若且唯若我們刪除零或多個在 $S$ 字串中的字元後，可以得到字串 $T$。
舉例來說 abc 是 accbddc 的子序列，因為刪除 ccdd 後，accbddc 就會變成 abc。

假如 $T$ 同時是 $A, B$ 字串的子序列，我們就說 $T$ 是 $A, B$ 字串的共同子序列。

條件限制

$1 \le |A|, |B| \le 5000$

最長共同子序列（Longest Common Subsequence，簡稱 LCS）是一個非常經典的 dp 例題。但在定義狀態之前，我們應該來分析一下這道問題答案的結構是如何。

所謂「子序列」，就可以想成一組索引值序列 $i_1\leq i_2\leq \cdots\leq i_k$，而兩個字串的「共同子序列」即代表著，有另一組一樣長的索引值序列 $j_1\leq j_2\leq \cdots\leq j_k$，滿足

$$
\text{對於所有 }t\text{，}A_{i_t}=B_{j_t}
$$

想到這裡，一種狀態的定義就出現了：$dp[i][j]$ 即代表著「結尾是 $A_i$ 和 $B_j$ 的最長共同子序列長度」，而轉移只要窮舉上一次的結尾在哪就好了，也就是說：

$$
dp[i][j] =
\begin{cases}
0 & i = j = 0 \\
-\infty & A_i\neq B_j\text{，字元不同不能當結尾} \\
\max_{a<i, b<j} dp[a][b] + 1 & A_i=B_j\text{，窮舉上一個字元的位置}
\end{cases}
$$

不過仔細分析看看時間複雜度，若令 $N=|A|$、$M=|B|$，$O(NM)$ 的狀態搭配 $O(NM)$ 的轉移，整體的時間複雜度居然是 $O((NM)^2)$ 這麼慢！

這裡就需要用到一點狀態設計的巧思，若我們巧妙的修改一下狀態定義——$dp[i][j]$ 代表著「字串 $A$ 長度為 $i$ 的前綴、與字串 $B$ 長度為 $j$ 的前綴，兩者的最長共同子序列長度」。

這樣帶來的好處是什麼呢？讀者可以想像是我們將前面的狀態做了某種二維前綴最大值的處理，這讓 $\max_{a<i, b<j}dp[a][b] + 1$ 的這個複雜的轉移，瞬間變成了一個 $dp[i - 1][j - 1] + 1$ 的 $O(1)$ 轉移！

整理一下轉移式，我們可以得到
$$
dp[i][j] =
\begin{cases}
0 & i = 0 \text{ 或 } j = 0 \\
\max\{dp[i - 1][j], dp[i][j - 1]\} & A_i\neq B_j\text{，只維護二維前綴的極值} \\
\max\{dp[i - 1][j], dp[i][j - 1], dp[i - 1][j - 1] + 1\} & A_i=B_j\text{，額外考慮接一個字元在後面} \\
\end{cases}
$$

但其實從上式中我們可以觀察到，$i$ 跟 $j$ 多增加 $1$ 時，$dp[i][j]$ 的值其實也只會提升頂多 $1$ 而已。因此，這個轉移式可以簡化成
$$
dp[i][j] =
\begin{cases}
0 & i = 0 \text{ 或 } j = 0 \\
\max\{dp[i - 1][j], dp[i][j - 1]\} & A_i\neq B_j\text{，只維護二維前綴的極值} \\
dp[i - 1][j - 1] + 1 & A_i=B_j\text{，額外考慮接一個字元在後面} \\
\end{cases}
$$

就得到一個 $O(NM)$ 的動態規劃演算法了。

#include <iostream>
#include <string>
using namespace std;

const int MAXN = 5005;
int dp[MAXN][MAXN];

int main() {
    ios::sync_with_stdio(0), cin.tie(0);
    string a, b;
    cin >> a >> b;
    int n = a.size(), m = b.size();

    // 插入首字元使兩字串變成 1-base
    a.insert(a.begin(), '?');
    b.insert(b.begin(), '!');

    for (int i = 1; i <= n; ++i)
        for (int j = 1; j <= m; ++j)
            if (a[i] != b[j])
                dp[i][j] = max(dp[i - 1][j], dp[i][j - 1]);
            else 
                dp[i][j] = dp[i - 1][j - 1] + 1;
    cout << dp[n][m] << "\n";
}

高維 DP

當然，狀態的維度可不僅限於二維而已，就讓我們看看下面這道例題：

例題

Another LCS

Source:ZeroJudge a252

給三個字串，請求出他們的 LCS 長度為多少？

條件限制

三個字串的長度不超過 $100$

這題是進化版的 LCS 問題，而作法當然也就跟前面非常相似，具體來說，只要令 $dp[i][j][k]$ 是三個字串中長度分別為 $i, j, k$ 的前綴的最佳答案，就可以依樣畫葫蘆寫出類似的轉移式。由於非常相似，接下來的部份就交給讀者了。

總而言之，讀者可千萬不要被狀態中「參數的個數」所限制住，只要我們需要的資訊量不足，就得考慮是否要增加維度來「保持我們需要的資訊」的狀態上，才能寫出相對應的轉移式。

小結

在本節中，我們帶讀者了解到在設計動態規劃演算法時，很多時候僅僅靠一個參數是無法準確的維護狀態轉移的過程的，也因此我們才需要狀態維度的增加。而透過上述幾道例題，相信讀者也體認到了增加狀態的效益、以及其必要性。

當然，讀者可能會發現在本節中出現的例題都有著較為單純的狀態定義。因此，在接下來的章節中，我們將在讀者對維度的擴增有一定的熟悉度的前提下，帶讀者認識一些較為不直觀的幾種典型狀態設計方法。

習題

多了「增加狀態」這個武器後，能解的動態規劃問題一下子就變多了！因此我們準備了豐富的習題，就讓讀者好好練習囉！

習題

bb 與序列

Source:NPSC 2019 國中組初賽 pF

某天 bb 拿到了一個長度 $N$ 的序列 $v_1, v_2, \cdots, v_N$，這個序列裡面的數字有正有負也有可能有零，而 bb 想用紅、綠、藍三種顏色幫這個序列上色。為了美觀，每個數字都必須被標上顏色，而且序列中任兩個相鄰的數字必須要被標上不同的顏色。

由於 bb 喜歡綠色且討厭紅色，他覺得這個序列上色之後的價值是標上綠色的數字的總和扣掉標上紅色的數字的總和。

請問在滿足上述的條件下，這個序列上色後價值可以變成多高呢？

條件限制

$1\leq N\leq 10^6$
$-1000\leq v_i \leq 1000$

習題

Even More Odd Photos

Source:USACO 2021 January Contest, Bronze Problem 2

約翰正嘗試給他的 $N$ 頭乳牛拍照。每頭乳牛有一個「品種編號」。

約翰對他的照片有一個十分古怪的構思：他希望將所有的乳牛分為不相交的若干組（換句話說，將每頭乳牛分到恰好一組中）並將這些組排成一行，使得第一組的乳牛的品種編號之和為偶數，第二組的編號之和為奇數，以此類推，奇偶交替。

約翰可以分成的最大組數是多少？

條件限制

$N \leq 1000$
$1 \leq \text{品種編號} \leq 100$

習題

円円數磁磚

Source:NEOJ 138

円円從小就對數字很敏銳，生活中各式各樣的事物都可以計算，例如說如何減少讀書的時間又可以剛好不會被當，或是隔多少天才整理桌面又不至於惹室友生氣等等。雖然偶而會失算，但大部分的情況下都會是正確的。有一天，円円走在鋪滿正方形磁磚的走廊上，腦袋又開始活動起來：「如果這條走廊的寬度只有 $3$ 塊磁磚，那麼用 $1\times 2$ 的長方型磁磚鋪滿這整條走廊一共有幾種方法呢？然而這時円円因為前一天熬夜，精神不濟而腦袋轉得比較慢，但他又很想要知道答案，因此他希望你能幫他算算看這個問題，如果算對了他會給你一罐麥香奶茶喔～

條件限制

$T\leq 10^5$ 筆測資
$1\leq N\leq 10^5$

習題

Grid 1

Source:AtCoder Educational DP Contest Problem H

有一個 $H\times W$ 的方格，對於每個格子 $(i, j)$，會有一個字元 $a_{i, j}$ 表示他是空格（.）還是牆壁（#）。

Taro 要從格子 $(1, 1)$ 走到格子 $(H, W)$，並且每一步他都只能往右或往下走。

請找出 Taro 有幾種從格子 $(1, 1)$ 走到格子 $(H, W)$ 的方法，輸出答案模 $10^9+7$ 後的結果。

條件限制

$2\leq H, W\leq 1000$

習題

放苹果

Source:洛谷 P2386

把 $m$ 個相同的蘋果放在 $n$ 個相同的盤子裡，有些盤子可以是空的，求有多少種不同的分法（$5, 1, 1$ 和 $1, 1, 5$ 是同一種方法）。

條件限制

$t\leq 20$ 筆測資
$1\leq m, n\leq 10$

習題

N 箱 M 球

Source:TIOJ 1291

$n$ 個相同的箱子要放入 $m$ 個不同的球，問有幾種放法。

條件限制

$5\leq n, m\leq 200$
輸入有多筆測資，$n=m=0$ 代表測試資料結束

習題

幸運表格

Source:NCOJ 790

幸運表格，一個相傳能夠帶給人們幸運的表格。上面充滿了數字，獲得表格的人可以隨機從某個位置出發，並且持續不斷地向右或向下移動直到離開表格為止，而他所獲得的幸運指數即為經過的所有數字相加。
以下列表格為例：

-1 7 -8 10 -5
-4 -9 8 -6 0
5 -2 -6 -6 7
-7 4 7 -3 -3
7 1 -6 4 -9

若你從左上角開始，沿著右、下、下、右、右、右、右移動，則你將獲得 $-1+7-9-2-6-6+7=-10$ 的幸運指數。

請注意，這只是舉例如何計算幸運指數，不代表這個表格的最大幸運指數為 $-10$。

這個表格的最大幸運指數應為從第三列第一欄開始，沿著右、下、右、右、下、下移動，你可以獲得 $15$ 的幸運指數。

條件限制

$1\leq N, M\leq 1000$
$-100\leq a_{ij}\leq 100$

習題

勇者修煉

Source:APCS 2020/10 P3

輸入為 $n\times m$ 大小的的陣列，每一格是一個介於 $-100$ 與 $100$ 之間的整數，表示經過這格可以累積的經驗值。
你可以從最上面一排任何一個位置開始，在最下面一排任何一個位置結束。
過程中每一步可以選擇往左、往右或往下走，但不能走回已經經過的位置。
請你算出最多可以獲得的經驗值總和（可能是負數）。

條件限制

$1\leq n\leq 50$
$1 \leq m \leq 10^4$
$-100\leq v_{ij} \leq 100$

習題

連鎖店 (Chains)

Source:全國賽 2016 pA

抓寶桌遊打算在市區開 $N$ 家連鎖店。可以開連鎖店的位置是 $M\times M$ 的網格，每一家連鎖店必須開在不同的網格上，而且第二家連鎖店必須開在第一家的東北方，第三家連鎖店必須開在第二家的東北方，依此類推。東北方的定義爲 $X$ 座標和 $Y$ 座標都比較大。$X$ 座標和 $Y$ 座標均介於 $0$ 到 $M - 1$。如果第 $i$ 家（$i$ 介於 $0$ 到 $N - 1$）連鎖店開在 $(x, y)$ 的位置則會有 $((ai + bx + cy)\text{ mod }d)$ 的顧客。請寫一個程式決定 $N$ 家連鎖店的位置，使得所有連鎖店的顧客數總和為最大。

條件限制