rmq

rmq

RMQ (Range Minimum/Maximum Query)問題是指:對於長度為n的數列A,回答若干詢問RMQ(A,i,j)(i,j

簡介

主要方法及複雜度如下:

1、樸素(即搜尋),O(n)-O(qn) online。

2、線段樹,O(n)-O(qlogn) online。

3、ST(實質是動態規劃),O(nlogn)-O(q) online。

ST算法(Sparse Table),以求最大值為例,設d[i,j]表示[i,i+2^j-1]這個區間內的最大值,那么在詢問到[a,b]區間的最大值時答案就是max(d[a,k], d[b-2^k+1,k]),其中k是滿足2^k<=b-a+1(即長度)的最大的k,即k=[ln(b-a+1)/ln(2)]。

d的求法可以用動態規劃,d[i, j]=max(d[i, j-1],d[i+2^(j-1), j-1])。

4、RMQ標準算法:先規約成LCA(Lowest Common Ancestor),再規約成約束RMQ,O(n)-O(q) online。

首先根據原數列,建立笛卡爾樹,從而將問題線上性時間內規約為LCA問題。LCA問題可以線上性時間內規約為約束RMQ,也就是數列中任意兩個相鄰的數的差都是+1或-1的RMQ問題。約束RMQ有O(n)-O(1)的線上解法,故整個算法的時間複雜度為O(n)-O(1)。

ST算法

ST表 RMQ ST表 RMQ

來看一下ST算法是怎么實現的(以最大值為例):

首先是預處理,用一個DP解決。設a是要求區間最值的數列,f[i,j]表示從第i個數起連續2^j個數中的最大值。例如數列3 2 4 5 6 8 1 2 9 7 ,f[1,0]表示第1個數起,長度為2^0=1的最大值,其實就是3這個數。f[1,2]=5,f[1,3]=8,f[2,0]=2,f[2,1]=4……從這裡可以看出f[i,0]其實就等於a[i]。這樣,DP的狀態、初值都已經有了,剩下的就是狀態轉移方程。我們把f[i,j](j≥1)平均分成兩段(因為j≥1時,f[i,j]一定是偶數個數字),從i到i+2^(j-1)-1為一段,i+2^(j-1)到i+2^j-1為一段(長度都為2^(j-1))。用上例說明,當i=1,j=3時就是3,2,4,5 和6,8,1,2這兩段。f就是這兩段的最大值中的最大值。於是我們得到了動規方程F[i,j]=max(F[i,j-1],F[i+2^(j-1),j-1])。

接下來是得出最值,也許你想不到計算出f有什麼用處,一般要想計算max還是要O(logn),甚至O(n)。但有一個很好的辦法,做到了O(1)。還是分開來。如在上例中我們要求區間[2,8]的最大值,就要把它分成[2,5]和[5,8]兩個區間,因為這兩個區間的最大值我們可以直接由f[2,2]和f[5,2]得到。擴展到一般情況,就是把區間[l,r]分成兩個長度為2^n的區間(保證有f對應)。直接給出表達式:

k:=trunc(ln(r-l+1)/ln(2));

ans:=max(F[l,k],F[r-2^k+1,k]);

這樣就計算了從l開始,長度為2^k的區間和從r-2^k+1開始長度為2^k的區間的最大值(表達式比較繁瑣,細節問題如加1減1需要仔細考慮),二者中的較大者就是整個區間[l,r]上的最大值。

標準算法

建立笛卡爾樹

數組A[0,N-1]的笛卡爾樹C是這樣一棵二叉樹:當N=0,它是一棵空樹,否則它的根節點是A中的一個最小元素A[i](並以這個最小元素的下標i標記),而左右子樹分別是A[0,i-1]和A[i+1,N-1]的一棵笛卡爾樹。注意如果A中有相等的元素,則A的笛卡爾樹不一定唯一,但在這裡我們限定所用的最小元素為在數組中最先出現者,在此限制下笛卡爾樹是唯一的。

容易看出,數組A在閉區間[l,r]上的最小值等同於笛卡爾樹C中下標為l和r的兩個頂點的最近公共祖先(LCA)的值。由此,RMQ問題可以轉化為LCA問題。下面說明如何在O(n)時間內實現這一轉化。

我們將要將A的元素依次插入笛卡爾樹C。每次插入都可能使樹的形態發生變化。為了在O(N)的時間內完成整個插入過程,考慮C的右鏈,即根結點、根結點的右兒子、根結點的右兒子的右兒子……組成的鏈。注意這些元素的下標和值都是遞增的。下標最大,即將要插入的元素A[i]一定是新樹右鏈的最後一個元素。原來的右鏈中,值比A[i]大的元素在新樹中不再屬於右鏈,這些元素組成的鏈成為A[i]的左子樹的右鏈;原來右鏈中的其它元素加上A[i]組成了新的右鏈。初看起來,尋找分界點的最佳方法是O(logN)時間的二分查找;但是對於整個過程來說,O(NlogN)的時間複雜度不是最優的。關鍵在於一旦一個元素比A[i]大,它就從右鏈中被永久地移除了。如果按照從後到前的順序判斷一個元素是否大於A[i],則每次插入的時間複雜度為O(k+1),k為本次插入中移除的右鏈元素個數。因為每個元素最多進出右鏈各一次,所以整個過程的時間複雜度為O(N)。

用一個棧結構維護右鏈元素的下標,上述過程可以很容易地實現。(見下面代碼部分)

轉化為約束RMQ

為了將LCA問題轉化為約束RMQ,我們注意到任意樹中兩個結點u和v的LCA就是在一次從樹根開始的深度優先搜尋中,在u和v之間(包括回溯時)到達的結點中層數最小的一個。為了利用這一事實,我們建立三個數組:

E[1,2*N-1]:在一次深度優先搜尋(恰好是樹的一次歐拉環遊)中每一步到達的結點。

L[1,2*N-1]:E中對應結點在樹中的層數。

H[1,N]:每個結點在E中某一次出現的下標(不妨設為第一次)。

則對任意u和v,不妨設H[u]≤H[v](否則交換u和v),只要在L中找到[H[u],H[v]]中最小值的下標i,則E[i]就是u和v的LCA。注意到L滿足約束RMQ的條件(相鄰元素差的絕對值為1),這說明原來的LCA問題已經被轉化為約束RMQ。轉化過程顯然能在O(N)時間內完成。

約束RMQ的解法

現在仍舊用A[0,N-1]表示問題中的數列,這裡有|A[i]-A[i-1]|=1(i=1,2,...,N-1)成立。

將A分解為長度為l=[(log N)/2]的塊。設A'[i]為第i塊中的最小值,B[i]為該最小值的位置。A'[i]和B[i]的長度均為N/l, 所以用ST算法處理A'數組的時空複雜度均為O(N/l*log(N/l))=O(N/logN*(logN-logl))=O(N)。預處理之後,對任意多連續的塊進行的查詢都能在O(1)時間內實現。餘下的問題是如何進行塊內查詢。

注意到對任意一塊中的塊內查詢的結果有影響的唯一因素是塊內每相鄰兩個元素間的“升降關係”構成的序列。因為每兩個元素之間的關係只有兩種(“+1”、“-1”),而塊的長度又只有l=[(log N)/2],所以本質不同的塊最多有2^I=O(sqrt N)種。對每種塊中所有可能的塊內查詢預處理出答案的時空複雜度是O(sqrt N*l^2)=O(N)(這裡的O(N)表示不超過線性時間)。預處理出所有塊的“類型”,並用二進制數存儲的時間複雜度是O(N)。

此後,每次查詢可以分為兩種情況:

1、塊內查詢,答案已經被預處理出,只要在數組中找到它即可。

2、塊間查詢,可以分解為2個塊內查詢,和一個A'上的RMQ,三者的時間複雜度都是O(1)。

綜上,我們給出了一個預處理時間為O(n),查詢時間為O(1)的線上RMQ算法。

代碼

RMQ(Range Minimum/Maximum Query)問題是求區間最值問題。你當然可以寫個O(n)的(怎么寫都可以),但是萬一要詢問最值1000000遍,估計你就要掛了。這時候你可以放心地寫一個線段樹(前提是不寫錯)O(logn)的複雜度應該不會掛。但是,這裡有更牛的算法,就是ST算法,它可以做到O(nlogn)的預處理,O(1)地回答每個詢問。

ST算法,Pascal,程式片段

ST算法,Pascal,完整過程

ST算法,C++

ST算法,JAVA

建立笛卡爾樹,C++

相關詞條

相關搜尋

熱門詞條

聯絡我們