定點計算

定點計算

在給定的直角坐標繫上,坐標全是整數的點,叫做整點;全部整點構成的組就叫做空間格網。在空間格線里的運算稱為定點運算。除定點運算外的當然就是浮點運算。

簡介

定點數:通俗的說,小數點固定的數。以人民幣為例,我們日常經常說到的如123。45¥,789。34¥等等,默認的情況下,小數點後面有兩位小數,即角,分。如果小數點在最高有效位的前面,則這樣的數稱為純小數的定點數,如0。12345,0。78934等。如果小數點在最低有效位的後面,則這樣的數稱為純整數的定點數,如12345,78934等。

表示數的一種方法,其中小數點的位置是固定的。在表示一個數時,小數點一般固定在數的最高位之前,使得數(即尾數或數碼)的絕對值小於1,它的形式為數符·尾數。對整型數,小數點固定在數的最低位。用定點表示法表示的數,稱為定點數。

浮點數:一般說來,小數點不固定的數。比較容易的理解方式是,考慮以下我們日常見到的科學記數法,拿我們上面的數字舉例,如123.45,可以寫成以下幾種形式:12.345x1011;2345x1020;12345x103為了表示一個數,小數點的位置可以變化,即小數點不固定。

資料中、小型計算機和微型計算機在用於仿真計算或作為專用控制機時,為了保訊計算速度,在語言上多採用彙編語言,在點制上多採用定點數。用定點數計算,要 求參與運算的各量無論是初值或中間結果、最後結果的值都必須嚴格地限制在(-1,+1)區間內,否則在運算過程中會產生溢出。

DSP晶片的定點運算

在定點DSP晶片中,採用定點數進行數值運算,其運算元一般採用整型數來表示。一個整型數的最大表示範圍取決於DSP晶片所給定的字長,一般為16位或24位。顯然,字長越長,所能表示的數的範圍越大,精度也越高。如無特別說明,本書均以16位字長為例。 DSP晶片的數以2的補碼形式表示。每個16位數用一個符號位來表示數的正負,0表示數值為正,1則表示數值為負。其餘15位表示數值的大小。

因此 ,二進制數0010000000000011b=8195 二進制數1111111111111100b=-4 對DSP晶片而言,參與數值運算的數就是16位的整型數。但在許多情況下,數學運算過程中的數不一定都是整數。那么,DSP晶片是如何處理小數的呢?應該說,DSP晶片本身無能為力。那么是不是說DSP晶片就不能處理各種小數呢?當然不是。這其中的關鍵就是由程式設計師來確定一個數的小數點處於16位中的哪一位。這就是數的定標。 通過設定小數點在16位數中的不同位置,就可以表示不同大小和不同精度的小數了。數的定標有Q表示法和S表示法兩種。表3.1列出了一個16位數的16種Q表示、S表示及它們所能表示的十進制數值範圍。 從表3.1可以看出,同樣一個16位數,若小數點設定的位置不同,它所表示的數也就不同。例如: 16進制數2000H=8192,用Q0表示 16進制數2000H=0.25,用Q15表示 但對於DSP晶片來說,處理方法是完全相同的。 從表3.1還可以看出,不同的Q所表示的數不僅範圍不同,而且精度也不相同。Q越大,數值範圍越小,但精度越高;相反,Q越小,數值範圍越大,但精度就越低。例如,Q0的數值範圍是-32768到+32767,其精度為1,而Q15的數值範圍為-1到0.9999695,精度為 1/32768 = 0.00003051。因此,對定點數而言,數值範圍與精度是一對矛盾,一個變數要想能夠表示比較大的數值範圍,必須以犧牲精度為代價;而想提高精度,則數的表示範圍就相應地減小。在實際的定點算法中,為了達到最佳的性能,必須充分考慮到這一點。 浮點數與定點數的轉換關係可表示為: 浮點數(x)轉換為定點數( ): 定點數( )轉換為浮點數(x): 例如,浮點數 x=0.5,定標 Q=15, 表示下取整。反之,一個用 Q=15 表示的定點數16384,其浮點數為16384×2-15 =16384/32768=0.5。

從浮點到定點

在編寫DSP模擬算法時,為了方便,一般都是採用高級語言(如C語言)來編寫模擬程式。程式中所用的變數一般既有整型數,又有浮點數。如例3.1程式中的變數i是整型數,而pi是浮點數,hamwindow則是浮點數組。

例3.1 256點漢明窗計算

inti;

floatpi=3.14159;

floathamwindow[256];

for(i=0;iQy,加法/減法結果z的定標值為Qz,則

z=x+yÞ

所以定點加法可以描述為:

intx,y,z;

longtemp;

temp=y>(Qx-Qz)),若Qx≥Qz

z=(int)(temp>2)=29491;

因為z的Q值為13,所以定點值z=29491即為浮點值z=29491/8192=3.6。

例3.3定點減法

設x=3.0,y=3.1,則浮點運算結果為z=x-y=3.0-3.1=-0.1;

Qx=13,Qy=13,Qz=15,則定點減法為:

x=24576;y=25295;

temp=25395;

temp=x-temp=24576-25395=-819;

因為QxQy,加法結果z的定標值為Qz,則定點加法為:

intx,y;

longtemp,z;

temp=y>(Qx-Qz),若Qx≥Qz

z=temp32767,因此

Qx=1,Qy=0,Qz=0,則定點加法為:

x=30000;y=20000;

temp=20000>1=35000;

因為z的Q值為0,所以定點值z=35000就是浮點值,這裡z是一個長整型數。

當加法或加法的結果超過16位表示範圍時,如果程式設計師事先能夠了解到這種情況,並且需要保證運算精度時,則必須保持32位結果。如果程式中是按照16位數進行運算的,則超過16位實際上就是出現了溢出。如果不採取適當的措施,則數據溢出會導致運算精度的嚴重惡化。一般的定點DSP晶片都設有溢出保護功能,當溢出保護功能有效時,一旦出現溢出,則累加器ACC的結果為最大的飽和值(上溢為7FFFH,下溢為8001H),從而達到防止溢出引起精度嚴重惡化的目的。

3.2.2乘法運算的C語言定點模擬

設浮點乘法運算的表達式為:

floatx,y,z;

z=xy;

假設經過統計後x的定標值為Qx,y的定標值為Qy,乘積z的定標值為Qz,則

z=xyÞ

=

所以定點表示的乘法為:

intx,y,z;

longtemp;

temp=(long)x;

z=(temp×y)>>(Qx+Qy-Qz);

例3.5定點乘法

設x=18.4,y=36.8,則浮點運算值為z=18.4×36.8=677.12;

根據上節,得Qx=10,Qy=9,Qz=5,所以

x=18841;y=18841;

temp=18841L;

z=(18841L*18841)>>(10+9-5)=354983281L>>14=21666;

因為z的定標值為5,故定點z=21666即為浮點的z=21666/32=677.08。

3.2.3除法運算的C語言定點模擬

設浮點除法運算的表達式為:

floatx,y,z;

z=x/y;

假設經過統計後被除數x的定標值為Qx,除數y的定標值為Qy,商z的定標值為Qz,則

z=x/yÞ

所以定點表示的除法為:

intx,y,z;

longtemp;

temp=(long)x;

z=(temp

constintlength=180

voidfilter(intxin[],intxout[],intn,floath[]);

staticfloath[19]=

{0.01218354,-0.009012882,-0.02881839,-0.04743239,-0.04584568,

-0.008692503,0.06446265,0.1544655,0.2289794,0.257883,

0.2289794,0.1544655,0.06446265,-0.008692503,-0.04584568,

-0.04743239,-0.02881839,-0.009012882,0.01218354};

staticintx1[length+20];

voidfilter(intxin[],intxout[],intn,floath[])

{

inti,j;

floatsum;

for(i=0;i

constintlength=180;

voidfilter(intxin[],intxout[],intn,inth[]);

staticinth[19]={399,-296,-945,-1555,-1503,-285,2112,5061,7503,8450,

7503,5061,2112,-285,-1503,-1555,-945,-296,399};

staticintx1[length+20];

voidfilter(intxin[],intxout[],intn,inth[])

{

inti,j;

longsum;

for(i=0;i>15;

}

for(i=0;i<(n-1);i++)x1[n-i-2]=xin[length-i-1];

}

主程式與浮點的完全一樣。

相關詞條

相關搜尋

熱門詞條

聯絡我們