判定程式

判定程式

對於邏輯或數學中的問題,依據一種能行的方法,作出“是”或“否”的明確回答,這一過程,稱為判定。在計算機科學中,判定程式是指對研究對象作出屬於哪個域(屬性)或對研究對象的是否好壞作出明確回答的程式。判定程式在很多領域都有套用,例如分類、識別問題。

簡介

判定程式是指對研究對象作出屬於哪個域(屬性)或對研究對象的是否好壞作出明確回答的程式。判定程式有很多種,一般與具體套用有關。例如測試計算機性能的基準程式就是一個判定程式;又如機器學習或深度學習中,分類器就是一個判定程式。

判定

對於邏輯或數學中的問題,依據一種能行的方法,作出“是”或“否”的明確回答,這一過程,稱為判定。所謂能行方法,包括兩個要點:第一,有限,即一個判定,必須在有限步內完成;第二,機械,即判定程式的每一步,都有明確的規則作為依據。這個術語特別用於這樣的求解步驟,在一個特定的形式系統中,某個特定的公式能否證明為該系統的一個定理。

基準程式

基準程式是用來測量計算機處理速度的一種實用程式,以便於被測量的計算機性能可以與運行相同程式的其它計算機性能進行比較。具有快速處理器的計算機在基準程式上性能極佳,但如果計算機配備的是慢速硬碟及缺少大量存儲器,其性能會令用戶失望。按基準程式的構造特點可以把它劃分成四類,即:核心程式、小基準程式、合成基準程式以及基準測試程式組。

核心程式

核心程式是從真實程式中抽取的具有代表性的最耗時的程式段匯集而成的,它們的代碼很短,但是非常關鍵。Livermore Loops及LINPACK是兩種最常見的核心程式。LINACK用FORTRAN語言編寫,主要是進行浮點加法和浮點乘法的操作。這些代碼的執行時間直接影響到程式總的回響時間。用戶不會直接使用核心程式,因為它的功能僅僅是用來測試計算機性能。核心程式可以根據需要來評價機器的各種性能,從而解釋在運行真實程式時機器性能不同的原因。

小基準程式

小基準程式代碼一般在100行以內。用戶可以隨時縮寫一些這樣的程式來測試系統的各種功能,並產生用戶已預知的輸出結果。通常選取實際套用中具有代表性的求解算法構成這一類基準程式,如皇后問題、迷宮問題、快速排序、求素數等,這類流行的測試程式都具有短小、易輸入、通用等特點,最適於作一些基本測試。

合成基準程式

合成基準程式是人為合成的測試程式。首先要對大量應用程式中的操作進行統計,得到各種操作所占的比例,再按這個比例人為地寫出測試程式。Whetstone與Dhrystone是最流行的合成基準程式。在操作類型和運算元類型這兩個方面,合成基準程式試圖保持與大量程式中的比例一致。用戶不會自己產生合成基準程式,因為其中沒有任何用戶能夠使用的代碼。合成基準程式完全是人為製造出來的,與實際套用相差更遠。其中整數測試程式是Dhrystone用C語言編寫的,共有100條語句,它包括:各種賦值語句、數據類型和數據區、控制語句,過程調用和參數傳送、整數運算和邏輯操作。Whetstone基準測試程式是用FORTRAN語言編寫的綜合性測試程式,主要包括:浮點運算、整數算術運算、功能調用、數組變址、條件轉移、超越函式。

基準測試程式組

基準測試程式組就是一組各個方面有代表性的基準程式組成的一個通用基準程式集合。這個基準程式的集合稱為基準程式組(benchmark suites),它的最大優點是避免了獨立基準程式存在的片面性,儘可能全面地測試了一個計算機系統的性能,因此對計算機系統設計有比較大的指導意義 。

分類器

分類是數據挖掘的一種非常重要的方法。分類的概念是在已有數據的基礎上學會一個分類函式或構造出一個分類模型(即我們通常所說的分類器(Classifier))。該函式或模型能夠把資料庫中的數據紀錄映射到給定類別中的某一個,從而可以套用於數據預測。總之,分類器是數據挖掘中對樣本進行分類的方法的統稱,包含決策樹、邏輯回歸、樸素貝葉斯、神經網路等算法。

決策樹分類器

提供一個屬性集合,決策樹通過在屬性集的基礎上作出一系列的決策,將數據分類。這個過程類似於通過一個植物的特徵來辨認植物。可以套用這樣的分類器來判定某人的信用程度,比如,一個決策樹可能會斷定“一個有家、擁有一輛價值在1.5 萬到2.3 萬美元之間的轎車、有兩個孩子的人”擁有良好的信用。決策樹生成器從一個“訓練集”中生成決策樹。SGI 公司的數據挖掘工具MineSet 所提供的可視化工具使用樹圖來顯示決策樹分類器的結構,在圖中,每一個決策用樹的一個節點來表示。圖形化的表示方法可以幫助用戶理解分類算法,提供對數據的有價值的觀察視角。生成的分類器可用於對數據的分類。

選擇樹分類器

選擇樹分類器使用與決策樹分類器相似的技術對數據進行分類。與決策樹不同的是,選擇樹中包含特殊的選擇節點,選擇節點有多個分支。比如,在一棵用於區分汽車產地的選擇樹中的一個選擇節點可以選擇馬力、汽缸數目或汽車重量等作為信息屬性。在決策樹中,一個節點一次最多可以選取一個屬性作為考慮對象。在選擇樹中進行分類時,可以綜合考慮多種情況。選擇樹通常比決策樹更準確,但是也大得多。選擇樹生成器使用與決策樹生成器生成決策樹同樣的算法從訓練集中生成選擇樹。MineSet 的可視化工具使用選擇樹圖來顯示選擇樹。樹圖可以幫助用戶理解分類器,發現哪個屬性在決定標籤屬性值時更重要。同樣可以用於對數據進行分類。

證據分類器

證據分類器通過檢查在給定一個屬性的基礎上某個特定的結果發生的可能性來對數據進行分類。比如,它可能作出判斷,一個擁有一輛價值在1.5 萬到2.3 萬美元之間的轎車的人有70 %的可能是信用良好的,而有30 %的可能是信用很差。分類器在一個簡單的機率模型的基礎上,使用最大的機率值來對數據進行分類預測。與決策樹分類器類似,生成器從訓練集中生成證據分類器。MineSet 的可視化工具使用證據圖來顯示分類器,證據圖由一系列描述不同的機率值的餅圖組成。證據圖可以幫助用戶理解分類算法,提供對數據的深入洞察,幫助用戶回答像“如果... 怎么樣" 一類的問題。同樣可以用於對數據進行分類。

相關詞條

熱門詞條

聯絡我們