簡介
它提供了多種數據預處理功能,如決策表補齊、決策表離散化等及其算法,同時提供了粗糙集中常見的約簡和規則的獲取算法,支持從數據預處理到預測和分析規則的全過程,是一個很好的粗糙集理論軟體和實驗平台。
特點
Rosetta的定位是一個用於簡化模型的通用型工具,而不是針對某一特定領域。
Rosetta平台的可操作性強,便於數據瀏覽。它的界面具有面向對象的特點,每個可操作的對象在界面上都用單獨的項目表示,每個項目包含一些與上下文相關的選單。
它的核心計算功能可用命令行執行,適用於Perl或Python代碼調用。
功能
最近核心計算可能提供的一些功能:
·導入/導出
- 通過ODBC實現DBMS之間的部分整合;
- 將規則、知識最小表示(reduct)、表格、圖例和其他對象轉化為多種格式,包括XML,C++和Prolog。
·預處理
- 填充決策表(decision table)中缺失的數據;
- 數據屬性的離散化。
·計算
- 支持監督學習和非監督學習;
- 支持用戶自定義的區分概念(notions of discernibility)
- 對多種的區分性,有效的生成精確或近似的知識最小表示
- 用知識的最小表示產生if-then規則和描述模式
- 代碼運行
- 支持交叉驗證(cross-validation)
·後處理:
- 先進的知識最小表示和規則過濾功能
·驗證和分析
- 合成規則在未知樣本中的套用
- 生成混淆矩陣(confusion matrices)、ROC曲線和校準曲線(calibration curves)
- 根據高級質量度量,對每個規則進行評估
- 提供統計假設檢驗工具
·其它
- 利用容差關係(tolerance relations)進行聚類
- 計算分割(partitions)和可變精確度的近似粗糙集
- 支持隨機觀察取樣
- 代碼開源
- 完備的說明文檔