分類過程採用基於統計的方法和向量空間模型可以對常見的文本網頁信息進行分類,分類的準確率可以達到85%以上。分類速度50篇/秒。
相關詞條
-
文本分類
文本分類用電腦對文本集(或其他實體或物件)按照一定的分類體系或標準進行自動分類標記。屬於一種基於分類體系的自動分類,是樸素貝葉斯分類方法。
定義 過程 方法 開源軟體 參考文獻 -
自動文本摘要
所謂自動文摘就是利用計算機自動地從原始文獻中提取文摘,文摘是全面準確地反映某一文獻中心內容地簡單連貫的短文。常用方法是自動摘要將文本作為句子的線性序列,...
類型 提取 -
基於遺傳算法的文本分類及聚類研究
2.2文本的表示 2.5文本分類方法 2.6文本聚類方法
基本相信 內容簡介 目錄 前言 -
中文文本自動分詞和標註
第一節 第二節 第二節
基本信息 圖書簡介 本書目錄 -
文本挖掘[科學技術]
文本挖掘是近幾年來數據挖掘領域的一個新興分支,文本挖掘也稱為文本資料庫中的知識發現。是從大量文本的集合或語料庫中抽取事先未知的、可理解的、有潛在實用價值...
定義 技術發展 預處理 關鍵技術 -
文本分析
文本分析是指對文本的表示及其特徵項的選取;文本分析是文本挖掘、信息檢索的一個基本問題,它把從文本中抽取出的特徵詞進行量化來表示文本信息。文本(text)...
特徵 特徵選取方式 -
駕馭文本:文本的發現、組織和處理
《駕馭文本:文本的發現、組織和處理》是2015年7月電子工業出版社出版的圖書,作者是【美】格蘭特.英格索爾,托馬斯.莫頓, 安德魯.法里斯。
內容簡介 內容提要 作者簡介 譯者簡介 目錄 -
雲模型與文本挖掘
《雲模型與文本挖掘》是2013年人民郵電出版社出版的圖書,作者是代勁,宋娟,胡峰,伍建全等編著。
圖書簡介 圖書簡介 圖書目錄 -
自動標引
自動標引(英語:Automatic Indexing)包括關鍵字自動提取(又稱自動抽詞標引)與自動賦詞標引兩種類型。關鍵字自動提取是一種識別有意義且具有...
作用 發展過程 代表方法 典型套用