文本數據挖掘(Text Mining)是指從文本數據中抽取有價值的信息和知識的計算機處理技術。顧名思義,文本數據挖掘是從文本中進行數據挖掘(Data Mining)。從這個意義上講,文本數據挖掘是數據挖掘的一個分支。文本數據挖掘是一個邊緣學科,由機器學習、數理統計、自然語言處理等多種學科交叉形成。
文本挖掘種類
1.基於單文檔的數據挖掘
2.基於文檔集的數據挖掘
文本挖掘方法
1.文本分類
文本分類是一種典型的機器學習方法,一般分為訓練和分類兩個階段。
2.文本聚類
文本聚類是一種典型的無監督式機器學習方法,聚類方法的選擇取決於數據類型。
3信息抽取
4摘要
5壓縮
其中,文本分類和聚類是兩種最重要最基本的挖掘功能。
挖掘工具
1.IBM DB2 intelligent miner
2.SAS text miner
3.SPSS Text Mining
套用
文本挖掘傳統商業方面的套用主要有,企業競爭情報、CRM、電子商務網站、搜尋引擎,現在已擴展到醫療、保險和諮詢行業。
相關詞條
-
文本挖掘[圖書]
出版社: ISBN: 開本:
圖書信息 內容簡介 作者簡介 -
數據挖掘技術
數據挖掘是從大量的、不完全的、有噪聲的數據中提取隱含在其中的、人們事先不知道的、但又是潛在有用的信息和知識的過程。
1. 引言 2. 數據挖掘的任務 3.數據挖掘對象 -
文本挖掘
圖書信息書 名: 文本挖掘 作 者:費爾德曼 出版社...《文本挖掘(英文版)》是一部文本挖掘領域名著,作者為世界知名的權威學者。書中涵蓋了核心文本挖掘操作、文本挖掘預處理技術、分類、聚類、信息提取...
-
文本挖掘[科學技術]
文本挖掘是近幾年來數據挖掘領域的一個新興分支,文本挖掘也稱為文本資料庫中的知識發現。是從大量文本的集合或語料庫中抽取事先未知的、可理解的、有潛在實用價值...
定義 技術發展 預處理 關鍵技術 -
數據倉庫與數據挖掘
《數據倉庫與數據挖掘》是由陳志泊編著的作品,於2009年05月由清華大學出版社出版。
圖書1 圖書2 目錄 -
文本挖掘原理
文本挖掘原理是科學出版社出版的圖書,作者是程顯毅。價格:45.00元。
內容簡介 編輯推薦 圖書目錄 -
醫學數據挖掘
《醫學數據挖掘》是2006年 高等教育出版社出版的圖書,作者是崔雷。
內容簡介 目錄 序言 -
文本挖掘(英文版)
《文本挖掘(英文版)》是 2009年08月人民郵電出版社出版的圖書,作者是費爾德曼。該書中涵蓋了核心文本挖掘操作、文本挖掘預處理技術、分類、聚類、信息提...
內容簡介 作者簡介 媒體推薦 目錄 -
《Web數據挖掘》
《Web數據挖掘》是信息檢索領域的書籍,該書深入講解了從大量非結構化Web數據中提取和產生知識的技術。書中首先論述了Web的基礎(包括Web信息採集機制...
人民郵電出版社書籍 清華大學出版社書籍