大數據知識工程(BigKE: Knowledge Engineering with Big Data)是從國內興起、引領大數據分析走向大知識研究和套用的一個國際前沿研究方向。2014年1月,吳信東教授等提出了大數據在異構、自治、複雜、演化環境下的HACE定理。2015年9月,吳信東與鄭南寧院士、陸汝鈐院士等基於HACE定理提出了大數據知識工程的頂層設計與研究綱要。不同於依靠領域專家的傳統知識工程,大數據知識工程除權威知識源以外,知識主要來源於用戶生成內容(UGC: User-Generated Contents),具有海量異質的特點,知識庫需要自完善與增殖能力,問題求解過程根據用戶互動進行學習。
依據大數據知識工程的頂層設計與研究綱要,本研究旨在建立大數據知識工程基礎理論,形成利用海量、低質、無序的碎片化知識構建新型知識服務平台的方法學體系。本研究有望突破以專家知識為核心的傳統知識工程中的“知識獲取”和“知識再工程”兩個瓶頸問題,並在醫療、教育、商業等各領域都具有巨大需求。
科學問題:本研究主要以構建具有群智、增殖、適配特徵的大數據知識工程的基礎理論為目標,以解決大數據知識工程中的碎片化知識表示、質量、適配問題為切入點,提煉並突破三個關鍵科學問題:(1)探索碎片化知識發現、表示與演化規律。提出適應碎片化知識分面、多維度、即時動態等特徵的表示模型與線上挖掘方法,揭示碎片化知識的時空特性和演化機理,構建知識演化模型。(2)揭示碎片化知識拓撲融合機理。依據“拓撲影響機理”這一普適原理,分析碎片化知識間語義關聯的拓撲與湧現特性,研究動態挖掘與拓撲融合機理,實現知識量質轉換與增殖。(3)構建個性化知識導航的互動模型。針對碎片化知識的無序性與用戶需求的動態多樣性,設計多粒度情景感知與知識尋徑模型,建立逐步求精的知識適配模型。