網路空間知識獲取可以分為文本知識獲取、圖片知識獲取和視音頻知識獲取三個方面。
面向文本的知識獲取。向文本的知識獲取是指從文本中自動獲取實體、事件和相關屬性等知識,並對這些知識進行結構化組織。文本的知識獲取從所抽取的內容上分主要包括實體知識抽取、事件抽取、屬性抽取三個部分。
面向圖片的知識獲取。當前研究的面向圖片的知識獲取是指圖片中的概念檢測、三元組關係檢測等,以及相關的知識圖譜生成技術。圖片知識獲取主要包括基於人工設計的特徵表達方法和基於深度學習的特徵提取方法和基於圖片的視覺關係檢測。
面向視音頻的知識獲取。面向視音頻的知識獲取是指從視音頻數據中抽取實體、實體特徵、實體間關係等知識的過程。其涉及到視音頻的表示、視音頻與語言的關聯兩個方面的內容。通常,在得到視音頻的語言描述後,可以進一步基於視音頻語言描述文本的信息進行結構化的抽取。