標註內容方面,基於句義結構模型的定義標註了句義結構句型層、描述層、對象層和細節層中所包含的各個要素及其組合關係,包括句義類型、謂詞及其時態、語義格類型等信息,並且提供了詞法和短語結構句法信息,便於詞法、句法、句義的對照分析研究。
語料庫組織結構方面,該語料庫包括四個部分,即原始句子庫、詞法標註庫、句法標註庫和句義結構標註庫,可根據研究的需要,在詞法、句法、句義結構標註的基礎上進行深加工,在核心標註庫的基礎上添加更多具有針對性的擴展標註庫,利用句子的唯一ID號進行識別和使用。
語料來源和規模方面,原始數據全部來自新聞語料,經過人工收集、整理,合理覆蓋了主謂句、非主謂句、把字句等六種主要句式類型,規模已達到50000句。
BFS-CTC基於現代漢語語義學,提供了多層次的句義結構標註信息,在兼容現有標註規範的情況下進行了詞法和語法標註。BFS標註的詞法、句法及句義既可以單獨使用也可綜合使用,可用於自然語言處理多方面的研究。
為共同推動漢語語義分析的研究和發展,北京森林工作室(BFS)從2013年4月15日起對外開放下載3,000句句義結構標註示例,更多句義結構標註語料可向BFS申請後免費使用。句義結構的基本形式如下圖所示:
相關詞條
-
BFS-CTC
的漢語句義結構模型,定義了標註規範和標記形式,建設了一個漢語句義結構標註...句義結構分析是漢語語義分析中不可逾越的重要環節,為了滿足漢語句義結構...方面,該語料庫包括四個部分,即原始句子庫、詞法標註庫、句法標註庫和句義結構...
-
自然語言理解與機器翻譯
的雙語語料庫詞對齊基於三元統計模型的漢語分詞及標註一體化研究基於反比機率...的口語句子邊界切分HNC理論的五元組與詞性漢語句蛻處理為NLP創立模式,用...下列10類:漢語的辭彙、句法和語義;語料庫建設與語料庫加工技術;基於...
圖書信息 摘要信息 圖書目錄 -
自然語言處理理論與實戰
介紹自然語言處理技術,包括自然語言處理介紹、語料庫技術、中文分詞、數據...2.2.1 Hello World2.2.2 語句和控制流2.2.3 函式... 傑卡德距離3.4.7 漢明距離3.4.8 標準化歐式距離3.4.9...
主要內容 作者介紹 作品目錄 -
諾亞舟學習機NP5000
在翻譯欄隨意輸入中文或英文語句,即可翻譯成英文或中文,翻譯內容快速...的科學性和人文性。特別是在採用著名的BNC語料庫進行修訂之後,例句真實自然... 提供詞頻:首次標註口語和筆語中常見辭彙的等級,便於讀者學習 突出搭配...
-
諾亞舟NP5000
! 雙向翻譯 在翻譯欄隨意輸入中文或英文語句,即可翻譯成英文或中文...濃郁的科學性和人文性。特別是在採用著名的BNC語料庫進行修訂之後,例句真實...,淺顯易懂 提供詞頻:首次標註口語和筆語中常見辭彙的等級,便於讀者學習...
概況 著作權詞典