簡介
在數字圖書館和全文語義檢索中,敘詞表作為一種語義詞典,是特定科學領域內的表達事物概念的辭彙集合;通過各種方式對敘詞之間的各種詞義联系進行顯示的辭彙系統。基於敘詞表構建領域本體有其優越性Ill敘詞表中的限義詞、含義注釋、等級關係、詞間關係,為領域本體中概念的屬性、實例以及關係的創建提供了線索及指導,這些指導將為領域本體的開發者們節省大量的時間及精力。
敘詞
敘詞是主題詞的一種,它是一些以概念為基礎的、經過規範化的、能顯示詞間語義關係和動態性的詞或詞組,是描述文獻主題的二種標識符Is-el。
所有有序化敘詞之和就構成了敘詞表。在國際標準《1S0 2788 -1974文獻工作一編制單語種敘詞表的規則》中指出:“敘詞表的一個必要的作用是表示出概念間的關係。這種表示是由用以指明概念間的詞之間的相互關係來表示的,一個敘詞和其它詞之間的關係所形成的網路將敘詞置於語義空間之中,從而提供出一種定義”。
敘詞表的語義關係
敘詞表採用參照符號顯示並清楚地區分敘詞間基本語義關係。敘詞表中包括以下3種關係。
(1)等同關係(Equivalence Relationship),又稱同一關係、用代關係,是指一組詞或詞組在概念上完全相同或意義接近。揭示等同關係有利於增加檢索人口和根據檢索系統需要對標引和檢索的專指度進行控制。
(2)等級關係(Hierarchical Relationship),又稱屬分關係,是指概念內涵相同、外延範圍大小不同的詞之間的關係,族首詞則是一種特殊的屬分關係,其外延範圍最大。揭示等級關係有助牙通過它擴大和縮小查找範圍,提高族性檢索能力。
(3)相關關係(Associative Relationship),又稱類緣關係,是指概念內涵之間語義联系的詞間關係。這些詞間關係作用主要表現在以下幾個方面:
①在敘詞表中形成一定的結構,即在特定的語義空間把主題詞安排在一定位置上,使其詞義明確,用法一致。
②通過詞間關係將自然語言轉為受控語言,保證標引和檢索使用的語言一致。
③通過詞間關係在敘詞表中形成一種隱性的分類體系,使用者可以進行擴檢或縮檢。
語義關係在敘詞表中的表現(見圖1),以《中國分類主題詞表》的款目為例,詞款目中各參照項構成了一個詞的語義網路。其中D(代)與款目詞是等同關係,這些詞都是非敘詞,由款目詞代替;F(分)是指款目詞的下位詞,S(屬)指款目詞的上位詞,C(參)指款目詞的相關詞,Z(族)表示的詞稱為族首詞,也就是最上位詞。
敘詞表的缺陷
敘詞表中雖然用“用、代、分、屬、參”等參照項來描述語義之間的關係,但這種關係的定義並不嚴格,往往並不是完全遵守同一種邏輯來劃分,有時一種關係可能會有幾種劃分方式。例如,敘詞最常用的等級關係(BT/NT)中就可能包括以下幾種情況:包容關係:如酒和紅酒;整體和部分關係:如桌子和抽屜;類和實例關係:如海洋和太平洋;角色關係:如蘋果和生產者;屬性關係:如蘋果和顏色;屬性值關係:如蘋果和紅色。
同樣,即使是等同關係(OF/USE)也不是完全的可以替代的關係,很多情況下有近義詞,有時甚至有反義詞出現。至於相關關係,由於沒有統一的標準,其表現出來的邏輯更是各種各樣。
敘詞語言的基本原理
概念組配是其最基本的原理。
概念組配的類型
(1)交叉組配
(2)限定組配 亦稱方面組配,是指將表示某一事物的敘詞和表示事物某一屬性、某一方面問題的敘詞所進行的組配。它是以概念的限定方式為基礎,由泛指的屬概念過渡到專指種概念的一種組配。
(3)聯結組配
敘詞語言的特點
(1)組配方法科學 概念相交、概念限定、概念聯結等,保證了多途徑多因素檢索和擴檢、縮檢功能
(2)辭彙控制技術完善,顯示手段多樣
(3)具有完善的參照系統,詞間關係指示明確
(4)以組配式標識作為自己的基本辭彙,但也適當採用了預先組配的方法,選用了一定數量的詞組性敘詞
敘詞表示嚴密的語義關係
根據詞義的需要,敘詞相互之間有3種語義關係:
①等同關係(用—代),指敘詞與非敘詞之間的關係,以符號Y(用)、D(代)來表示;其中Y項為標引詞,D項為引導詞。
②等級關係(分—屬—族),指隸屬關係,以符號F(分)、S(屬)、Z(族)來表示:其中F項是狹義詞,屬下位概念;S項是廣義詞,屬上位概念;Z項是最上位概念,為一族之首。
③相關關係(參—參),指詞間相互關係,即互為參照,以C(參)來表示。敘詞間的語義關係是敘詞法的一個特點。
用敘詞法編制的敘詞索引(主題詞索引),是一種有效的文獻檢索工具。為了滿足多種途徑檢索的需要,敘詞索引一般還編有多種輔助索引,如範疇索引、詞族索引、輪排索引及雙語種對照索引等。敘詞法的具體體現是敘詞表(主題詞表),例如中國1980年出版的《漢語主題詞表》等。
敘詞表
它是將文獻、標引人員和用戶的自然語言,轉換成規範化的系統語言的一種術語控制工具,是概括由自然語言優選出的語義相關、族性相關的學科術語所組成的一種規範化動態詞典。
發展
敘詞表最早出現在美國。第一部用於情報檢索的敘詞表是美國杜邦公司於1959年前後編制的。1960年,美國武裝部隊技術情報局 (ASTIA)首先編成並用於電子計算機文獻檢索的敘詞表、1961年,美國化學工程師協會(AICHE)出版的《化學工程敘詞表》,為敘詞表的發展奠定了基礎。
組成
敘詞表一般由一個主表與若干個附表和輔表所組成。
•主表(亦稱字順表)是將全部主題詞按字順排列,並添加必要的標註項和顯示詞間等同、等級或相關關係的參照項,是敘詞表的主體結構。
•附表為專有敘詞索引,如地區索引、機構索引、人名索引、產品索引等,是從主表中分離出來的專用辭彙表,是主表的組成部分。
•輔表一般有詞族索引(族系表)、範疇索引(分類表)、輪排索引(輪排表)、雙語種對照索引等,它們是敘詞表的輔助部分。
•詞族索引也稱等級索引,是利用概念成族原理(根據概念的等級關係)將有關敘辭彙集在一起成為一族,構成一個從泛指敘詞到專指敘詞的等級系統,從而可從一族中外延最廣的敘詞(族首詞)出發,找到一系列同族的敘詞,並且可以明確它們之間的層層隸屬關係。詞族索引是機器檢索時實現自動擴檢、滿足族性檢索要求的重要手段。
•範疇索引也稱分類索引,是將敘詞按其概念所屬學科或範疇分成若干大類,在大類之下再分成若干小類,在小類之下則將敘詞按字順排列,形成一個類似體系分類表的概念分類系統,便於從學科或專業的角度選用敘詞。
•輪排索引是利用字面成族原理,將含有相同單詞的詞組敘辭彙集在一起,排列在該單詞之下,可從它出發查到任何含有該單詞的詞組敘詞。一個詞組敘詞由幾個單詞構成便可輪排幾次,能在幾處查到它。輪排索引便於查找,並在某種程度上起族性檢索作用。
•雙語種對照索引可提供從另一種語言字順入手查詞的途徑,有助於在標引外文文獻時選準敘詞或利用本國敘詞表查閱外國的檢索工具。
影響
敘詞表的出現是情報檢索方法的一次突破。據統計,全世界已有 500多種敘詞表。它們大體上可以分為兩類:綜合性的和專業性的。綜合性敘詞表中比較有影響的是美國《工程與科學主題詞表》和《日本科學技術情報中心主題詞表》;專業性敘詞表有美國的《航空和航天局主題詞表》、《國際核情報系統主題詞表》、英國的《電機工程師協會主題詞表》等。中國有60餘部敘詞表,其中綜合性敘詞表有《漢語主題詞表》和《國防科學技術主題詞典》;專業性敘詞表有《航空科技資料主題詞表》、《電子技術漢語主題詞表》、《化學工業主題詞表》等。這些敘詞表作為情報檢索系統的語言工具都已投入使用。
四層含義
(1)敘詞表是敘詞的集合
(2)敘詞表是一種術語控制工具
(3)敘詞表是一種規範化的詞典
(4)敘詞表是一種動態的術語系統
敘詞表的巨觀結構
(1)字順系統
①字順表 利用字順表,用戶可以從語詞的字面形式出發,按其字順查找相應的敘詞;或通過參照系統找到更切合需要的敘詞。
②專有敘詞表 其敘詞與主表中的敘詞具有等同效力,可用於標引和檢索,此外,還能控制字順表詞量,並提供按類查詞的途徑。
③輪排索引
④雙語種對照索引
⑤入口詞表
(2)邏輯系統
①範疇索引
範疇索引功能:
Ⅰ)便於從學科或專業的角度查找敘詞;
Ⅱ)可作為組織分類主題目錄或其它分類檢索工具的依據;
Ⅲ)有利於編制詞表時控制詞量和詞間關係,在編制詞表時起分工協作的作用。
②詞族索引
主要功能:
Ⅰ)提供從敘詞的等級關係(屬分關係)查找敘詞的途徑;
Ⅱ)限定詞義,有利於標引和檢索時提高選詞的準確性;
Ⅲ)可滿足族性檢索的要求;
Ⅳ)起自動擴大和縮小檢索範圍的作用
③詞族表
④分類表