自標準數據

自標準數據

Data,即自帶標準或格式的數據體。 Data,即自帶標準或格式的數據體。 Dock,即數據提供者放數據的場所。

概述

自標準數據自標準數據

自標準數據,Self-StandardData,即自帶標準或格式的數據體。數據提供者按照自己的標準或格式提供數據,並將該數據所使用的標準或格式與所提供的數據一起打包,數據使用者按照該標準或格式自行解讀並使用數據。它是傳統數據標準體系的重要補充和突破。
這一理念由數字油田概念的提出者大慶油田王權提出。目的是為了解決“數據標準過嚴不易推行,過松不易整合”的問題。順應“數據使用者急,積極性高;而提供者不急,積極性不高”的實際情況,按照客觀規律充分調動數據使用者的主動性,減輕數據提供者的負擔。理念一經提出即受到各方面廣泛支持,迅速傳播。

定義

自標準數據,Self-StandardData,即自帶標準或格式的數據體。數據提供者按照自己的標準或格式提供數據,並將該數據所使用的標準或格式與所提供的數據一起打包,數據使用者按照該標準或格式自行解讀並使用數據。它是傳統數據標準體系的重要補充和突破。

性質

自標準數據打破了大家共同遵守統一標準的局限,給數據共享提供了更加切實可行的路徑。其具有如下性質:
(1)自標準數據是一種數據體,它既包含數據本身還包括數據格式;
(2)自標準數據是元數據的一種特例,元數據與數據捆綁;
(3)自標準數據是一種全新的數據共享模式,突破了傳統的數據與標準脫離的局面;
(4)自標準數據是一種客觀、現實的數據管理策略,適應性強;
(5)自標準數據是大數據的基本單元,採用自標準數據技術有利於大數據技術發展;
(6)自標準數據是系統自治思想的套用。

來源

1998年,大慶油田開展了一個項目——《勘探、開發、鑽井數據一體化共享》。該項目目標是建立一個油田內部數據共享的平台。當時認識到,“數據使用者急,積極性高;而提供者不急,積極性不高。”鑒於此,為了實現項目目標,項目組決定順勢而為。項目負責人王權當時提出一個想法,叫做“數據碼頭”,就是數據提供者把數據放在指定位置就不管了,使用者自己去取,去處理。使用者再產生的數據也放到碼頭上。這樣就調動了使用者的主動性,也減輕了提供者的工作量。該想法得到了項目組的認可。但後來大慶油田重組,勘探和鑽井的大部分業務與油田開發分離,此項目下馬。
那時還是要求提供者按統一標準把數據放到“碼頭”上,提供者還要處理數據,所以沒有把提供者的工作量減到最小。當時,還沒有XML,也沒元數據,也沒想到用它來描述數據。
2013年,大慶油田制定信息規划過程中,關於信息共享(十多年過去了,問題依然很多)進行了討論。期間王權對“數據碼頭”思路進行了進一步的擴展,套用XML,讓提供者按照自己的格式提供數據,還要包含這些數據的格式。這樣,這些數據就成為了“自標準數據”,使用者能讀明白,想怎么用就怎么用。大家都方便。
2013年10月,王權為長安大學數字油田論壇第三屆大會準備題為《數據多了就智慧型!》的演講材料時,與數字油田研究所所長高志亮教授、高倩博士進行了較深入的探討,形成了較完整的思路。本屆論壇上,各位專家學者對“自標準數據”給予了充分肯定。參加會議的多位專家學者建議,簡化傳統數據標準,簡政放權,大力推廣“自標準數據”,並認為“自標準數據”將成為大數據時代的有力的信息共享的支撐性技術。

相關技術

配合自標準數據,王權進一步豐富了原來數據碼頭等概念,並進一步提出了數據泵的概念。
數據碼頭,DataDock,即數據提供者放數據的場所。數據提供者把數據放在指定位置就不管了,使用者自己去取,去處理。使用者再產生的數據也放到碼頭上。
數據泵,DataPump,是專門的抽取數據的部件,可以是集中的,或分散的。它可以被看作是傳統數據適配器的改進。其功能是:存取數據,全局統一管理資源目錄、使用許可權等。

自標準數據、數據碼頭與數據泵自標準數據、數據碼頭與數據泵

套用前景

數據標準一直讓人頭疼,主要是難以統一。
客觀上,太嚴格不好執行,太松不好整合。
更重要的,是主觀的,產生數據的人不積極遵守標準,自己方便就行了。
特別是在油田上,產生數據的人都是主角,信息化主要處於弱勢的服務地位,要求勘探開發主營業務人員主動遵守標準,是十分困難的。
自標準數據有望使這一問題得到較好解決。
另外,大數據的迅速發展,傳統的資料庫、數據倉庫、數據銀行的技術都面臨一個信息共享的問題,但都具有提供者不主動、使用者主動的特點,可以套用自標準數據提高海量信息共享的主動性和有效性。

相關詞條

熱門詞條

聯絡我們