电竞比分网-中国电竞赛事及体育赛事平台

分享

數(shù)據(jù)元與元數(shù)據(jù)

 牛人的尾巴 2021-01-29

元數(shù)據(jù):描述其它數(shù)據(jù)的數(shù)據(jù)(data about other data)

元數(shù)據(jù)是關(guān)于數(shù)據(jù)的數(shù)據(jù),在某些時(shí)候不特指某個(gè)單獨(dú)的數(shù)據(jù),可以理解為是一組用來描述數(shù)據(jù)的信息組/數(shù)據(jù)組,該信息組/數(shù)據(jù)組中的一切數(shù)據(jù)、信息,都描述/反映了某個(gè)數(shù)據(jù)的某方面特征,則該信息組/數(shù)據(jù)組可稱為一個(gè)元數(shù)據(jù)。

元數(shù)據(jù)可以為數(shù)據(jù)說明其元素或?qū)傩裕Q、大小、數(shù)據(jù)類型等),或其結(jié)構(gòu)(長(zhǎng)度、字段、數(shù)據(jù)列),或其相關(guān)數(shù)據(jù)(位于何處、如何聯(lián)系、擁有者)。

在日常生活中,元數(shù)據(jù)無所不在。只要有一類事物,就可以定義一套元數(shù)據(jù)。

舉個(gè)例子:在電影數(shù)據(jù)庫IMDB上可以查到每一部電影的信息。IMDB本身也定義了一套元數(shù)據(jù),用來描述每一部電影。下面是它的一級(jí)元數(shù)據(jù),每一級(jí)下面又列出了二級(jí)元數(shù)據(jù),總共加起來,可以從100多個(gè)方面刻畫一部電影:

Cast and Crew(演職人員)、Company Credits(相關(guān)公司)、Basic Data(基本情況)、Plot & Quotes(情節(jié)和引語)、Fun Stuff(趣味信息)、Links to Other Sites(外部鏈接)、Box Office and Business(票房和商業(yè)開發(fā))、Technical Info(技術(shù)信息)、Literature(書面內(nèi)容)、Other Data(其他信息)。

元數(shù)據(jù)最大的好處是,它使信息的描述和分類可以實(shí)現(xiàn)結(jié)構(gòu)化,從而為機(jī)器處理創(chuàng)造了可能。

數(shù)據(jù)元:可理解為數(shù)據(jù)的基本單元

衛(wèi)生信息基本數(shù)據(jù)元規(guī)范和定義了醫(yī)藥衛(wèi)生領(lǐng)域所有相關(guān)信息的唯一中文名稱與代碼,并且代碼以字母、漢字、數(shù)字式的字符串形式表示。

數(shù)據(jù)元列舉并定義了特定語義環(huán)境中的一種信息資源。

完整的數(shù)據(jù)元名稱=對(duì)象類術(shù)語+特征類術(shù)語+表示類術(shù)語+(限定類術(shù)語)

其中:

一個(gè)數(shù)據(jù)元有且僅有一個(gè)對(duì)象類術(shù)語(object class):是現(xiàn)實(shí)世界或抽象概念中事物的集合,有清楚的邊界和含義,因其特性和行為遵循同樣的規(guī)則而能加以標(biāo)識(shí)。

一個(gè)數(shù)據(jù)元有且僅有一個(gè)特征類術(shù)語(property):是對(duì)象類的所有個(gè)體所共有的某種性質(zhì),也是對(duì)象有別于其他成員的依據(jù),是用來區(qū)分和識(shí)別事物的一種手段。特征類術(shù)語是任何一個(gè)數(shù)據(jù)元名稱所必須的成分,在數(shù)據(jù)元概念可完整、準(zhǔn)確、無歧義表達(dá)的情況下,其他術(shù)語可以酌情簡(jiǎn)略。

一個(gè)數(shù)據(jù)元有且僅有一個(gè)表示類術(shù)語(representation):是值域、數(shù)據(jù)類型和表示方式的組合,也包括計(jì)量單位和字符集等信息。當(dāng)表示類術(shù)語與特征類術(shù)語有重復(fù)或部分重復(fù)時(shí),可從名稱中將冗余詞刪除。

限定類術(shù)語由專業(yè)領(lǐng)域給定,限定類術(shù)語是可選的。

數(shù)據(jù)元基本模型

數(shù)據(jù)元與元數(shù)據(jù)的區(qū)別和聯(lián)系

  1. 元數(shù)據(jù)不可能涵蓋理解數(shù)據(jù)元所要表示的數(shù)據(jù)所必需的所有信息。

  2. 數(shù)據(jù)元的相關(guān)信息是任何一個(gè)(組織的)元數(shù)據(jù)的一個(gè)完整的組成部分。

  3. 元數(shù)據(jù)的每一個(gè)元素都是一個(gè)數(shù)據(jù)元,用符合數(shù)據(jù)元標(biāo)準(zhǔn)的元數(shù)據(jù)屬性和描述方法來說明元數(shù)據(jù)。

  4. 將元數(shù)據(jù)存儲(chǔ)于一個(gè)庫中,并使之條理化就需要建模,建模就需要從數(shù)據(jù)元的注冊(cè)系統(tǒng)中或庫中獲取元數(shù)據(jù)。

  5. 元數(shù)據(jù),它是以一種一致、標(biāo)準(zhǔn)的方式來表達(dá)的數(shù)據(jù)元。

  6. 元數(shù)據(jù)與數(shù)據(jù)元字典格式均由行號(hào)、中文名稱、英文名稱、標(biāo)識(shí)符(短語)、定義、約束/條件、最大出現(xiàn)次數(shù)、數(shù)據(jù)類型、數(shù)據(jù)的值域等屬性組成。不同之處是數(shù)據(jù)元字典格式中另有語境和同義詞名稱等屬性。

總而言之,元數(shù)據(jù)和數(shù)據(jù)元的定義是從不同角度論述的。由于描述的側(cè)重面不同,元數(shù)據(jù)和數(shù)據(jù)元的描述屬性也有些區(qū)別,但是元數(shù)據(jù)和數(shù)據(jù)元的字典格式是基本一致的。

------------------------------------------------------------------------------------------------

1元數(shù)據(jù)Metadata

1.1元數(shù)據(jù)概念

1、主要是描述數(shù)據(jù)屬性(property)的信息;

2、描述數(shù)據(jù)的數(shù)據(jù);

3、關(guān)于數(shù)據(jù)的結(jié)構(gòu)化數(shù)據(jù);

4、描述數(shù)據(jù)的內(nèi)容、覆蓋范圍、質(zhì)量、管理方式、數(shù)據(jù)的所有者、數(shù)據(jù)的提供方式等信息,是數(shù)據(jù)和數(shù)據(jù)用戶之間的橋梁。

舉例:

學(xué)生信息表包括:姓名、性別、學(xué)號(hào)等。

姓名、性別、學(xué)號(hào)都是數(shù)據(jù)元,但是這些數(shù)據(jù)元有自己的元數(shù)據(jù),即描述數(shù)據(jù),分別是長(zhǎng)度、類型、值域等。

對(duì)于學(xué)生信息表而言,姓名、性別、學(xué)號(hào)是描述學(xué)生信息的數(shù)據(jù),是它的元數(shù)據(jù)。

數(shù)據(jù)是手提箱,而元數(shù)據(jù)是它上面的標(biāo)牌。

數(shù)據(jù)是文件夾,而元數(shù)據(jù)是文件夾上面的標(biāo)簽。

1.2元數(shù)據(jù)的作用

1、數(shù)據(jù)描述:對(duì)信息對(duì)象的內(nèi)容屬性等的描述能力是元數(shù)據(jù)最基本的功能。

2、數(shù)據(jù)檢索:支持用戶發(fā)現(xiàn)資源的能力,即利用元數(shù)據(jù)來更好地組織信息對(duì)象建立他們之間的關(guān)系為用戶提供多層次多途徑的檢索體系,從而有利于用戶便捷快速的發(fā)現(xiàn)其真正需要的信息資源。

3、數(shù)據(jù)選擇:支持用戶在不必瀏覽信息對(duì)象本身的情況下能夠?qū)π畔?duì)象有基礎(chǔ)的了解和認(rèn)識(shí)從而決定對(duì)檢出信息的取舍。

4、數(shù)據(jù)定位:提供信息資源本身的位置方面的信息,如DOI、URL、URN等信息,由此可準(zhǔn)確獲知信息對(duì)象之所在,便于信息的獲取。

5、數(shù)據(jù)管理:保存信息資源的加工存檔結(jié)構(gòu)使用管理等方面的相關(guān)信息權(quán)限管理版權(quán)、所有權(quán)、使用權(quán)、防偽措施、電子水印、電子簽名等。

6、數(shù)據(jù)評(píng)估:保存資源被使用和被評(píng)價(jià)的相關(guān)信息,通過對(duì)這些信息的使用分析,方便資源的建立與管理者更好的組織資源并在一定程度上幫助用戶確定該信息資源在同類資源中的重要性。

2數(shù)據(jù)元(Data element)

2.1數(shù)據(jù)元概念

1、用一組屬性描述定義、標(biāo)識(shí)、表示和允許值的數(shù)據(jù)單元。

2、又稱數(shù)據(jù)類型,通過定義、標(biāo)識(shí)、表示以及允許值等一系列屬性描述的數(shù)據(jù)單元。在特定的語義環(huán)境中被認(rèn)為是不可再分的最小數(shù)據(jù)單元。

3、數(shù)據(jù)元一般由三部分組成:對(duì)象、特性、表示

舉例:

“執(zhí)業(yè)類別代碼”為數(shù)據(jù)元,“01”為數(shù)據(jù)元的值。

“執(zhí)業(yè)類別代碼”中,“執(zhí)業(yè)”為對(duì)象詞,“類別”是該數(shù)據(jù)元的特性詞,“代碼”是該數(shù)據(jù)元的表示詞。

2.2數(shù)據(jù)元的作用

1、數(shù)據(jù)元本身也是數(shù)據(jù)單元,即也是數(shù)據(jù)。

2、它是一個(gè)用來對(duì)各行業(yè)的數(shù)據(jù)進(jìn)行自身規(guī)范化的一個(gè)方法或一套指導(dǎo)的理論。

3、用這一套方法對(duì)行業(yè)數(shù)據(jù)進(jìn)行統(tǒng)一的名、型、值規(guī)范及分類。

4、規(guī)劃好行業(yè)數(shù)據(jù)元之后,可以為行業(yè)構(gòu)建出統(tǒng)一、集成的、穩(wěn)定的數(shù)據(jù)模型奠定基礎(chǔ),同時(shí)它也為數(shù)據(jù)交換奠定基礎(chǔ)。

3元數(shù)據(jù)管理

3.1元數(shù)據(jù)管理的建設(shè)目標(biāo)

3.2元數(shù)據(jù)管理的范圍

4資源目錄

4.1資源目錄要解決的問題

4.2業(yè)務(wù)流程示意圖

4.3資源目錄功能特點(diǎn)

5參考資料

https://baike.baidu.com/item/%E5%85%83%E6%95%B0%E6%8D%AE/1946090?fr=aladdin

https://wenku.baidu.com/view/9789bb30f68a6529647d27284b73f242336c31ff.html

https://baike.baidu.com/item/%E6%95%B0%E6%8D%AE%E5%85%83/7681154?fr=aladdin

    本站是提供個(gè)人知識(shí)管理的網(wǎng)絡(luò)存儲(chǔ)空間,所有內(nèi)容均由用戶發(fā)布,不代表本站觀點(diǎn)。請(qǐng)注意甄別內(nèi)容中的聯(lián)系方式、誘導(dǎo)購買等信息,謹(jǐn)防詐騙。如發(fā)現(xiàn)有害或侵權(quán)內(nèi)容,請(qǐng)點(diǎn)擊一鍵舉報(bào)。
    轉(zhuǎn)藏 分享 獻(xiàn)花(0

    0條評(píng)論

    發(fā)表

    請(qǐng)遵守用戶 評(píng)論公約

    類似文章 更多