專屬客服號
微信訂閱號
全面提升數據價值
賦能業務提質增效
數據治理就是指在一定的組織范圍內,依托制度法規、標準規范、應用實踐和支撐技術對數據進行全生命周期的數據確權、質量管理、安全控制、隱私保護、開放共享、交易流通和分析處理。數據治理的目標是為了提高數據的可用性、安全性、流通性,激活數據資源的價值,發揮數據資源的經濟和社會效益。
“數據治理”核心專業術語名詞解釋
數據元
定義:是用一組屬性描述其定義、標識、表示和允許值的數據單元,數據元是組成實體數據的最小單元,也稱原子數據,數據元由對象、特性和表示三部分組成。
作用:作為最小顆粒度的數據,數據元是對數據進行標準化定義的基礎,也是構建統一、集成、穩定的行業數據模型的基礎。在企業數據治理中,數據元是需要標準化的對象,一個數據元對象有且只有一個數據特性,每個數據特性對應一個數據表示。
元數據
定義:元數據是描述數據的數據或關于數據的結構化數據,是描述數據屬性的信息,用來支持如指示存儲位置、歷史數據、資源查找、文件記錄等功能,元數據主要有三類:業務元數據、技術元數據、管理元數據。
作用:在數據治理中,元數據是對數據的描述,存儲著數據的描述信息,能夠讓數據更容易理解、查找、管理和使用。
主數據
定義:主數據也稱基準數據,是指系統間的核心共享數據,反映核心業務的高價值信息數據。主數據的特點是變化緩慢,在企業內部保持一致。主數據必須存在并加以正確維護,才能保證企業內部系統數據的參照完整性。主數據具有3大特性、4個超越:高價值性、高共享性、相對穩定性;超越業務,超越部門,超越系統,超越技術。
作用:在數據治理中,主數據用來解決企業異構系統之間核心數據不一致、不正確、不完整等問題。主數據是信息系統建設和大數據分析的基礎,被認為是企業數字化轉型的基石。
業務數據
定義:業務數據是業務活動過程或系統自動產生的既定事實的數據,也稱交易數據,例如,業務交易過程中產生的數據,系統產生的數據。
作用:業務數據主要面向應用,為業務應用提供服務,例如生產、銷售、采購、設備管理、系統管理等。
主題數據
定義:主題數據是根據數據分析的需要,按照業務主題對數據所做的一種組織和管理方式,其本質是為了進行面向主題的分析或加速主題應用的數據。主題數據是分析型數據,是按照一定的業務主題域組織的,服務于人們在決策時所關心的重點方面。一個主題數據可以由多個主數據和交易數據組成。主題數據一般是匯總的、不可更新的、用于讀的數據。
作用:主題數據是按照一定的業務主題域組織的,服務于各種數據分析或應用開發。
數據倉庫
定義:數據倉庫(Data
Warehouse,DW)是一個面向主題的、集成的、相對穩定的、反映歷史變化的數據集合,用于支持管理決策。數據倉庫是數據分析和數據可視化的基礎,通過將來自不同業務系統的數據匯集到一起,并按照一定的主題進行編號、歸類、分組,方便用戶快速定位數據源,為數據分析提供支撐。
作用:數據倉庫是為企業所有級別的決策制定過程提供所有類型數據支撐的戰略集合,有以下三個主要特征和作用:數據倉庫是對企業數據的匯聚和集成、數據倉庫支持多維分析、數據倉庫是數據挖掘技術的關鍵和基礎。
數據湖
定義:數據湖是一個以原始格式存儲數據的存儲庫或系統。它按原樣存儲數據,而無須事先對數據進行結構化處理。數據湖可以存儲結構化數據(如關系型數據庫中的表)、半結構化數據(如CSV、日志、XML、JSON)、非結構化數據(如電子郵件、文檔、PDF)和二進制數據(如圖形、音頻、視頻)。
作用:數據湖可以更方便、以更低的成本解決不同數據結構的統一存儲問題,同時還能夠為機器學習提供全局數據。我們可以將數據湖理解為一個融合了大數據集成、存儲、處理、機器學習、數據挖掘的解決方案。
更多“數據治理”專業術語名詞解釋
數據中臺:數據中臺是企業級數據能力共享平臺,提供企業級數據服務,實現數據共享。數據通過分層與水平解耦,經過匯聚、存儲、整合、分析、加工,沉淀公共的數據能力,再經過服務封裝,形成通用的調用接口,為前端應用提供數據服務調用,支撐前端應用敏捷迭代和快速構建。數據直接用于業務鏈路和交易場景,
服務更多業務。數據中臺不是一個標準化的產 品,是一整套策略和解決方案的集合。
數據底座:數據底座是企業統一的數據平臺,是數據的邏輯集合,由數據湖和數據主題聯接兩層構成,集成公司內部各個業務系統數據及外部數據,為業務可視、分析、決策等數據消費提供數據服務。數據底座由數據湖和數據主題聯接構成。
湖倉一體:是新出現的一種數據架構,它同時吸收了數據倉庫和數據湖的優勢,數據分析師和數據科學家可以在同一個數據存儲中對數據進行操作,同時它也能為公司進行數據治理帶來更多的便利性。就是把面向企業的數據倉庫技術與數據湖存儲技術相結合,為企業提供一個統一的、可共享的數據底座。
數據標準:數據標準是指企業為保障數據的內外部使用和交換的一致性和準確性而制定的規范性約束。
數據模型:數據模型(Data Model)是對現實世界數據特征的抽象,用于描述一組數據的概念和定義。它從抽象層次上描述了系統的靜態特征、動態行為和約束條件。數據模型是數據庫系統的核心與基礎,是描述數據與數據之間聯系、數據的語義、數據一致性約束的概念性工具的集合。
數據標簽:是對數據實體特征的符號表示,用來描述業務實體特征的數據形式,通過標簽對業務實體進行刻畫,從多角度反映業務實體的特征。
數據血緣:追蹤數據隨時間流動的過程,可以清晰地了解數據起源、變化方式以及在數據管道內最終目的地。
數據脫敏:對敏感信息進行處理,使其在保留一定特征的同時,無法識別具體個體,用于非生產環境測試或數據分析。
數據分析:是指利用技術手段,對數據進行分析,發揮數據作用、釋放數據價值的過程。
數據挖掘:是數據分析的一種手段,是從大量數據中通過算法搜索隱藏于其中信息的過程。
請完善以下信息,我們的顧問會在1個工作日內與您聯系,為您安排產品定制服務
評論