数据架构到底是什么


风晓
风晓 2023-12-31 11:24:21 56362
分类专栏: 资讯

一、架构

了解数据架构之前首先需要了解到底什么是架构?

把一个整体(完成人类生存的所有工作)切分成不同的部分(分工),由不同角色来完成这些分工,并通过建立不同部分相互沟通的机制,使得这些部分能够有机的结合为一个整体,并完成这个整体所需要的所有活动,这就是架构。

举例理解:最开始人类是住在山洞里,住在树上的,主要是为了躲避其他猛兽的攻击,以及减少自然环境的变化。为了完成这些目标,人类开始学会在平地上用树木和树叶来建立隔离空间的设施,这就是建筑的开始。但是完全隔离也有很多坏处,慢慢就产生了门窗等设施。建筑的本质就是从自然环境中,划出一块独占的空间,但是仍然能够通过门窗等和自然环境保持沟通。这个时候架构就已经开始了。

人们对建筑的需求慢慢的越来越多,空间的切分也会变成很多种,组合的方式也会有很多种,比如每个人住的房子,需要区分厨房、洗手间、书房、卧室等等,这个时候人们就开始有意识的去设计房子,架构师就慢慢的出现了。一切都是为了满足人的越来越高的需求,提升质量,减少时间,更有效率的切分空间,并且让空间之间更加有机的进行沟通。这就是建筑的架构以及建筑的架构的演变。

二、数据架构

内容概要:此部分内容重点回答数据架构包含什么内容以及数据架构基本内容输出示例

数据架构可以让管理者从企业的全局视角了解企业、客户和市场,通过数据更好地支撑企业运营。企业数据架构规划的目标是打破信息孤岛,实现企业信息数据共享。

1、数据架构基本概念

TOGAF由国际标准权威组织The Open Group制定。The Open Group于1993年开始应客户要求制定系统架构的标准。TOGAF是一个架构框架,它是事实上的全球标准,可用来规划、开发、实现、治理和维护一个架构。

国际数据管理协会(Data Management Association ,又名DAMA International,以下简称“DAMA”)是一个全球性数据管理和业务专业志愿人士组成的非营利协会,致力于数据管理的研究和实践。DAMA国际自1980年成立以来,一直致力于数据管理的理论研究、实践、教训及相关知识体系的建设,在数据管理领域累积了极为深厚的知识沉淀和丰富经验。

数据架构是什么有多重解读和方案,但是随着业界理论体系的不断完善,以及企业级数据治理工作的不断深入,目前的领先企业、数据治理组织的理论准备工作已经逐步收敛到四个方向,即:数据资产目录、数据标准、数据模型、数据分布。以上,可以称为数据架构体系的“四个基本内容”,具体而言应该包括:梳理企业的数据资产、制定数据标准并持续维护、建立数据模型,包括概念模型、逻辑模型和物理模型、管控数据分布,包括数据源头和流向。

业务视角:数据资产目录、数据标准 IT视角:数据模型、数据分布

2、数据架构基本内容介绍

来源华为数据之道

数据资产目录

数据资产目录:通过分层结构的表达,实现对数据的分类和定义,建立数据模型的输入,形成完善的企业业务数据资产地图。通过数据资产目录,可以解决数据在哪里、数据谁负责,数据如何用等一系列问题。从数据本身出发,按对象进行数据全生命周期管理。→数据资产管理

数据标准

数据标准:数据标准定义公司层面需共同遵守的属性层数据含义和业务规则,是公司层面对某个数据的共同理解,这些理解一旦确定下来,就应作为企业层面的标准在企业内被共同遵守。业务视角而言用于统一业务侧语言和理解,明确定义每个属性,所遵从的业务定义和用途、业务规则、同义词,并对名称进行统一定义,避免重复。

数据模型

数据模型:是从数据视角对现实世界特征的模拟和抽象,根据业务需求抽取信息的主要特征,反映业务信息(对象)之间的关联关系。数据模型不仅能比较真实地模拟业务(场景),同时也是对重要业务模式和规则的固化。具体包括概念模型、逻辑模型和物理模型。

数据分布

如果说数据架构的前三个组件是从静态角度对数据、数据关系进行了定义,那么数据分布则动态地定义了数据产生的源头和数据在各流程、各系统间的流动情况。数据分布的核心在于数据源。

信息链:表达数据在业务流的流转

数据流:表达数据在IT系统的流转

三、数据架构的设计和管理

在拎清数据架构的组件之后,更加实际的问题是如何设计数据架构,实现理论的落地。无疑,数据架构的设计因行业而异,也因企业而异,但是也有一些共性和原则。总结而言无非是:面向业务对象进行架构设计,以及面向业务对象实现架构落地。所谓面向业务对象进行架构设计,即是企业数据架构的设计应当以业务对象为基石,展现业务对象的属性特征,描摹业务对象间的关联关系。面向业务对象实现架构落地则是针对数据模型而言的,因为数据架构最为重要的交付产物就是数据模型。

四、数据仓库架构

内容概要:此部分内容重点回答数据仓库的精髓是什么,为什么会出现ODS以及数据集市,为什么在ODS-DW-DM架构之上还要对数据仓库再进行分层。

传统数仓架构:(ODS-数据仓库-数据集市)ODS

需要ODS的理由

业务系统是非集成且难以处理的。当组织需要集成数据并且无法修改或者改造已有的系统环境时,就需要用到ODS。ODS出现的动因还源自于组织有时需要对集成数据进行在线更新。同时ODS保留原始数据,与业务系统基本同构(可能会增加管理字段), ods集成了所有(有入仓的)的数据 。

数据仓库基本介绍

  • 数据仓库的诞生

随着计算机使用的爆炸式增长,人们创建的数据量和数据类型也都有了爆炸性增长,人们开始希望拥有集成化数据,而不仅仅满足于从某个应用程序获取数据,人们需要以一种内聚式的方式看待数据。于是,数据仓库诞生了。

  • 数据仓库的精髓

数据仓库的精髓就在于颗粒化的数据。数据仓库中颗粒化的数据为商业智能和许多其它形式的分析奠定了基础。它就像一桶满满的沙粒,可以采用多种方式重塑这些沙粒的形态。数据仓库是所有数据的集合,包括日志信息、数据库数据、文本数据、外部数据等都集成在数据仓库中。

数据仓库的好处

  • 分析师能够很快获取数据。数据已经存在于数据仓库之中静待分析。而且在开始分析之前无需再做集成工作。
  • 对于所有分析师而言,数据的集成都是一致的。不会出现一个分析师这样来集成数据,而另一个分析师那样来集成数据的情况。
  • 数据协调具有了现实的可行性。如果两个分析师得到的结果出现了差异,进行数据协调工作也只是一个简单问题。
  • 如果需要建立全新的分析,数据仓库能够为之提供数据基础。
  • 如果有必要进行合规性检查或者审计,会有可信的数据基础来支持分析。

五、数据集市(DM)

为了满足各种独特视角对汇总数据和合计数据的不同需求,人们采用了一种不同的数据结构-数据集市。不同的组织都有其自己的数据视角。所有的数据都源自数据仓库中的颗粒化数据。

六、数据仓库分层

为何分层?

其核心都是为了让数据仓库在应对分析场景、业务应用场景时更高效。数仓分层保障了数据在进入数据仓库之前都经过清洗和过滤,使原始数据不再杂乱无章,优化了查询过程,有效的提高了数据获取、统计和分析的效率。同时,数仓分层实现了各种不同维度数据的关联,使多维分析更加方便,为从多角度、多层次地数据分析和决策制定提供便捷。

作为一名数据的规划者,我们肯定希望自己的数据能够有秩序地流转,数据的整个生命周期能够清晰明确被设计者和使用者感知到。直观来讲就是如图这般层次清晰、依赖关系直观。

但是,大多数情况下,我们的数据体系是复杂、层级混乱的(如下图所示)。因此,我们需要一套行之有效的数据组织和管理方法来让我们的数据体系更有序,这就是谈到的数据分层。(数据分层的好处见另一篇文章)注(个人理解):1、不要在意分层的命名,你乐意的话,把它叫做:1、2、3层,但为了与别人的理解保持一致,还是需要跟各自公司的数据开发同事沟通清楚,明确各层的数据含义;

2. 有些公司的实践中,会在数据仓库中分3层以上,比如会将DW层分解为两层,分别为轻度汇总层、中度汇总层。这是跟着业务需要走了,理解分层的目的即可;

常见分层:

网站声明:如果转载,请联系本站管理员。否则一切后果自行承担。

本文链接:https://www.xckfsq.com/news/show.html?id=33222
赞同 0
评论 0 条
风晓L1
粉丝 1 发表 522 + 关注 私信
上周热门
WPS City Talk · 校招西安站来了!  3767
服贸会|范渊荣获年度创新领军人物!王欣分享安恒信息“AI+安全”探索  3693
有在找工作的IT人吗?  3655
字节跳动“安全范儿”高校挑战赛来袭!三大赛道,赢 80 万专项基金!  3615
阿B秋招线下宣讲行程来啦,速速报名!  3609
字节跳动校招 | 电商业务 2025 校园招聘进行中!五大职类热招,等你来投!  3601
麒麟天御安全域管平台升级!为企业管理保驾护航  3585
烽火通信2025届校园招聘宣讲行程发布!!  3421
2024海洋能源产业融合发展论坛暨博览会同期活动-海洋能源与数字化智能化论坛成功举办  3382
华为全联接大会2024丨软通动力分论坛精彩议程抢先看!  3356
本周热议
我的信创开放社区兼职赚钱历程 40
今天你签到了吗? 27
如何玩转信创开放社区—从小白进阶到专家 15
信创开放社区邀请他人注册的具体步骤如下 15
方德桌面操作系统 14
我有15积分有什么用? 13
用抖音玩法闯信创开放社区——用平台宣传企业产品服务 13
如何让你先人一步获得悬赏问题信息?(创作者必看) 12
2024中国信创产业发展大会暨中国信息科技创新与应用博览会 9
中央国家机关政府采购中心:应当将CPU、操作系统符合安全可靠测评要求纳入采购需求 8

加入交流群

请使用微信扫一扫!