📝个人主页🌹:一ge科研小菜鸡-CSDN博客
🌹🌹期待您的关注 🌹🌹
一、数据血缘的定义与意义
1.1 什么是数据血缘(Data Lineage)?
数据血缘是指数据在整个生命周期中“从哪里来、经过了什么处理、到达了哪里”的追踪信息。
它回答三个核心问题:
-
数据从何而来?(来源)
-
数据是如何加工变换的?(过程)
-
数据最终流向何处?(去向)
这种信息构成了数据资产的“发展轨迹”和“加工历史”。
1.2 为什么需要数据血缘?
数据血缘在数据治理中的重要作用如下:
场景 | 血缘作用 |
---|---|
问题定位 | 报表数据异常,快速定位源头 |
影响分析 | 某张表字段改动,分析影响范围 |
合规审计 | 数据加工全流程可追踪 |
元数据管理 | 结构与过程信息统一 |
数据可视化 | 理解复杂数据依赖关系 |
数据资产评估 | 跟踪数据使用频率和影响力 |
二、数据血缘的分类
维度 | 分类 | 示例</ |
---|