数据仓库专家面试题
初级面试题
问题 21: 什么是数据仓库中的主数据?它在业务需求对接中的作用是什么?
- 答案:
- 定义: 主数据是指企业核心业务实体的数据(如客户、产品、订单),具有唯一性、一致性和共享性,是数据仓库的基础数据。
- 作用:
- 需求对接: 主数据提供统一标准,方便业务部门明确数据需求(如客户 ID 的定义)。
- 数据整合: 确保多源数据(如 CRM 和 ERP)一致性。
- 质量保障: 主数据管理减少重复和错误,提升数据可信度。
- 示例: 在电商场景中,客户主数据包括 user_id、name 和 contact_info。
问题 22: 简述 HDFS 的工作原理及其在数据仓库中的存储优势。
- 答案:
- 工作原理: HDFS(Hadoop 分布式文件系统)采用主从架构,由 NameNode 管理元数据,DataNode 存储数据块。文件被分割成固定大小块(默