一. 简介
开源的,大规模表数据分析,高性能分析,原子提交,并发读写,
二. 核心
在文件format(parquet/avro/orc)之上实现table语义
支持定义和变更schema
支持hidden partition 和partition变更
acid语义
历史版本回溯
1. 特点
借助partition和columns统计信息实现分区裁剪
不绑定hdfs,可扩展s3/oss
容并发writer,乐观锁机制解决冲突
2. 架构
3. Flink 的集成
Flink Streaming Reader
Flink Offline Analysis
4. Spark 的集成
Spark Streaming Reader
三. 其他
1. 学习
https://www.bilibili.com/video/BV1TT4y1N7fP?from=search&seid=18072671913625549551
https://www.bilibili.com/video/BV14A411J7e6?p=4
https://www.bilibili.com/video/BV14A411J7e6?from=search&seid=18072671913625549551