
大数据
文章平均质量分 92
大饼酥
10年编程经验,高级系统架构师
展开
专栏收录文章
- 默认排序
- 最新发布
- 最早发布
- 最多阅读
- 最少阅读
-
ClickHouse实现大数据准实时更新
本文介绍了使用 ClickHouse 处理大数据的两种准实时更新方案。由于传统数据库性能不足,ClickHouse 提供高效查询,适合大数据分析。第一种方案采用 ReplacingMergeTree 引擎,结合 optimize final 强制数据合并,实现批量更新,减少频繁更新对性能的影响,但合并操作消耗资源。第二种方案使用 argMax 函数,按最大更新时间聚合数据,确保实时返回最新记录。该方案适用于高吞吐量和实时更新,但查询复杂度和内存消耗较高。原创 2025-01-13 18:00:22 · 1811 阅读 · 0 评论 -
时序数据库InfluxDB—介绍与性能测试
在一个RP中,如果指定的保留时间为24小时,那么每个shard的duration为1小时,即每个shard的时间跨度为1小时,那么总共会有24个跨度为1小时的shard,在触发数据的RP后,删除最早时间跨度的shard。另外一种就是合并当前的 tsm 文件,将多个小的 tsm 文件合并成一个,使每一个文件尽量达到单个文件的最大大小,减少文件的数量,并且一些数据的删除操作也是在这个时候完成。这里定义的InfluxDB的负载是基于每秒的写入的数据量、每秒查询的次数以及唯一series的数目。原创 2025-01-09 15:43:04 · 2170 阅读 · 0 评论 -
Linux下部署ClickHouse单机版和集群
Clickhouse 是一个高性能且开源的数据库管理系统,主要用于在线分析处理 (OLAP) 业务。它采用列式存储结构,可使用 SQL 语句实时生成数据分析报告,另外它还支持索引,分布式查询以及近似计算等特性,凭借其优异的表现,ClickHouse 在各大互联网公司均有广泛地应用。本文详细描述了部署Clickhouse单机版和集群的过程。原创 2024-11-02 20:28:57 · 1398 阅读 · 0 评论 -
时序数据库InfluxDB—安装使用教程
InfluxDB是一个由InfluxData开发的开源时序数据库,专为高性能地查询与存储时序数据而设计。它使用Go语言编写,没有外部依赖,提供了简单、高性能的写入和查询HTTP API。InfluxDB广泛应用于存储系统的监控数据、IoT行业的实时数据等场景。原创 2024-11-07 21:25:21 · 6789 阅读 · 0 评论 -
ClickHouse性能测试
ClickHouse 是 Yandex(俄罗斯最大的搜索引擎)开源的一个用于实时数据分析的基于列存储的数据库,其处理数据的速度比传统方法快 100-1000 倍。这里我们用大量的数据对ClickHouse进行性能测试。原创 2024-11-08 15:35:03 · 1792 阅读 · 0 评论