
DataBase
文章平均质量分 79
database
数据库练兵场
博主简介,本科毕业于北京交通大学,研究生毕业于中国人民大学。现就职于蚂蚁集团Oceanbase团队,花名-靖顺,专注于OceanBase数据库故障根因分析,性能调优。
展开
专栏收录文章
- 默认排序
- 最新发布
- 最早发布
- 最多阅读
- 最少阅读
-
【OceanBase诊断调优】—— 错误码 5065 和 5066 的区别
oceanbase 错误码 5065 和 5066 的区别原创 2024-10-10 10:22:27 · 1524 阅读 · 0 评论 -
【OceanBase 诊断调优】—— SQL 诊断宝典
你想要的OceanBase SQL诊断内容都在这了原创 2024-09-25 20:56:24 · 795 阅读 · 0 评论 -
【OceanBase 诊断调优】—— GC问题根因分析
GC 流程涉及到 RS 的状态切换和 LS 的资源安全回收,流程上较长。且 GC 线程每个租户仅有一个,某个日志流 GC Hang 死时会卡住所有其余日志流的 GC,进而造成更大的影响。本文档会帮助大家快速定位到 GC 故障的模块,直达问题核心。原创 2024-09-24 10:20:29 · 1059 阅读 · 0 评论 -
【OceanBase诊断调优】—— obdiag 一条命令搞定卡合并问题根因分析
卡合并是一个OceanBase中较为复杂的问题,可能由各种问题引入导致。当前是否卡合并无明确定义,一方面我们认为超过36小时没合完是合并超时(RS会报ERROR日志),另一方面用户可能自己判断合并超时(根据用户自己的经验)。因此当用户认为合并可能已经超时的时候,可以通过巡检工具来检查是否真的存在问题,并且得到一系列基础数据方便研发做一个初步的判断,省去一些反复沟通的时间。本文OceanBase 4.x 版本描述基于obdiag的卡合并根因分析是如何实现的。原创 2024-09-20 10:14:51 · 891 阅读 · 0 评论 -
【OceanBase诊断调优】—— 断连接问题根因分析
当断连接发生的时候,用户最直接得到的信息是ObServer返回的错误包提示,用户可以根据错误包的提示作初步的排查,本文再进一步,讲解断连接问题如何进行根因分析。原创 2024-09-19 09:49:32 · 1629 阅读 · 0 评论 -
【OceanBase系列】—— OceanBase应急三板斧
本文主要针对当出现OceanBase集群变慢或者出现节点故障的情况,提供应急处理的几个招式,帮助业务快速止血恢复降低事故影响范围,当然很多时候故障场景会复杂很多,一定要根据具体情况执行对应的恢复流程。以下列几个常见场景,后续还会持续更新,加入新场景进来。原创 2024-08-06 15:49:56 · 1869 阅读 · 1 评论 -
【OceanBase DBA早下班系列】—— obdiag 收集的OB火焰图/扁鹊图解读
上次讲解了一下obdiag 怎么快速的收集火焰图,那么问题来了,火焰图收集了咋看呢?今天就讲讲。原创 2024-08-01 10:00:28 · 462 阅读 · 0 评论 -
【OceanBase DBA早下班系列】—— obdiag 收集的 SQL Monitor Report 如何解读
前几天写了一篇博客,告诉大家在遇到慢SQL或者复杂的并行SQL的时候怎么高效的来收集【SQL Monitor Report】,上一篇博客的链接: OceanBase 社区 ;发出去后有不少问我这份报告咋解读。今天再出一篇博客给大家介绍下如何解读报告。PS: 本文不介绍如何安装部署使用obdiag,用法参加上篇博客,本文仅做【SQL Monitor Report】报告解读。浏览器打开表头如下:(表头展示的是基本的sql执行信息,从gv$ob_sql_audit获取的原创 2024-07-31 11:05:01 · 523 阅读 · 0 评论 -
【OceanBase诊断调优】—— clog盘满问题排查
本文将从obdiag根因分析clog盘满场景的流程来对分析流程进行盘查流程说明。原创 2024-07-29 14:31:20 · 1208 阅读 · 0 评论 -
【OceanBase诊断调优】—— 如何通过trace_id找到对应的执行节点IP
OceanBase作为分布式数据库,查问题找对节点很关键。好在OceanBase执行的每一条SQL都能通过trace_id来关联起来,知道trace_id怎么知道是在哪个节点发起的呢,请看本文。原创 2024-06-25 22:53:38 · 633 阅读 · 0 评论 -
【OceanBase诊断调优】—— 如何查找表被哪些其它表引用外键
本文详述如何查找指定表是否被其他表引用做外键。原创 2024-06-25 09:59:31 · 663 阅读 · 0 评论 -
【OceanBase诊断调优】—— 如何缩短OceanBase 数据库执行 count(*) 的时间
本文介绍影响 OceanBase 数据库执行 count(*) 时间的因素以及缩短 count(*) 执行时间的方法。原创 2024-06-25 09:55:16 · 539 阅读 · 0 评论 -
【OceanBase DBA早下班系列】—— 性能问题如何 “拍CT“ (一键获取火焰图和扁鹊图)
最近接连遇到几个客户的环境在排查集群性能问题,总结了一下,直接教大家如何去获取火焰图、扁鹊图(调用关系图),直击要害,就像是内脏的疾病去医院看病,上来先照一个CT,通过分析CT,大概的毛病也就定位的七七八八了。原创 2024-06-13 22:13:19 · 782 阅读 · 0 评论 -
【OceanBase诊断调优】 —— DDL时报磁盘不足问题排查
DDL时报磁盘不足问题排查原创 2024-06-13 14:00:48 · 792 阅读 · 0 评论 -
【DBA早下班系列】—— 并行SQL/慢SQL 问题该如何高效收集诊断信息
OceanBase论坛问答区或者提交工单支持的时候大部分时间都浪费在了诊断信息的获取交互上,今天我就其中大家比较头疼的SQL问题,给大家讲解一下如何一键收集并行SQL/慢SQL所需要的诊断信息,减少沟通成本,让大家早下班。原创 2024-06-11 19:58:44 · 1415 阅读 · 0 评论 -
【OceanBase诊断调优】—— NTP 时钟不同步的问题排
NTP 时钟不同步的问题排转载 2024-06-11 10:08:08 · 447 阅读 · 0 评论 -
【OceanBase诊断调优】—— obdiag 工具助力OceanBase数据库诊断调优(DBA 从入门到实践第八期)
OceanBase是原生分布式数据库系统,故障根因分析通常是比较繁琐的,因为涉及的因素可能有很多,如机器环境、配置参数、运行负载等等。专家在排查问题的时候需要获取大量的信息来分析故障,如何高效的获取故障场景下分散在各个节点的信息,挖掘出其中的关联性,帮助用户自助诊断问题便是obdiag的价值。原创 2024-05-30 10:59:45 · 1357 阅读 · 0 评论 -
【DBA从入门到实践】第8期:OceanBase数据库诊断调优、认证体系和用户实践
OceanBase数据库诊断与调优。OceanBase高可用架构之主备库。OceanBase数据库人才培养方案。原创 2024-05-27 10:38:20 · 991 阅读 · 0 评论 -
【诚邀加入】obdiag SIG:共筑OceanBase敏捷诊断,让问题排查变得更快更容易!
obdiag SIG 是一个专注于 OceanBase 敏捷诊断工具研发、推广及生态建设的开源小组,目标是打造一个集用户体验卓越、功能强大、社群活跃于一体的 OceanBase 诊断生态系统。原创 2024-05-23 11:52:18 · 369 阅读 · 0 评论 -
【OceanBase诊断调优】—— KVCache 排查手册
本文介绍 KVcache 相关问题的排查方法。原创 2024-05-23 10:03:25 · 1435 阅读 · 0 评论 -
【OceanBase诊断调优】—— 排查 IO 问题的方法
本文主要介绍 OceanBase 数据库 V4.x 版本中排查 IO 问题的方法以及 IO 相关的日志和视图。原创 2024-05-21 19:53:35 · 1578 阅读 · 0 评论 -
OceanBase 开源社区新进展|obdiag SIG成立
为了构建完善的 OceanBase 诊断生态系统,汇聚各方力量,形成涵盖工具、知识在内的全方位诊断生态体系,助力开发者更高效地驾驭 OceanBase,OceanBase 社区宣布成立诊断 SIG,名称:obdiag SIG。原创 2024-05-16 20:20:11 · 360 阅读 · 0 评论 -
【OceanBase诊断调优】—— 备份恢复如何定位 NFS 服务异常
当备份、归档出现异常时,我们应该首先排除备份介质、网络是否正常,本文讲述如何通过系统表和日志来定位 NFS 服务异常。原创 2024-05-15 09:48:08 · 581 阅读 · 0 评论 -
【OceanBase诊断调优】—— 转储错误(错误代码 4138/ORA-01555)
当读事务很长时,租户进行转储会报 4138/ORA-01555 错误。本文介绍该错误的处理方法。原创 2024-05-14 09:38:57 · 829 阅读 · 0 评论 -
【OceanBase 诊断调优】—— 如何排查 RPC 失败的原因
本文介绍如何排查 RPC 失败的原因原创 2024-05-13 10:08:56 · 1303 阅读 · 0 评论 -
【OceanBase诊断调优】—— 租户资源统计项及其查询方法
本文主要介绍 OceanBase 数据库中租户资源统计项及其查询方法。原创 2024-05-11 09:41:43 · 1571 阅读 · 0 评论 -
【OceanBase 系列】—— 什么是冻结和转储
本文主要介绍什么是冻结和转储。原创 2024-05-10 10:00:44 · 1121 阅读 · 0 评论 -
【OceanBase诊断调优】—— checksum error ret=-4103 问题排查
checksum error ret=-4103 问题排查原创 2024-05-09 09:45:02 · 692 阅读 · 0 评论 -
【OceanBase 系列】—— OceanBase v4.3 特性解读:查询性能提升之利器列存储引擎
对于分析类查询,列存可以极大地提升查询性能,也是 OceanBase 做好 HTAP 和 OLAP 的一项不可缺少的特性。本文介绍 OceanBase 列存的实现特色。原创 2024-05-08 20:13:12 · 1943 阅读 · 0 评论 -
【OceanBase诊断调优】—— 如何排查 server 断连接问题
本文介绍如何排查 server 断连接问题。原创 2024-05-08 17:58:42 · 961 阅读 · 0 评论 -
【OceanBase诊断调优】—— 磁盘性能问题导致卡合并和磁盘写入拒绝排查
OceanBase 集群合并一直未完成,同时 tsar 和 iostat 显示从凌晨 2:30 开始磁盘使用率一直是 100%。怀疑合并导致 IO 上升,IO 可能存在问题,在此故障情况下,大量写入 ERROR 日志本身也会占用大量带宽,可能会导致问题更严重。增加 IO 探测的超时阈值,避免磁盘性能问题导致 data 和 slog 的快速拒绝。修改设置后,IO 报错消失,合并开始推进,可以看到待合并的分区数量在逐渐减少。,这会触发 IO 探测线程检测磁盘是否有问题,如果超过。将已经被快速拒绝的磁盘洗白。原创 2024-05-08 09:39:39 · 1041 阅读 · 0 评论 -
【OceanBase系列】—— OceanBase V4.x 中的常用备份恢复 SQL 总结
本文总结了 OceanBase 数据库 V4.x 中常用的备份恢复相关的 SQL 语句。原创 2024-05-07 09:45:04 · 2127 阅读 · 0 评论 -
【OceanBase诊断调优】—— SQL 执行报错而不能计入 SQL_AUDIT 的情况
通常,执行成果的 SQL 都会计入 SQL_AUDIT 中,而执行报错的 SQL 则需要依据其执行报错的阶段来决定是否计入 SQL_AUDIT 中。原创 2024-05-06 12:54:16 · 538 阅读 · 1 评论 -
【OceanBase诊断调优】—— Unit 迁移问题的排查方法
本文主要介绍 OceanBase 数据集在副本迁移过程中遇到的问题的排查方法。原创 2024-05-06 10:49:01 · 913 阅读 · 0 评论 -
【OceanBase诊断调优】—— 如何查看 Root Service 切换完成的时间点
如何查看 Root Service 切换完成的时间点原创 2024-04-28 09:50:51 · 961 阅读 · 0 评论 -
【OceanBase诊断调优】—— OceanBase 数据库日志解读
OceanBase 数据库日志解读原创 2024-04-28 09:44:06 · 1850 阅读 · 0 评论 -
【OceanBase诊断调优】——hpet(高精度时钟源)引起的CPU高问题排查
最近总结一些诊断OCeanBase的一些经验,出一个【OceanBase诊断调优】专题出来,也欢迎大家贡献自己的诊断OceanBase的方法。原创 2024-04-25 10:16:22 · 2245 阅读 · 2 评论 -
【OceanBase系列】—— 常用 SQL
对使用OB过程中常用的一些SQL进行了整理,对应的版本是 4.x。原创 2024-04-24 10:03:13 · 1287 阅读 · 0 评论 -
【OceanBase系列】—— 常用运维操作(备忘)
本文记录一下OceanBase常用的运维操作,用于备忘原创 2024-04-24 09:59:24 · 2569 阅读 · 0 评论 -
【OceanBase诊断调优 】—— 索引调优
当我们发现某一条 SQL 存在性能问题时,我们可以通过很多方式对这条 SQL 进行优化,其中最常见的是索引调优。索引调优通过为数据表创建合适的索引来达到减少数据扫描量,消除排序等目的。索引调优是一种比较简单的调优方式,也是 SQL 出现性能问题时通常在第一时间考虑的优化方式。在单表扫描场景下创建一个合适的索引往往可以极大地提高 SQL 的执行性能。原创 2024-04-24 09:47:43 · 2025 阅读 · 0 评论