基因组坐标系统的 0-based 和 1-based(图文详解)

本文介绍了基因组坐标中的0-based(起始于0,结束不包括)和1-based(起始于1)规范的区别,UCSCBrowser使用0-based便于浏览器渲染,而1-based在注释文件如gff中常见。在实际应用中,注意规范可能导致比对和SNP检测结果差异,需核对基因组以确保准确性。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

基因组坐标中的 “0-based” 和 “1-based” 是两种不同的规范,用于表示基因组上的位置。
它们在不同的上下文和文件格式中可能会有不同的使用方式。
下面我们聊聊它们间的区别和应用:

一、0-based

也叫做 zero-based half-open

示例

start=0,end=7

表示

在这里插入图片描述

该特征长度为 7,而不是 8,注意这里记录并不是以核苷酸编号,而是间隔编号。
为啥要设计这么反直觉的规范?
最早这种设计是 UCSC Browser 为了方便在基因组浏览器中渲染方便,以 start 为起始,以 end 作为序列长度。
也就是说这种格式给计算机看的,你可以在很多用于渲染信号值的文件中看到这种规范。
一般在基因组浏览器中,bed 文件,BigWig 文件等都是以此为规范

查询

使用基因组浏览器位点查询应该为 chr1:1-7

二、1-based

示例

start=1, end=7

表示

在这里插入图片描述
表示 该特征长度为 7,这个比较直观。因此,这种规范一般多用在注释中。
一般在 gff 等文件中,以此为规范。

查询

使用位点查询应该为 chr1:1-7 ,查询时二者并不差别。

一起来看就是这样的区别:
img

三、注意

这两个只是规范,实际应用中并不会强制检测。
因此在序列比对和 SNP 检测等流程结果中,最好去基因组上看看,也许会因为规范不同导致离谱的结果。

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

白墨石

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值