
基因组
文章平均质量分 85
让学习成为一种生活方式
中国医学科学院&北京协和医学院打工人一枚,生物信息学+合成生物学欢迎交流。如切如搓,如琢如磨!
展开
专栏收录文章
- 默认排序
- 最新发布
- 最早发布
- 最多阅读
- 最少阅读
-
向日葵基因组-文献精读151
本研究报道了高质量向日葵基因组(3.6Gb)的组装与分析成果。通过单分子实时测序技术克服了向日葵基因组高度重复的组装难题,揭示了其进化历程:经历了菊类植物共有的两次全基因组倍增事件(WGT-γ和WGT-1)及向日葵特有的第三次倍增事件(WGD-2)。研究发现全基因组加倍事件显著影响了开花时间等农艺性状的基因组结构,古老旁系同源基因可长期维持调控网络功能。通过整合转录组、重测序和数量遗传学数据,构建了开花时间和油脂代谢的关键基因网络,鉴定出多个新候选基因。该基因组为利用野生种质资源改良向日葵抗逆性和油脂产量提原创 2025-08-02 09:41:59 · 622 阅读 · 0 评论 -
红花多组学挖掘OGT1-文献精读146
红花作为一种经济作物,以其花朵闻名,广泛用于治疗心血管和脑血管疾病的药物中,以及食品和工业染料中。红花的药用价值依赖于其黄酮苷类化合物。因此,红花黄酮苷类化合物的生物合成一直是关注的重点,但目前的机制仍然不甚明确。本研究旨在通过整合全基因组筛选和多组学关联研究的综合方法,鉴定与红花黄酮苷类化合物生物合成相关的功能基因。CYP和UGT是参与黄酮苷类化合物生物合成的两个关键基因家族。原创 2025-06-15 22:44:11 · 1043 阅读 · 0 评论 -
PGCP:用于比较基因组学的植物基因组综合数据库-文献精读144
PGCP是一个整合719个高质量植物基因组的综合数据库,旨在解决现有数据库覆盖物种有限、数据分散的问题。该平台通过统一标识符和标准化注释重建,收录了2660万多个蛋白质编码基因,并提供功能注释、直系同源群分析等比较基因组学工具(包括OrthoFinder识别的23.7万个直系同源群)。数据库还配备基因组浏览器、多物种BLAST比对、功能富集分析、同源性视图和引物设计器等实用功能,支持植物进化、多样性和功能基因组学研究。作为集中化资源,PGCP将促进跨物种基因组比较和重要基因发现,未来计划整合更多基因组以扩展原创 2025-06-13 19:59:31 · 726 阅读 · 0 评论 -
黄柏基因组-小檗碱生物合成的趋同进化-文献精读142
小檗碱是一种有效的抗菌和抗糖尿病生物碱,主要从不同植物谱系中提取,特别是从小檗属(毛茛目,早期分支的真双子叶植物)和黄柏属(无患子目,核心真双子叶植物)中提取。与小檗属物种中已知的小檗碱生物合成路径相比,其在黄柏属物种中的生物合成仍不清楚。通过使用染色体水平基因组组装、共表达矩阵和生化测定,我们鉴定了黄柏属小檗碱生物合成中的六个关键步骤,包括甲基化、羟基化和小檗碱桥形成。特别地,我们发现了一类特定的O-甲基转移酶(NOMT),负责N-甲基化。对PaNOMT9的结构分析和诱变研究揭示了其独特的底物结合构象。原创 2025-06-07 22:42:29 · 1302 阅读 · 0 评论 -
通光散基因组-文献精读139
通光散)是一种广泛分布于中国西南部富钙喀斯特地区的药用植物。然而,缺乏参考基因组限制了分子技术在其育种、药理学和驯化中的应用。我们通过结合SMRT测序和Hi-C技术,构建了夹竹桃科的染色体级基因组装配。该基因组长度为381.76 Mb,98.9%的序列位于11条染色体上。基因组包含222.63 Mb的重复序列和21,899个预测基因模型,contig N50为6.57 Mb。系统发育分析显示,通光散在大约1343万年前从大戟属植物分化。比较基因组学显示,通光散经历了古老的共有全基因组复制事件。原创 2025-06-04 21:57:16 · 629 阅读 · 0 评论 -
长春花基因组-文献精读134
本研究通过多平台测序技术组装了长春花(Catharanthus roseus)高质量染色体级基因组(561.7Mb,scaffold N50 71.1Mb),揭示了其吲哚生物碱(MIA)合成通路和黄龙病易感性的分子机制。研究发现78个长春花碱合成相关基因成簇分布,并鉴定出多个新型调控转录因子。比较基因组分析表明,长春花对黄龙病病原体(CLas)的高敏感性可能与其氧化磷酸化相关基因上调、抗病基因表达不足有关。该基因组为抗癌药物生物合成研究和柑橘黄龙病防控提供了重要资源。原创 2025-05-28 00:33:21 · 713 阅读 · 0 评论 -
何首乌基因组-文献精读131
何首乌(Reynoutria multiflora)是中国广泛使用的药用植物。其药用成分主要是芪类化合物(stilbenes)和蒽醌类化合物(anthraquinones),具有抗衰老、抗炎和抗氧化等重要药理活性,但其生物合成途径仍未完全阐明。在本研究中,我们报道了何首乌的近乎完整的基因组组装,大小为1.39 Gb,contig N50为122.91 Mb,仅剩一个空隙。原创 2025-05-18 20:15:53 · 1581 阅读 · 0 评论 -
NextPolish1.4.1 安装与使用-bioinformatics tools54
NextPolish是一个用于修正由低准确度长读段(如 ONT 或 CLR)组装出来的基因组序列中碱基错误(SNV/Indel)的工具。仅使用短读段仅使用长读段同时使用短读段与长读段NextPolish 包含两个核心模块,采用逐步(stepwise)策略对参考基因组中的错误碱基进行修正。如果你要对原始第三代测序(TGS)长读段(错误率约为 10–15%)进行纠错或组装,请使用NextDenovo。原创 2025-05-09 21:38:32 · 604 阅读 · 0 评论 -
NextDenovo2.5.2安装与使用-生信工具53
是一个基于字符串图(String Graph)的长读段(如 PacBio CLR, ONT)原创 2025-05-09 15:01:15 · 1135 阅读 · 0 评论 -
WGDI-分析WGD及祖先核型演化的集成工具-文献精读126
在地球上大多数主要生物类群中,人们已检测到全基因组复制(WGD)及其后续的核型变化。为了在基因组分析中更清晰地揭示这些复杂的多层次共线性模式,迫切需要便捷而精确的分析工具。为满足这一需求,我们开发了WGDI(Whole-Genome Duplication Integrated analysis,全基因组复制综合分析工具),这是一个基于Python的命令行工具,可用于全面分析多次多倍化事件及跨物种的基因组比对。WGDI支持三种主要分析流程:多倍体推断、基因组同源性的层级推断以及祖先染色体核型分析。原创 2025-05-03 23:23:31 · 1472 阅读 · 0 评论 -
KEGG注释脚本kofam2kegg.py--脚本010
采用kofam结合kegg官网htxt进行注释。原创 2025-04-14 23:31:22 · 262 阅读 · 0 评论 -
菠萝基因组-文献精读124
菠萝是全球第三大重要的热带水果,共有五个品种。目前,不同菠萝品种的基因组已被发布,然而,它们均不完整,存在大量基因组空缺,并且仅涵盖五个品种中的两个。这极大地阻碍了菠萝育种工作的进展。在本研究中,我们对三个菠萝品种的基因组进行了测序,包括一个野生菠萝品种、一个纤维菠萝品种和一个全球广泛种植的食用菠萝品种。我们构建了首个无缺口的菠萝参考基因组(Ref)。通过整合多种证据来源,并对每个基因结构注释进行人工修订,我们鉴定出了。原创 2025-04-03 16:29:41 · 1044 阅读 · 0 评论 -
石斛基因组-文献精读122
石斛(Dendrobium moniliforme,D. moniliforme)是广泛种植于亚洲的传统药用植物。黄酮类化合物是植物中最大的次级代谢物之一,是石斛属植物的重要药用成分。几种R2R3-MYB蛋白亚群已被验证直接调控黄酮类生物合成。通过PacBio测序技术,我们组装了一个高质量的染色体水平D. moniliforme基因组,总长度为1.20 Gb,contig N50为3.97 Mb。基因组注释的BUSCO评估为91.4%。原创 2025-03-25 20:08:08 · 1281 阅读 · 0 评论 -
vcftools v0.1.16 生信工具47
VCFtools 是一套用于处理 VCF 文件(如 1000 基因组计划生成的文件)的工具,主要用 Perl 和 C++ 编写。原创 2025-02-24 21:20:08 · 1132 阅读 · 0 评论 -
兰州百合基因组(36.68 Gb)-文献精读113
为了组装这一超大基因组,我们生成了 3.32 Tb 的 Illumina 短读长数据和 2.25 Tb 的 Nanopore 长读长数据,并采用适用于巨型基因组的优化 NextDenovo 流程,构建了初步的非冗余 contig 级组装,得到 36.68 Gb 的基因组序列(13,068 个 contigs,N50 = 7.72 Mb)。此外,尽管洋葱和大蒜等天门冬目植物经历了两次额外的 WGD,但其基因组大小仍不足百合基因组的一半,说明百合在 TE 插入和 WGD 事件后,基因组得到了更好的保留。原创 2025-02-22 21:29:04 · 1409 阅读 · 0 评论 -
可可泛基因组-文献精读112
基因组结构变异(SVs)在适应和物种形成中可能起到重要作用。然而,SVs的整体适应性效应尚不清楚,部分原因是准确的种群级别SVs鉴定需要多个高质量的基因组组装。本文中,我们利用31个染色体尺度的、解决了单倍型的可可树(Theobroma cacao)基因组组装——一种异交的长寿命树种,是巧克力的来源——研究SVs在自然种群中的适应性后果。在这31个样本中,我们发现了超过160,000个SVs,它们覆盖的基因组区域是单核苷酸多态性和短插入缺失(SNPs和短indels)的8倍(分别为125Mb和15Mb)。原创 2025-02-14 23:47:23 · 1246 阅读 · 0 评论 -
艾蒿染色体水平基因组-文献精读111
艾(Artemisia argyi Lévl. et Vant.),一种具有浓烈香气的多年生艾蒿类植物,在中国及许多亚洲国家的传统医学中广泛应用。在这项研究中,我们呈现了艾的染色体尺度基因组组装,组装大小为3.89 Gb,包含17条假染色体。系统发育和比较基因组分析表明,艾在与青蒿(Artemisia annua)分化后经历了一次近期的谱系特异性全基因组重复(WGD)事件,导致形成了两个亚基因组。我们解码了艾的二倍体祖先基因组,并观察到无偏的亚基因组进化。近期的WGD导致艾基因组中大量基因重复。原创 2025-02-09 22:16:10 · 1042 阅读 · 0 评论 -
灵芝黄金基因组注释-文献精读109
普遍认为,真核生物的核基因位于染色体上独立分布,并以单顺反子方式表达。然而,越来越多的证据表明基因结构和转录活动的复杂性超出了这一简单模型。灵芝(Ganoderma lingzhi)是一种具有代表性的药用真菌,但目前缺乏高质量的基因组注释,限制了其遗传学研究的开展。原创 2025-01-31 22:50:28 · 1451 阅读 · 0 评论 -
小麦重测序-文献精读107
中国和美国现代育种过程中小麦不同种质的全基因组测序揭示遗传变化大豆重测序-文献精读53_gmsw17-CSDN博客大豆重测序二(同一领域互竞)-文献精读58_high-quality genome of a modern soybean cultivar a-CSDN博客重测序通用代码-生物信息学pipeline3_xshell重测序代码-CSDN博客育种显著改变了小麦(Triticum aestivum)的植物形态结构,促使高产品种的出现,适应了现代农业系统。然而,小麦育种如何塑造这一作物的基因组结构仍然原创 2025-01-29 00:04:30 · 632 阅读 · 0 评论 -
球花石斛基因组-文献精读102
兰花具有重要的观赏价值,尤其受到园艺爱好者的高度重视。由于其巨大的商业价值以及花色和形态的广泛多样性,许多石斛属(Dendrobium)物种得到了广泛种植(Teixeira da Silva 等,2014)。球花石斛()以其白色花朵、黄色唇瓣和球形花序(图1a)为特征,是一种具有代表性的物种。我们对其基因组进行了测序,为其特征和进化背景提供了深入的见解。对球花石斛不同花段(图1b)的转录组分析揭示了与花色、花形和衰老相关的表达模式。原创 2025-01-23 10:55:49 · 1126 阅读 · 0 评论 -
人参t2t基因组-文献精读100
人参(Panaxginseng)是中药的代表性植物之一,并在全球范围内广泛使用,其中三萜皂苷——人参皂苷是最重要的有效成分。人参是一个异源四倍体,具有复杂的遗传背景,这使得其代谢进化的研究颇具挑战性。在本研究中,我们组装了一个端粒到端粒的人参参考基因组,总大小为3.45Gb,包含24条染色体和77,266个蛋白编码基因。此外,该参考基因组被划分为两个亚基因组,分别命名为亚基因组A和亚基因组B。原创 2025-01-17 22:56:26 · 1232 阅读 · 0 评论 -
trf 4.10安装与使用-生信工具42
重复表格文件可以在网页浏览器中查看,包含每个重复的相关信息,包括其位置、大小、拷贝数量和核苷酸组成。点击表格条目中的位置索引,可以打开另一个浏览器页面,显示重复序列与共识模式的比对结果。提交的序列长度可以是任意的,程序可以检测模式大小范围在 1 到 2000 个碱基之间的重复。程序输出两个文件:一个重复表格文件和一个比对文件。DNA 中的串联重复(Tandem Repeat)指的是两个或多个相邻且近似的核苷酸模式的拷贝。运行后,将生成两个或多个 HTML 文件,可使用浏览器查看重复表格和比对结果。原创 2025-01-10 23:33:20 · 1367 阅读 · 0 评论 -
着丝粒鉴定CentIER v3.0安装与使用-bioinfomatics tools41
CentIER 是一个用于在开始使用'gt'Python 3.8运行示例数据-g-gff-kmer-c-step_len-mul_cents-matrix1-matrix2-bed1-bed2-MINGAP。原创 2025-01-08 21:10:23 · 2056 阅读 · 0 评论 -
中国农业科学院深圳农业基因组研究所合成生物学研究中心-随笔06
中国农业科学院深圳农业基因组研究所(基因组所)合成生物学研究中心在理论创新、技术开发和成果转化方面发挥了重要作用,为推动合成生物学研究与产业化作出了突出贡献。成果:成功解码红豆杉高质量基因组,揭示紫杉醇的生物合成机制,推动绿色环保生产工艺的开发。成果:“基于分子图谱的农业食品表征与溯源数字化底盘”项目在广东种业科技创新大赛中获奖。致力于解决合成生物学在农业领域的关键问题,打造天然产物研发和农业科技创新的重要平台。推动基因组设计育种、组学大数据驱动的人工设计等方向,建设现代农业育种研究中心。原创 2024-12-24 22:23:00 · 916 阅读 · 0 评论 -
STAR安装与使用(2.7.11b)-生信工具38
STAR: ultrafast universal RNA-seq aligner原创 2024-12-19 00:26:31 · 2000 阅读 · 0 评论 -
TimeTree网站-生信工具37
基于大量经过同行评审的分子生物学研究结果。原创 2024-12-18 00:12:46 · 2219 阅读 · 0 评论 -
沉香树基因组-文献精读90
白木香((Lour.) Spreng)是中国重要的沉香生产植物之一。从受损的白木香树中收集的沉香树脂自古以来一直在亚洲用于芳香或药用目的。然而,由于缺乏准确和高质量的遗传信息,沉香形成的机制仍然理解不充分。原创 2024-12-17 00:21:00 · 801 阅读 · 0 评论 -
Ensembl数据库下载参考基因组(常见模式植物)bioinfomatics 工具37
那么问题来了,基因组fa文件和gff文件在哪里?拟南芥基因组fa在这里。注释gff文件在这里。原创 2024-12-13 21:28:23 · 1392 阅读 · 0 评论 -
(药用)鼠尾草基因组and二萜生物合成基因簇的发现-文献精读89
广泛栽培的药用和观赏植物鼠尾草(Salvia officinalis L.)是地中海原产的唇形科常绿灌木。我们组装了一个高质量的鼠尾草基因组,大小为480 Mb,分布在七条染色体上,并鉴定了一个生物合成基因簇(BGC),编码两对二萜合酶(diTPSs)。这些二萜合酶与位于基因簇内外的细胞色素P450(CYPs)基因一起,分别形成了负责芽和根二萜类化合物的两个表达级联,从而将BGC的功能从共同调控扩展到在不同器官中协调代谢产物的生产。系统发育分析表明,鼠尾草类群在早中新世开始分化。原创 2024-12-11 19:32:10 · 1666 阅读 · 0 评论 -
盘点2024 | 已发表《中国药典》收载植物药材基原物种全基因组序列192种(2024年发表50种)-随笔04
3.青皮、陈皮、橘红、橘核(柑橘。26.枸杞子、地骨皮(宁夏枸杞。28.猪牙皂、皂角刺(山皂荚。40.茺蔚子、益母草(益母草。27.合欢花、合欢皮(合欢。48.贯叶金丝桃(贯叶连翘。8.炮姜、生姜、干姜(姜。35.黄芪、炙黄芪(黄芪。10.罗布麻叶(罗布麻。33.筋骨草(金疮小草。5.郁金、姜黄(姜黄。11.三白草(三白草。17.冬凌草(碎米桠。23.月季花(月季花。32.商陆(垂序商陆。36.黄连(云南黄连。37.水飞蓟(水飞蓟。38.余甘子(余甘子。42.夏枯草(夏枯草。43.大黄(掌叶大黄。原创 2024-12-10 10:10:09 · 1134 阅读 · 0 评论 -
T2T基因组端粒与着丝粒的区别及其鉴定方法-随笔02
T2T(Telomere-to-Telomere)基因组是指完全覆盖从端粒到端粒的染色体序列,包含所有的基因和非编码序列。此前,标准的基因组组装往往在端粒和着丝粒区域留下了空白或未解析的部分。然而,T2T基因组的完成标志着我们能够填补这些“灰色区域”,揭示完整的基因组结构,尤其是端粒和着丝粒的完整序列。T2T基因组为我们提供了更为详尽的基因组图谱,对基因组功能和结构的理解具有深远的意义。原创 2024-12-06 16:35:40 · 2148 阅读 · 0 评论 -
水稻和拟南芥生命周期中单碱基分辨率的m6A定量分析-文献精读88
N6-甲基腺苷(m6A)在调控mRNA代谢中发挥着重要作用。然而,目前尚未报道在不同植物组织中具有单碱基精度的全面m6A甲基化图谱。在本研究中,我们使用m6A-SAC-seq技术构建了水稻和拟南芥不同组织中转录组范围的m6A单碱基分辨率图谱。分析结果显示,水稻中共有205,691个m6A位点分布在22,574个基因上,而拟南芥中有188,282个m6A位点分布在19,984个基因上。保守的m6A位点在水稻和拟南芥的直系同源基因对中参与了组织发育、光合作用以及胁迫响应的调控。原创 2024-12-04 23:42:16 · 1187 阅读 · 0 评论 -
3D基因组工具(HiC可视化)trackc--bioinfomatics tools 35
为了创建适合发表的高质量图像,精细调整每个轨迹的比例非常重要。快速调整轨迹比例以及轻松添加或移除轨迹的能力是一个重要问题。例如,如果虚拟图形的高度为 1,而新轨迹的高度为 4,则子图的实际高度将为 1 * 4。这些函数为用户提供了一种快速灵活的方法,用于调整每个轨迹的比例,同时方便地在多组学可视化布局中添加或移除轨迹。定义整个图像的大小,允许用户从上到下或从左到右设置一组子图,可以通过 height_ratios。是一个表示虚拟图形的对象,其宽度为 5,高度为 1。控制新轨迹与相邻轨迹之间的间距。原创 2024-12-03 20:37:57 · 1374 阅读 · 0 评论 -
多组学研究揭示梨果实代谢中DNA甲基化的调控机制-文献精读84
尽管作物果实发育的研究较为深入,但多年生果树代谢调控网络的研究仍然有限。为填补这一知识空白,本研究对梨果实果肉在11个发育阶段(从幼果到成熟)的代谢组、蛋白质组、转录组、DNA甲基化组和小RNA组进行了全面分析,系统探讨了代谢格局和相关调控网络。原创 2024-11-21 19:53:52 · 1214 阅读 · 0 评论 -
单细胞转录组学在植物系统和合成生物学中的应用进展-文献精读83
植物是由多种细胞类型组成的复杂系统,其结构呈现出分层的组织形式。为了理解复杂植物系统的分子基础,单细胞RNA测序(scRNA-seq)已成为揭示细胞水平基因表达模式高分辨率以及研究细胞类型异质性的重要工具。此外,对植物生物系统进行scRNA-seq分析具有巨大潜力,可生成新知识以指导植物生物系统设计和合成生物学的发展。合成生物学旨在通过基因组编辑、工程化或基于理性设计的基因组重写,从而对植物进行遗传或表观遗传修饰,以提高作物产量和质量,推动生物经济发展并增强环境可持续性。原创 2024-11-21 00:08:20 · 1341 阅读 · 0 评论 -
两种柑橘物种中WRKY转录因子的鉴定和比较-文献精读82
水杨酸(Salicylic Acid, SA)是一种重要的植物激素,在由各种病原体(如引起黄龙病(Huanglongbing, HLB)的柑橘黄龙病菌(CLas))触发的植物先天免疫中起关键作用。WRKY是一类植物特有的转录因子(TF)家族,在植物应对生物胁迫中具有重要功能。尽管多种柑橘物种的基因组已经被解析,但WRKY家族在水杨酸处理和CLas感染条件下的进化历史、功能和表达模式在柑橘中的研究仍然不足,因此需要对该家族进行全面的基因组和表达分析。原创 2024-11-18 20:26:24 · 1357 阅读 · 0 评论 -
ANA基因组数据库(ANAgdb)
ANA进化阶由早期发育的被子植物谱系组成,包括无油樟目(Amborellales)、睡莲目(Nymphaeales)和木兰藤目(Austrobaileyales),在进化上具有重要地位。ANA基因组数据库(ANAgdb)原创 2024-10-31 22:50:27 · 903 阅读 · 0 评论 -
细胞器基因组组装
叶绿体和线粒体是植物细胞内的两大重要细胞器,它们分别负责光合作用和细胞呼吸。随着高通量测序技术的发展,组装这些细胞器的基因组变得越来越重要,尤其在进化研究、系统发育分析以及遗传改良等领域。叶绿体和线粒体基因组相对较小,结构较为保守,因此通过特定的工具和流程可以有效进行组装。GetOrganelle 和 PMAT 是目前在叶绿体和线粒体基因组组装中备受推崇的两大工具。原创 2024-10-24 19:39:50 · 1430 阅读 · 0 评论 -
GetOrganelle(组装叶绿体)安装与使用-bioinfomatics tools 34
鉴于这些序列可能与 `embplant_mt` 相差甚远,除了使用类似于 `embplant_mt` 的选项外,还可以制作一对自定义种子数据库和标签数据库,并按照此处的指南运行 GetOrganelle。如果使用默认数据库失败,请使用您自己的种子数据库(或第一次 GetOrganelle 运行的输出)和标签数据库,通过 `-s` 和 `--genes` 选项重新运行。如果使用默认数据库失败,请使用您自己的种子数据库和标签数据库,通过 `-s` 和 `--genes` 选项运行。原创 2024-10-24 19:22:29 · 3108 阅读 · 0 评论 -
牛筋草基因组与草甘膦抗性相关-文献精读69
基因组结构变异(SV)对生物体进化有深远影响,常作为新遗传变异的来源。基因拷贝数变异(CNV)是SV的一种类型,反复与真核生物的适应性进化有关,尤其是在应对环境压力时。许多杂草植物物种,包括经济重要的牛筋草(Eleusine indica,俗称马唐),已经通过靶点基因的拷贝数变异进化出对广泛使用的除草剂草甘膦的抗性。然而,由于遗传和基因组资源的限制,这些CNV的起源和机制在许多杂草物种中仍然不清楚。原创 2024-10-22 14:33:15 · 991 阅读 · 0 评论