
二代
文章平均质量分 85
穆易青
用大模型思维颠覆传统学习生信路径
展开
专栏收录文章
- 默认排序
- 最新发布
- 最早发布
- 最多阅读
- 最少阅读
-
2025.07.08【组装】|BUSCO评估结果解读与R统计绘图
摘要: BUSCO是评估基因组/转录组完整性的权威工具,通过检测单拷贝直系同源基因(BUSCO基因)进行分析。结果文件中的关键指标包括完整基因(C,含单拷贝S和多拷贝D)、片段化(F)和缺失(M)基因。为直观展示结果,推荐使用R脚本绘制分组堆积柱状图:将C拆分为S和D堆积显示,F和M独立成柱,避免重复统计歧义。脚本自动解析short_summary.txt文件,生成可视化图表(PNG格式),颜色区分不同类型并标注百分比。该方法科学清晰,适合批量分析,提升结果解读效率。 (字数:150字)原创 2025-07-08 17:13:21 · 306 阅读 · 0 评论 -
2025.07.04【转录组】| RNA-seq 组装“瘦身术”——BBNorm 归一化处理
摘要:本文介绍如何使用BBNorm工具对大规模RNA-seq数据进行数字归一化处理,显著降低内存和计算资源消耗。文章详细讲解了BBNorm的工作原理、安装方法、关键参数设置,并通过1.1TB数据的实际案例展示归一化效果(缩减83%文件大小)。同时提供了进阶技巧、常见问题解决方案及与其他归一化工具的对比。BBNorm作为BBTools套件中的高效工具,能保留低丰度转录本信息,大幅提升后续RNA-seq组装的可行性,是处理超大规模转录组数据的实用解决方案。(150字)原创 2025-07-04 11:21:58 · 166 阅读 · 0 评论 -
2025.07.01【转录组】无参转录组组装软件横向评估
摘要:本文对比了四种主流无参转录组组装工具(rnaSPAdes、Trinity、SOAPdenovo-Trans、Trans-ABySS)的关键特性。rnaSPAdes安装便捷、运行高效,适合大数据自动化;Trinity组装质量最优但资源消耗大;SOAPdenovo-Trans速度最快但安装复杂;Trans-ABySS支持多k-mer组装。选择建议:新手优先rnaSPAdes,追求质量选Trinity,超大数据用SOAPdenovo-Trans,复杂样本考虑Trans-ABySS。原创 2025-07-01 11:39:11 · 64 阅读 · 0 评论 -
2025.06.26【微生物】PathoScope安装与使用详解:微生物丰度定量分析全流程
PathoScope是一款基于贝叶斯方法的微生物分类与丰度估算工具,支持16S、宏基因组和转录组等多种数据类型。该工具通过比对测序reads与参考数据库,进行精确的微生物分类和定量分析。安装推荐使用Bioconda(需Python 2.7环境),分析流程包括构建参考数据库、比对reads和定量分析三个主要步骤。输出结果包含基因组名称、reads分配百分比、置信度等信息,以TSV格式呈现。PathoScope能够高效准确地解析微生物群落结构,适用于复杂样本分析,结果可用Excel或R进一步处理和可视化。原创 2025-06-26 16:55:40 · 798 阅读 · 0 评论 -
2025.06.24【R语言】|clusterProfiler:R语言功能富集工具安装与使用说明
clusterProfiler 是R/Bioconductor生态中最流行的功能富集分析包之一,由于其强大的兼容性、丰富的可视化和灵活的接口,广泛应用于转录组、蛋白组、表观组等多组学数据的生物学意义挖掘。原创 2025-06-24 10:54:03 · 1498 阅读 · 0 评论 -
2025.06.23【甲基化】|methylKit常见疑难解答与实用技巧(FAQ)
本文整理了R包methylKit使用中常见问题与实用技巧,包括输入文件格式要求、大数据内存优化方法、多样本合并策略、结果注释流程等关键内容。针对报错"Error: object ‘key<-’ is not exported"和"libRblas.so缺失"等典型问题提供了解决方案,并介绍了如何读取特定格式文件、导出可视化数据等实用操作。文章结合官方文档和社区经验,旨在帮助用户高效解决甲基化数据分析中的技术难题,提升分析效率。适用于需要处理高通量甲基化测序数据的原创 2025-06-23 12:12:36 · 958 阅读 · 0 评论 -
2025.06.23【甲基化】methylKit:甲基化测序数据分析安装与详细使用教程
摘要: methylKit是R语言中用于分析高通量亚硫酸盐测序数据的专业工具包,支持RRBS、WGBS等技术的甲基化数据分析。主要功能包括数据读取、甲基化水平统计、差异甲基化检测、基因组注释及可视化。安装可通过Bioconductor或Conda完成,建议R≥4.0版本。分析流程涵盖数据读取、过滤质控、样本合并、差异分析及功能注释,支持多种输入格式和大数据处理。methylKit简化了从原始数据到生物学解释的全流程,是甲基化研究的实用工具,具体操作可参考官方文档和教程。原创 2025-06-23 12:01:39 · 1102 阅读 · 0 评论 -
2025.06.06【Ribo-seq】|riboWaltz:P-site定位与三碱基周期性分析流程
同学们,大家好!今天我们要学习的是riboWaltz——一款专为Ribo-seq(核糖体足迹测序)数据设计的R包,主要用于P-site定位优化和三碱基周期性分析。P-site的准确定位是Ribo-seq下游所有翻译组学分析的基础,riboWaltz为我们提供了系统、可视化、易用的解决方案。P-site定位优化:自动识别不同长度RPF的最佳P-site偏移量。三碱基周期性分析:可视化RPF在CDS、UTR等区域的分布,评估数据质量。多样本/多条件支持:可同时处理多个样本,便于批量分析和对比。原创 2025-06-06 16:03:39 · 997 阅读 · 0 评论 -
2025.06.06【Ribo-seq】|RiboCode:基于Ribo-seq数据的全基因组翻译ORF检测工具详解与实战流程
大家好!今天我们要学习的是RiboCode——一个专为Ribo-seq(核糖体足迹测序)数据设计的高质量翻译ORF(开放阅读框)检测工具。RiboCode能够帮助我们在全基因组范围内精准识别翻译事件,发掘经典CDS之外的uORF、dORF、重叠ORF等新型翻译本,极大拓展了我们对转录本翻译潜能的认知。RiboCode 是由清华大学杨学睿课题组开发的开源软件,支持Linux/Mac平台,采用Python实现。自动化流程:一条命令即可完成注释准备、P-site定位、ORF预测。高灵敏度与特异性。原创 2025-06-06 15:44:34 · 996 阅读 · 0 评论 -
2021.11.20【读书笔记】|差异可变剪接事件及DTU分析
一、可变剪接(Alternative Splicing) 定义: 同一前体mRNA分子,可以在不同的剪接位点发生剪接反应,生成不同的mRNA分子,最终产生不同的蛋白质分子的一种RNA剪切方式。 意义: 1. AS是形成生物多样性的重要原因之一 2. AS是基因表达调控的重要组成部分,与基因表达的时空性息息相关 3. 由于可变剪接直接造成表达产物的差异,因此可变剪接在一些性状、疾病中发挥重要作用。 识别: 分成了7个类型 识别..原创 2021-11-21 22:30:18 · 6476 阅读 · 0 评论 -
2021-10-29【微生物】丨基于qiime2工具16S/ITS分析全套流程(上)
目录摘要工具与方法使用命令结果展示总结二级目录三级目录摘要前两个月项目特别多,最近终于有机会闲下来写点文章,把之前搭建的流程梳理一遍。前同事分析16S/ITS使用的qiime1,我接手后感觉不太适应,希望能够使用新版本来搭建,于是花了几天时间重新搭了这个流程,工具与方法使用工具:qiime2使用版本:qiime2-2021.4参考文档:https://docs.qiime2.org/2021.4/(最新版本2021.8)使用命令在这里插入代码片结果展示总结二级目录三级目录...原创 2021-11-01 16:38:29 · 10356 阅读 · 4 评论 -
2021.03.26丨甲基化分析工具bs_seeker2比对统计脚本
摘要 最近在搭建WGBS流程,使用bs_seeker2对数据进行比对后需要有一个统计结果。将就之前的脚本稍微改了一下,直接拿来用。 环境配置 python:2.7.18 BS-Seeker2: v2.1.7 目标文件格式 该log文件生成行数是不确定的,但统计结果都是在最后几行,所以我们的脚本里使用负值代表倒数几行开始抓取统计结果。 使用代码 import reimport osnewfile_name = '02.align/map_stat.txt'ne原创 2021-03-26 15:01:38 · 1457 阅读 · 0 评论 -
2021.3.17丨致病菌毒力因子(VFDB)数据库注释
摘要 接到一个常规细菌的组装注释项目,不过客户提出想要获取关于组装结果与病毒之间的联系/按之前的操作,dfast没有病毒相关的数据库,无法满足客户需求。一番查阅,发现大家用这个VFDB数据库进行常规的病毒注释,下面将介绍一下使用该数据库进行注释的过程。由于比对工具diamond之前没有介绍过,此次也将一并介绍。 介绍 DIAMOND简介 DIAMOND是用于蛋白质和翻译DNA的搜索序列比对工具,旨在用于大序列数据的高性能分析。 主要功能包括: BLAST以100x-10,000x的速原创 2021-03-17 23:41:49 · 25590 阅读 · 2 评论 -
2020.12.10【读书笔记】丨Survey二代数据质控
为什么进行Survey 分析? Survey方案 通过质控 、 NT 比 对,获得高质量的 clean data ,为后续分析奠定良好基础。 基因组 Survey 基于小片段文库的低深度测序数据( 50X 左右 通过 K mer 分析,有效的评估基因组大小、 GC 含量、杂合度以及重复序列的含量等信息; 全面了解某一物种基因组特征的有效方法; 为后续的全基因组 de novo 测序的组装策略的制定提供理论依据。 基因组的复杂程度预估 1.普通基因组的定义? 单倍原创 2020-12-10 16:58:28 · 1607 阅读 · 0 评论 -
2020.10.22【读书笔记】丨国自然研究热点思路解析
主办方:和元生物 讲师:夏志芳 主讲内容: 1、外泌体整体课题研究; 结合研究 研究机制机制研究思路 案例解析 WB 荧光染色,免疫沉淀、个体实验 q-PCR,筛选miRNA 对差异miRNA进行深入分析 总结 2、非编码RNA研究思路介绍; lncRNA简介作用机制 miRNA简介miRNA作用方式 circRNA简介circRNA形成 4种形成机制 3种主要功能 研究思路(ncRNA原创 2020-10-22 15:50:07 · 1129 阅读 · 0 评论 -
2020.10.21【转载】丨GWAS全基因组关联分析流程
我梳理了GWAS全基因组关联分析的整个流程,并提供了基本的命令,用到的软件包括BWA、samtools、gatk、Plink、Admixture、Tassel等,在此分享出来给大家提供参考。一、BWA比对1.构建索引bwa index -a is example.fasta #构建索引 -a is算法 (BWT构造算法:bwtsw、is或rb2)2.进行比对bwa mem -t 6 -R '@RG\tID:foo\tPL:Illumina\tSM:example' exampl转载 2020-10-21 15:25:03 · 5484 阅读 · 0 评论 -
2020.10.12丨二代变异检测
基因或基因组上的差别 基因转录翻译过程 变异类型 Calling SNPs(Index) Overall procedure fig step.1 mapping BWA(https://github.com/lh3/bwa) 建立索引 bwa index hg19.fa 比对 SAM Format(https://samtools.github.io/hts-specs/) fig 转换BAM格式 samtools原创 2020-10-12 14:25:02 · 563 阅读 · 0 评论