1.测序数据大小计算公式:
人类基因组(30亿个碱基)X 30(测序深度)=900亿个碱基(1800亿个字母)
900亿个碱基/150(测序策略PE150)=6亿条reads
6亿条reads X 45(每条reads的名字长度)=2070亿个字母(每个字母一个字节)
2070亿个字母 / 每个G所包含的字节数 (1024*1024*1024)=192.7838G
注释:
测序仪器下机数据的 fastq 文件中, 每条序列都对应了相同长度的质量值, 反映出每个碱基的准确性和可靠性, (现在主流用的) 计算公式为:
Q = -10log10p
而这个 p 值就是 Phred 计算出来的, 表示一个碱基被识别错误的可能性, Phred 一开始是一个软件 (或者说计算方法), 对测序仪器识别到的荧光强度 (三代的不了解) 进行评估, 针对不同仪器有不同的标准表, 然后根据表中荧光强度的范围和分辨率分析得出碱基的 p 值, Q 值为 10 就表示这个碱基有 90% 的概率是正确的, 20 就是 99%, 40 就是 4 个 9
2.查看计算资源
查看memory
free -g
反正我自己台式机很小,都是个位数,和Jimmy的没法比。。
查看core
cat /proc/cpuinfo |grep process |wc
查看storage
df -h
保证至少要有8core+16G+1T
我的台式机:3+3+14G。。不管了,先装软件
3.给笨兔兔装各种生信软件
优先挑选二进制可执行软件
创建并切换到新建文件夹biosoft
在biosoft 文件夹下创建cmake文件夹并切换,然后下载cmake
#注意这些代码是用来测试的,不要用
mkdir biosoft
cd ~/biosoft
cd ~/biosoft
mkdir cmake && cd cmake
wget http://cmake.org/files/v3.3/cmake-3.3.2.tar.gz
又出现:正在解析主机 wget (wget)… 失败:域名解析暂时失败。
问题描述:无法解析下载网址
问题原因:DNS配置不正确
问题解决:通过命令 gedit /etc/resolv.conf 打开DNS配置文件,在文件中加入
nameserver 8.8.8.8
nameserver 8.8.4.4
保存退出,好了 开始正常下载
下载完成后继续安装
重新来,以下面的代码为准,因为要创建Bin,方便以后卸载