自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(31)
  • 收藏
  • 关注

原创 蛋白设计 ProteinMPNN

例如,使用0.3-Å噪声训练的模型生成的序列,其AlphaFold预测在真实结构的lDDT-Ca(14)为95.0和90.0的情况下,比未加噪声或轻微加噪声的模型多两到三倍(图2C;在蛋白质设计计算中,使用更多噪声训练的模型具有生成更强烈映射到目标结构的序列的优势,通过预测方法(这增加了设计通过基于预测的筛选器的频率,相应地也可能增加达到所需目标结构的折叠频率)基于物理的传统方法,例如罗塞塔,面临计算难度,因为需要计算所有可能结构的能量,包括不需要的寡聚态和聚合态。

2025-07-03 09:28:20 271

原创 ProteinGym | 蛋白突变领域最系统的Benchmark

ProteinGym是专门针对蛋白突变而设计的一个超级系统性的benchmark,涵盖250+蛋白体系的深度突变扫描DMS数据,涵盖200万+蛋白序列,包含多种突变类型(突变替换、插入删除indels、诊所数据等),测试了多种下游任务(亲和力、稳定性、活性、表达量、Fitness),算法模型包含zero-shot和supervised两种测试模式。当然de novo蛋白设计在计算上做好评估还有一定难度。并且随着解决此问题的算法模型激增,使用不同的数据集不用的蛋白家族,评估出算法模型的不同性能。

2025-07-03 09:28:03 373

原创 Foldseek快速蛋白质结构比对

如果只是单个蛋白质结构的序列比对,我们只需要用Foldseek 的网站服务 https://search.foldseek.com/search 上传我们的蛋白质结构并选择想要进行比对的数据库即可,这里不做重点讲解。做生物信息学研究,我们难免需要批量对多个目标蛋白进行大规模结构比对,这需要我们下载安装本地版软件。下载完了软件之后,并不需要特别的安装,只需要把 ./foldseek/bin 添加到工作路径就可以直接调用 foldseek.1. 下载和安装 Foldseek。

2025-07-02 09:25:05 347

原创 精准预测蛋白质稳定性的强大工具

对于每种策略,HotSpot Wizard列出了根据其预测的诱变适用性排序的残基,以及相关的分析特定信息,并提供了过滤器,使用户可以将识别的热点集减少到最有希望的候选者,或根据其标准选择热点。用户可以探索由四种不同的蛋白质工程策略识别的热点:(i)由位于催化口袋和/或通道中的高度可变残基表示的功能热点,(ii)由柔性残基表示的稳定性热点(结构灵活性方法),(iii)由序列同源物中经常被相同残基占据的位置表示的稳定性热点(序列共识方法),以及(iv)由调节酶活性和选择性的成对共同进化残基表示的相关热点。

2025-07-02 09:24:59 194

原创 PyTorch的dataloader制作自定义数据集

PyTorch的dataloader是用于读取训练数据的工具,它可以自动将数据分割成小batch,并在训练过程中进行数据预处理。以上是制作PyTorch的dataloader的简单步骤,根据实际需求可以进行更复杂的操作,如数据增强、并行读取等。创建dataloader实例,可以设置。定义数据集类 需要自定义一个继承自。使用dataloader读取数据。5.已经分类的文件生成标注文件。创建dataloader实例。

2025-07-01 09:05:33 572

原创 AI模拟了一场5亿年的进化

研究团队将蛋白质的结构和功能编码为离散的字母,构建了一个统一的“生物语言”体系,使模型能够同时推理蛋白质的序列、结构和功能。蛋白质是生命的基石。从驱动肌肉运动的分子引擎,到捕捉光能的光合作用机器,再到细胞内的信息处理系统,这些功能复杂的分子贯穿了生命的每一个环节。尽管科学界早已解析了蛋白质的化学结构,但蛋白质的设计逻辑于人类而言,如同一门尚未理解的古老语言。ESM3与我们熟悉的ChatGPT、DeepSeek等AI模型原理相近,不过ESM3处理的不是文本,而是蛋白质的序列、结构和功能。

2025-07-01 09:05:13 233

原创 AI首次从头设计出蛋白酶

传统的酶工程研究,聚焦于修改已存在的蛋白酶,但这就像你买来一件旧西装,寄希望于简单修改就能适合自己穿,这显然不大可能。而从头设计蛋白,相当于从头开始量身定制一件西装,尤其是随着人工智能技术的进步,我们能够从头定制一个新的酶,确保其完美适合催化的每一步反应。的深度神经网络,通过模拟酶中的原子位置以及在反应的每一步中与之结合的分子,来改进结构设计。然而,之前使用 AI 从头设计酶的努力收效甚微,设计出来的酶无法像天然酶那样催化多步反应,通常在反应的第一步后就停止了。是一个四步化学反应,包括破坏分子之间的酯键,

2025-06-30 09:36:08 35

原创 SaProt 模型部署与运行教程

蛋白质是生物学功能的基础,了解它们为医学、制药和基因研究开辟了有希望的途径。蛋白质语言模型(PLM)从 NLP 方法学中汲取灵感,通过对大量蛋白质 1D 残基序列进行自监督训练,被证明能够非常熟练地捕获长程残基的相关性,成为蛋白质表示的关键技术。一些著名的 PLM,如 UniRep、ProtTrans、ESM和 Evoformer在与蛋白质结构和功能相关的各种任务中展示了出色的性能。

2025-06-30 09:35:51 1790

原创 ThermoMPNN/ThermoMPNN-D 的安装及使用教程

ProteinMPNN使用了整个PDB中的19700个蛋白簇进行训练,目标是根据给定的蛋白质骨架预测天然序列,它通过预测每个位置的天然残基的概率来实现这一点。这些预测是基于从PDB中的天然蛋白质中学习到的结构模式。

2025-06-23 09:24:32 2095

原创 EVOLVEpro安装使用教程-蛋白质语言模型驱动的快速定向进化

蛋白质是生命活动的基石,其功能和序列之间的复杂关系长期以来吸引着科学家们的关注。尽管深度突变扫描等实验方法可以解析蛋白质突变的功能影响,但这些技术的应用范围局限于序列空间的一小部分。近年来,基于蛋白质语言模型(PLM)的计算方法如ESM2模型取得了一些突破。然而,这些模型在零样本预测中往往无法显著提高蛋白质活性。为了解决这一问题,作者提出了。

2025-06-16 14:07:35 1761

原创 Zero-Shot突变预测VenusREM的安装和使用

通过改造野生型蛋白质,以提升其催化活性、稳定性、结合亲和力等特性,从而满足工业和科研的需求。近年来,展现出了相较于传统方法(如定向进化和理性设计)更优越的效果和更低的成本。在突变效应预测中,预训练深度学习模型的关键在于精准理解蛋白质。本研究提出了一种,用于综合分析蛋白质的本征属性(通过序列和局部结构相互作用)以及进化属性(通过检索得到的同源序列)。研究人员在一个公开基准数据集 ProteinGym 上,使用来自 217 个实验的逾 200 万个突变体对该模型进行了评估,验证了其领先的性能。

2025-06-11 17:53:05 1839

原创 服务器数据迁移

本文提供了一个稳健的服务器迁移方案,将用户文件、Conda环境和配置文件分类处理。关键步骤包括:1)使用rsync同步用户项目文件(.zshrc/.oh-my-zsh等)和模型缓存;2)通过conda-pack打包旧服务器环境,在新服务器解压后执行conda-unpack修复路径;3)安装相同版本Miniconda并配置国内镜像。方案强调测试验证(--dry-run)和权限修正(chown),确保迁移后环境完整可用。特别提醒conda-unpack步骤对解决路径引用问题的必要性。

2025-05-27 09:45:27 1425

原创 服务器修改/home的挂载路径

前段时间新装了一台服务器,/home目录原本是挂在在系统盘。

2025-05-23 18:36:05 1859

原创 AI设计蛋白质评估流程-COMPSS安装和使用教程

近年来,基于语言模型或逆向折叠算法进行蛋白序列设计可谓如火如荼。然而,预测评估生成的蛋白质是否还会折叠和发挥功能仍具有挑战性。本文尝试了20种不同的计算指标,以评估三种模型(祖先序列重建、生成对抗网络和蛋白质语言模型)生成的酶蛋白序列质量。我们重点关注两个酶家族,表达并纯化了500多个天然和生成序列,生成序列与最相似的天然序列具有70-90%一致性。对预测体外酶活性的计算指标进行基准测试。经过三轮实验,我们提出一种计算过滤标准COMPSS,将实验成功率提高了 50-150%。

2025-05-13 16:32:59 1476 2

原创 酶动力学预测工具CataPro安装教程

在此,研究人员基于蛋白质语言模型、小分子语言模型和分子指纹,提出了一种名为 CataPro 的新酶动力学参数预测算法。该研究从 BRENDA 和 SABIO-RK 数据库中收集了最新的转化率(kcat)、迈克尔常数(Km)和催化效率(kcat/Km)数据。根据 0.4 的蛋白质序列相似性对这些数据进行聚类,我们得到了相应的 10 倍交叉验证数据集。CataPro 在这些无偏 10 倍交叉验证数据集上进行了训练,在预测 kcat、Km 和 kcat/Km 方面的性能优于之前的预测器。1、创建并激活虚拟环境。

2025-04-02 20:48:03 1188 3

原创 Linux修改默认shell为zsh

加入之前输入过这个指令 ssh node01,那么当你输入 ssh no 的时候,终端会提示灰色,只需要按 →(右箭头)或者。Oh My Zsh 是一个超好用的 Zsh 配置框架,让终端更智能、自动补全超强、还有主题美化 ✨。而conda是有效命令,会是绿色。其中合法命令是绿色,错误命令是红色,路径、参数、变量会以不同的颜色区分。,就像你在用 fish shell 或输入法那样的“灰色提示”。支持更复杂的参数结构提示(比自带的 zsh 更强)(语法高亮):为你在终端中输入的命令加上。

2025-03-29 18:28:00 1317 2

原创 ESMFold 安装教程

运行esmfold需要安装openfold 1.0.0,如果直接使用pip install openfold或者使用github作者给予的命令,会安装成2.0.0,会造成程序的错误,因此主要解决的一个问题就是需要手动安装1.0.0版本的openfold,过程中遇到的其他问题也会一一解决。对轴向注意力计算进行分块处理,从而降低内存占用。选择以普通的形式进行安装,这样 openfold 的包会被复制到 conda 环境的 site-packages 目录中,而不是仅仅建立一个链接,其他用户无需访问源代码目录。

2025-03-18 15:06:44 1328 8

原创 蛋白质反向折叠模型-ProteinMPNN安装教程

【代码】蛋白质反向折叠模型-ProteinMPNN安装教程。

2025-02-19 22:14:02 2560

原创 蛋白质主链设计模型-RFdiffusion安装教程

注意:下载权重如果服务器网络不好的话,可以先下载到本地,然后在上传服务器!

2025-02-19 20:43:54 721

原创 Docker 镜像传输

可以通过任何文件传输方式(如 scp、rsync 等)将 .tar 文件传输到目标服务器。这将把 hello-world:latest 镜像保存为名为 hello-world.tar 的 tar 文件;其中,user@target_server:/path/to/destination 为目标服务器的实际路径;这会将 tar 文件中的 Docker 镜像加载到 Docker 中。目的:已下载的 Docker 镜像从一个机器传输到另一个机器。

2024-12-02 10:48:00 396

原创 Docker卸载

6、删除Docker配置文件(可选)2、查找已安装的docker软件包。4、删除Docker相关文件和目录。3、移除Docker软件包。5、删除Docker用户组。1、停止Docker服务。

2024-12-01 11:23:19 1002

原创 Linux安装NVIDIA 容器工具包(NVIDIA Container Toolkit)

该错误通常发生在使用 Docker 容器时,特别是涉及 GPU 加速的任务。这个错误提示说明当前系统没有正确安装或配置 NVIDIA 容器工具包(NVIDIA Container Toolkit),该工具包是用于支持 Docker 容器中使用 NVIDIA GPU 的必需工具。

2024-11-29 20:09:01 2073

原创 Docker问题:docker: Error response from daemon

出现 docker: Error response from daemon: Get "https://registry-1.docker.io/v2/": read tcp 12.12.12.3:54552->54.236.113.205:443: read: connection reset by peer 错误,通常是因为 Docker 无法通过代理连接到 Docker Hub 来拉取镜像。这通常是由于网络访问问题或代理配置不当。3、保存并退出文件;

2024-11-29 10:47:35 7652 1

原创 Docker常用命令

这些是一些常用的Docker命令;其中,表示镜像id, 表示镜像名称,表示容器id,使用过程中,需要将其替换成具体的镜像或者容器值;可以帮助你管理容器和镜像。

2024-11-28 22:05:49 153

原创 将Docker加入系统的Module管理

是一种用于在集群环境中动态加载和卸载环境模块的工具。它通常用于加载不同版本的软件环境和设置必要的路径和环境变量。如果 Docker 已经安装,并且你的系统支持使用 module 工具来管理它,你可以将 Docker 配置为一个模块,并通过 module load docker 来加载 Docker 环境。

2024-11-28 14:24:14 484

原创 Linux安装Docker

Docker 是一种开源的容器化平台,用于开发、运维和部署应用程序。Docker 允许你将应用程序及其依赖项封装到一个标准化的容器中,并能确保在任何环境下都能一致地运行。容器是一种轻量级、可移植的虚拟化技术,它比传统的虚拟机更高效。

2024-11-27 22:36:29 1663

原创 Linux服务器将普通用户添加到sudoers组

在 Rocky Linux 8 中,通常将用户添加到 wheel 组,以允许其使用 sudo 权限。可以执行以下命令将 username 用户添加到 wheel 组(这里的username替换成需要修改权限的用户名),-aG 选项表示将用户 username 添加到 wheel 组,并保留该用户的其他组信息。注意:只有root用户才有权限将普通用户添加到 sudoers文件中并授予其管理员权限,所以事先必须知道root用户的密码,本文以Rocky Linux 8为例。

2024-11-27 21:52:32 1952

原创 git clone下来的文件不完整(仓库中部分文件是用Git LFS上传的)

Git 克隆操作已经成功完成了普通对象的下载。Git LFS 管理的大文件可能尚未下载,需要通过命令下载完整的 LFS 文件。确保本地正确安装了 Git LFS,并在克隆后运行相应的命令来拉取大文件。

2024-10-08 13:24:51 3851 2

原创 VSCode连接远程服务器时打开TensorBoard报错:The package TensorBoard is required to launch a TensorBoard session.

最终经过查询终于找到了出现这个问题的原因:是VSCode中错误的使用了Linux系统的Python3.6解释器,而不是我项目中conda虚拟环境的python3.10解释器,所以只需要把当前的python解释器切换成你想要的python解释器即可;我也曾尝试过用管理员权限去执行上述指令,但是还是有问题,无法正常打开tensorboard的窗口;3、最后就可以在VSCode中正常启动tensorboard了,快去试试吧,希望能解决你的问题!2、 选择我们该项目的虚拟环境中python的解释器即可;

2024-08-09 11:36:53 876 2

原创 Linux 常用命令集合

linux查看指定文件(filename)最后几行数据;linux查看一个文件有多少行;文件中最长的那一行是多少个字符;4、统计指定文件中的单词数;

2024-08-06 21:21:09 180 1

原创 使用WSL2安装Ubuntu 24.04和蛋白隧道动力学分析工具Caverdock v1.2

4、从Caverdock的官网下载Apptainer/Singularity Image 的 CaverDock软件,但是点击download之后是一个乱码的sif文件;9、输入 caverdock --help 发现缺少一些依赖的包,逐一对其进行安装(安装过程发现有些特定版本的依赖项找不到,但是换源之后找到了,体现了换源的重要性);这些隧道是蛋白质内部的路径,通常允许小分子或者离子通过,从而参与和调控生物分子的功能;3、安装Apptainer容器,它是一个相对较新的容器软件(类似docker);

2024-08-06 20:39:21 2081

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除