在北极星集群上跑RoseTTAFold-All-Atom

二、在北极星集群上提交RoseTTAFold-All-Atom------fasta格式

2024-04-13 23:08:43 admin 0

在北极星集群上提交RoseTTAFold-All-Atom------fasta格式

一、fasta格式,必须按照标准来定义:

1、蛋白的fasta

>2V5P_1|Chains A, B|CATION-INDEPENDENT MANNOSE-6-PHOSPHATE RECEPTOR|Homo sapiens (9606)

MKSNEHDDCQVTNPSTGHLFDLSSLSGRAGFTAAYSEKGLVYMSICGENENCPPGVGACFGQTRISVGKANKRLRYVDQVLQLVYKDGSPCPSKSGLSYKSVISFVCRPEAGPTNRPMLISLDKQTCTLFFSWHTPLACEQATECSVRNGSSIVDLSPLIHRTGGYEAYDESEDDASDTNPDFYINICQPLNPMHAVPCPAGAAVCKVPIDGPPIDIGRVAGPPILNPIANEIYLNFESSTPCLADKHFNYTSLIAFHCKRGVSMGTPKLLRTSECDFVFEWETPVVCPDEVRMDGCTLTDEQLLYSFNLSSLSTSTFKVTRDSRTYSVGVCTFAVGPEQGGCKDGGVCLLSGTKGASFGRLQSMKLDYRHQDEAVVLSYVNGDRCPPETDDGVPCVFPFIFNGKSYEECIIESRAKLWCSTTADYDRDHEWGFCRHSNSYRTSSIIFKCDEDEDIGRPQVFSEVRGCDVTFEWKTKVVCPPKKLKHHHHHH

>2V5P_2|Chains C, D|INSULIN-LIKE GROWTH FACTOR II|Homo sapiens (9606)

AYRPSETLCGGELVDTLQFVCGDRGFYFSRPASRVSRRSRGIVEECCFRSCDLALLETYCATPAKSE

其中>为序列描述,用|去分割,第一个列是简称,第二个列是链的名称,第三个为具体的描述,低四个为物种

1、  核酸的fasta格式

DNA:

>8OJD_2|Chain B[auth C]|DNA (47-MER)|synthetic construct (32630)

GCCACTACGACACCTTGATCGCCTCGCAGCCGTCCAACCAACTCAAA

>8OJD_3|Chain C[auth D]|DNA (68-MER)|synthetic construct (32630)

ATTTGCTGACCTTTGTTCTGGGGTGAGTTGGTTGGACGGCTGCGAGGCGATCAAGGTGTCGTAGTGGC

 

>8XBY_1|Chain A[auth I]|DNA (5'-D(P*AP*AP*CP*GP*AP*AP*AP*AP*CP*GP*GP*CP*CP*AP*CP*CP*AP*CP*G)-3')|synthetic construct (32630)

ATCAGAATCCCGGTGCCGAGGCCGCTCAATTGGTCGTAGACAGCTCTAGCACCGCTTAAACGCACGTACGCGCTGTCCCCCGCGTTTTAACCGCCAAGGGGATTACACCCAAGACACCAGGCACGAGACAGAAAAAAACAACGAAAACGGCCACCACG

RNA:有U!

>8S8X_3|Chain C|m7GpppA-RNA (Cap0-RNA)|synthetic construct (32630)

UUA

 

二、命令格式

RFAA.run  [–pymol]  [pdb|fasta]  [small.pdb|small.mol2]

格式说明

1、  直接跑 pdb结构 : RFAA.run  1tce.pdb 

如果想只跑A链 RFAA.run  1tce.pdb:A

 2、将所有的蛋白、DNA、RNA合成一个fasta文件 : RFAA.run  input.fasta 

!!!!这里多个蛋白或核酸链,fasta文件必须合一个文件,会被自动切割几个文件

 3、 跑小分子mol2格式 :  RFAA.run  1tce.pdb     XG4.mol2

                          RFAA.run  input.fasta  XG4.mol2

 4、 跑小分子pdb格式  :  RFAA.run  1tce.pdb     XG4.pdb

                          RFAA.run  input.fasta  XG4.pdb

 5、 跑小分子sdf格式(OE生成的):  RFAA.run  1tce.pdb     XG4.sdf

openeye(含smiles格式,推荐4,5)  RFAA.run  input.fasta  XG4.sdf

 6、 生成pymol的pse文件,和):     RFAA.run -pymol1tce 1tce.pdb     XG4.sdf

                                    RFAA.run -pymol 1tce 1tce.pdb  

 7、共价,预生成格式: RFAA.run  1tce.pdb     XG4.pdbyaml

共价键的yaml文件生成请参考 https://github.com/baker-laboratory/RoseTTAFold-All-Atom

修改后提交同上

  -h, --help      显示帮助信息

  -v, --version   显示版本信息

 

三、提交案例-fasta

案例路径:/gpfs3/database/RFAA/alian

1、下载fasta并保存8qhh_fasta.fasta (建议不要直接使用8qhh.fasta)

https://www.rcsb.org/fasta/entry/8QHH/display

[chenfj@login28 alian]$ cat 8qhh.fasta

>8QHH_1|Chain A|Bet v 1 related allergen|Actinidia deliciosa (3627)

GAITYDMEIPSSISAEKMFKAFVLDGDTIIPKALPHAITGVQTLEGDGGVGTIKLTTFGEGSVHKSVKHRIDGLDKENFTYSYSIIEGGALDVFESISYHIKIVATPDGGCICKNRSIYTPKCDAQVSEEEIKAGKERASGIFKKVEAYLLANPDC

2、  提交任务

1)提交到gpu_4l (800氨基酸以下):   pkurun-g4c 1 1 RFAA.run -pymol 8qhh 8qhh_input.fasta

提交脚本

#!/bin/bash

#SBATCH -J RFA002851

#SBATCH -p gpu_4l

#SBATCH -N 1

#SBATCH -o RFA002851_%j.out

#SBATCH -e RFA002851_%j.err

#SBATCH --no-requeue

#SBATCH -A chen_g1

#SBATCH --qos=cheng4c

#SBATCH --gres=gpu:1

#SBATCH --overcommit

#SBATCH --mincpus=7

pkurun RFAA.run -pymol 8qhh 8qhh_input.fasta

2)提交到gpu_2l (800氨基酸以下):   pkurun-g2c 1 1  RFAA.run -pymol 8qhh 8qhh_input.fasta

3)提交到gpu_a800(1300氨基酸以下):pkurun-a800 1 1  RFAA.run -pymol 8qhh 8qhh_input.fasta

3)提交到gpu_ah00(1300氨基酸以下):pkurun-h800 1 1  RFAA.run -pymol 8qhh 8qhh_input.fasta

 

四、结果

1、对log文件分析

(pymol3) [chen@login28 alian]$ cat 8qhh_input.log

#gen pymol by chenfj 

pae_inter: nan ##为相互作用的打分13分以下为佳

mean_plddt: 0.856784999370575

mean_pae: 3.524158239364624

pae_prot: 3.524158239364624

#gen pymol by chenfj 

8qhh: (2.541062831878662, 155, 2, 2.5724849700927734, 156, 809.0, 156) ##红色为RMSD

runned min 4.5m  ## 跑的时间

2、打开pse文件

使用北极星图形界面(web)直接打开来看,如下

图片关键词


首页
资源&收费
集群
成果
问答