蛋白质对于调节细胞中的各种新陈代谢途径以及众多生物学过程具有十分重要的意义。一般来说,蛋白质并不是单独发挥作用的,而是通过彼此之间发生相互作用,即蛋白质-蛋白质相互作用(PPI)来完成相应的任务。
随着计算机技术的高速发展,深度学习(DL)方法已被应用于研究PPI,使用蛋白质序列提取结构信息,从蛋白质中提取某些和相互作用相关的信息作为特征向量,然后利用这些特征向量结合现有的分类器模型评估两个蛋白质之间存在相互作用的概率。
氨基酸排列组合成蛋白质一级结构,蛋白质会自发地通过折叠形成三级结构,蛋白质的功能由其结构决定,了解蛋白质结构对其生物学功能研究至关重要。通过大量的试验工作,也是确定了10万种独特的蛋白质结构,然而这只是数十亿蛋白质序列的一小部分。如果可以仅从氨基酸序列预测蛋白质结构,将极大地促进科学研究。
一、AlphaFold
AlphaFold,是一款在2018年开发出来的蛋白质结构预测程式,该程序被设计成了一个深度学习系统,目前AlphaFold共有两个版本AlphaFold1和AlphaFold2。在蛋白质结构预测方面表现出很高的准确性。
二、Unibind
2023年7月31日澳门科技大学及北京邮电大学研究团队共同在nature medicine上发表的文献Deep-learning-enabled protein–protein interaction analysis for prediction of SARS-CoV-2 infectivity and variant evolution,研究开发了一种基于人工智能进行蛋白质相互作用(PPI)基础研究的框架Unibind。通过整合SKEMPI、MaveDB等数据库的数据,经过人工智能深度学习,得到具有前瞻性和可靠性的蛋白质互作及全面且准确的TF-DNA相互作用信息预测信息,有效预测蛋白质结合亲和力,并且证明预测结果与实验数据达到高度相关。且在蛋白质复合体存在突变的情况下,Unibind都能表现出出色的预测性能。
因此,人工智能深度学习近年来在生物领域得到了广泛应用,其准确性不论是在植物、动物、病原微生物等领域的研究中均得到了多方验证,通过人工智能系统提供的信息,可以更高效率的筛选互作蛋白,减少人力物力成本,更全面的了解其在基因调控网络中的位置和功能。
三、AI—PPI
1. AI—PPI是什么?
南京瑞源生物在基于传统蛋白互作的基础上,通过自主研发优化,与时俱进,开发了一项深度学习预测蛋白相互作用的模型AI—PPI。
2. AI—PPI的数据基础是什么?
AI-PPI模型以BioGRID数据库、STRING数据库为数据基础,进行深度学习。
BioGRID数据库目前已更新至4.4版本,所有的相互作用关系数据基于文献,同时还收集了蛋白翻译后修饰以及生物活性小分子的相互作用,截至目前共收录2,711,919种蛋白质和遗传相互作用,31,144种化学相互作用以及1,128,339种翻译后修饰,并仍在随着科学研究进展不断更新。
STRING数据库是一个基于公共数据库和文献信息的蛋白质相互作用网络数据库。它收集了多个公共数据库,包括UniProt、KEGG、NCBI和Gene Ontology等,整合了这些数据并生成一个全面的蛋白质相互作用网络数据库。STRING数据库不仅提供了蛋白质相互作用网络的可视化,还能够提供蛋白质家族、途径和亚细胞定位等信息。
3. AI—PPI的功能?
在基于传统蛋白互作的基础上,通过人工智能深度学习根据数据库信息构建物种三维结构库,并根据预测的蛋白质三维结构对蛋白质互作概率进行预测。根据给出的互作概率预测,进行进一步实验验证,大大提升验证工作效率。该技术可以广泛应用于包括酵母基因编辑等在内的生物学研究过程。
4. AI—PPI的流程?
5. 使用AI—PPI需要提供什么?
只需要提供研究物种及诱饵蛋白序列即可完成
6. 使用AI—PPI能交付什么?
您得到的实验报告会清晰全面地展示AI分析所得数据,并提供该技术方法学文献。
关于瑞源
瑞源生物已拥有了全链路酵母实验技术解决方案,包括核与膜系统酵母库构建,酵母单杂、双杂、三杂筛选服务,酵母表面展示服务,酵母非生物胁迫抗性基因筛选服务,肽库构建及筛选服务等。瑞源拥有占地3500平方米的研发生产基地。我们专注于分子或蛋白质相互作用领域的酵母分子生物技术服务的研发。瑞源生物拥有一支由多名博士、硕士和高级工程师组成的专业科研团队,具有丰富的生物技术研发经验和创新能力,能够及时掌握行业动态和技术趋势,为公司提供强有力的技术支撑。