亚洲桃色网 上海交大鲁洪中课题组连结国表里多家单元发布花式生物酿酒酵母新一代基础代谢模子
酿酒酵母是首个基因组被完好测序和醒倡导单细胞真核花式生物亚洲桃色网,世俗应用于细胞生理学、合成生物学和系统生物学等斟酌领域。基因组圭臬领域代谢汇注模子(genome-scale metabolic network models, GEMs)是全面表征方针菌株生化响应汇注学问的基础模子,已成为领悟细胞基因型-表型估计的迫切盘算推算器具之一。
近日,上海交通大学生命科学工夫学院鲁洪中课题组连结国表里多家单元,整合往日五年的酵母分子生物学和生理学斟酌,发布了新一代酿酒酵母基因组领域代谢汇注模子——Yeast9,为酵母的系统生物学斟酌和生理学斟酌等提供了可靠的盘算推算器具。该恶果以“Yeast9: a consensus genome-scale metabolic model for S. cerevisiae curated by the community”为题发表在《Molecular Systems Biology》上。上海交通大学与华东理工大学连结培养斟酌生张承昱为第一作家,上海交通大学生命科学工夫学院鲁洪中副拔擢和查尔姆斯理工大学Eduard J Kerkhoven博士为该论文的共同通信作家。
相较于上一代模子(Yeast8),Yeast9的主要创新包括:(1)进行了一系列有针对性的数据推广,提高了代谢汇注的遮蔽范围,为模子增添了29个新基因,202个新响应,以及139种新代谢物;(2)通过多轮东说念主工校正,提高了代谢汇注模子中基因-卵白质-响应(gene-protein-reaction, GPR)估计和代谢物醒倡导准确性,增强了模子的准确性和可靠性;将每个响应分拨到明确的代谢阶梯子系统中,便于可视化分析;(3)证实从多个数据库汇集到的数据,为绝大无数代谢物和响应新增了热力学信息,并均衡了模子中大无数质料或电荷抵挡衡的响应(图1)。
图1.Yeast9相较于Yeast8 的主要创新。Yeast9模子包含1162个基因,2805种代谢物和4130个响应。将Yeast8与使用RAVEN构建的草稿模子比较较,发现新的响应。为险些系数代谢物和响应添加了ΔG°’。证实来自KEGG或SGD的阶梯醒目,将每个响应与单一子系统关联。通过与数据库进行多轮东说念主工对比,添加或修正了多样GPR。险些对系数响应进行了校订以确保质料和电荷均衡。
与Yeast8比较,Yeast9在必需基因预测、双基因敲除表型预测和底物附近预测等方面的推崇存了一定进度的创新;此外,新增的热力学信息使得探索代谢中物资滚动的驱能源成为可能(图2)。为了系统评估Yeast9的预测性能,本斟酌还进行了以下使命:(1)基于酵母细胞在高浸透压或对照条目下的转录组数据建造163个条目特异性的GEMs,发现附近立地丛林和主身分分析等机器学习门径轻率差异在高浸透压和普通条目下的单细胞代谢汇注,此外,还发当今调换条目下不同细胞的代谢汇注存在异质性。(2)使用Yeast9模子盘算推算酵母对不同氮源的偏好分数,通过多组学分析揭示在氮限度条目下酵母代谢重构的情况。(3)附近大领域的转录组数据抑制Yeast9,创建了1229个单基因敲除菌株的菌株特异性GEMs(strain-specific GEMs,ssGEMs),通过这些ssGEMs得胜预测了不同基因敲除菌株的滋长率和敲除基因的功能。作家预测通过转录组、卵白组等组学数据的整合,Yeast9有望成为一款被世俗使用的主流细胞代谢模子,为酿酒酵母和其他十分规酵母(如毕赤酵母、解脂耶氏酵母)的系统生物学斟酌和合成生物学应用提供了可贵的盘算推算资源。
亚洲桃色网
图2.对Yeast9预测才调的系统性评估。Yeast8与Yeast9在预测基因必需性及Memote评分之间的比较(A)。Yeast8与Yeast9在碳源、氮源、磷源和硫源附近方面的对比 (B)。在有氧和无氧条目下的滋长模拟 (C)。Yeast 9能证实“与/或”的估计预测两个基因组合的合成致死性后果,准确率达到80% (D)。忽略“与/或”的估计,Yeast9在预测合成致死性方面的准确率为59% (E)。TCA、EMP和PPP中的ΔG°’概况。颜料示意ΔG°’的值。红线意味着响应在热力学上是可行的;蓝线标明响应在热力学上是不行行的。粗边圆角矩形内的数字代表从葡萄糖合成乙酰辅酶A、丙酮酸、谷氨酰胺、天冬氨酸和酒精时TCA、EMP、PPP及估计响应阶梯的总ΔG°’(F)。
值得珍爱的是目下大部分GEMs因穷乏卵白质合成、酶丰采和酶能源学的抑制,难以准确预测基因操作对细胞滋长和方针居品合成的定量影响,限度了更高效的细胞工场设盘算推算法拓荒。为此,东说念主们建议了包括能源学模子、酶抑制模子、多圭臬模子和全细胞模子在内的更先进的代谢模子,以加多代谢模子的应用场景。这些更先进的模子的得胜构建需要一定数目的参数,举例酶的调度数(kcat)。然则,测定细胞中数以千计的酶的kcat值是一个繁难的任务。针对该问题,鲁洪中课题组结合前沿深度学习算法,拓荒了新的预测酶kcat值的器具DeepEnzyme。具体而言,DeepEnzyme附近最新的深度学习算法Transformer和图卷积汇注,索求来自底物、卵白质一级序列和卵白质三维结构的特征信息,进而完了酶kcat高通量预测与分析(图3)。
图3.DeepEnzyme用于预测kcat的框架。DeepEnzyme整合了变换器和图卷积汇注(Graph Convolutional Network,GCN)模子,从酶和底物中索求特征以预测kcat值。GCN用于证实卵白质三维结构和底物贯串矩阵索求结构特征;变换器则用于从卵白质序列中索求序列特征。
相较于以往的预测酶kcat的深度学习模子,DeepEnzyme在处理与磨砺数据集合酶序列相通度较低的序列信息时推崇出显耀的鲁棒性,解释卵白质3D结构特征信息不错灵验普及酶kcat预测的精确性和持重性(图4)。此外,DeepEnzyme还轻率识别影响催化功能的要津残基位点。总之,DeepEnzyme的拓荒将有助于在卵白组领域领悟酶的能源学参数,从而加快各类先进细胞数字模子构建,同期有望促进对不同物种中酶的功能偏合手进化花式的相识,激动感性卵白质工程的发展。
图4.DeepEnzyme 在kcat预测中的性能比较现存模子有所普及,即使关于测试数据集合的卵白质序列与磨砺数据集合的序列相通度较低的情况亦然如斯。不同模子在测试数据集上的R2值比较 (a)。不同模子在测试数据集上的RMSE值比较 (b)。DeepEnzyme、TurNuP、DLkcat和DLTkcat在测试数据集合不同序列相通度水平下对酶的kcat值预测的R2比较 (c)。来自黏质沙雷氏菌和枯草芽孢杆菌的两种酶,它们的EC编号均为1.3.3.4,在卵白质三维结构上高度相通(TM score = 0.8762),其中黏质沙雷氏菌的酶用灰色示意,枯草芽孢杆菌的酶用红色示意 (d)。上述两种酶的氨基酸序列相通度为27%(Q示意来自黏质沙雷氏菌的酶,T示意来自枯草芽孢杆菌的酶) (e)。
该项使命以“DeepEnzyme: a robust deep learning model for improved enzyme turnover number prediction by utilizing features of protein 3D-structures”为题发表《Briefing in Bioinformatics》上。上海交通大学与重庆理工大学连结培养硕士王彤为第一作家;上海交通大学生命科学工夫学院鲁洪中副拔擢为论文的通信作家,上海交通大学生命科学工夫学院为第一和株连通信单元。
鲁洪中课题组始终从事于高精度数字细胞模子构建,破译基因型-表型估计;拓荒细胞工场精确设盘算推算法,完了BT和IT工夫的深度结合,以期惩办细胞代谢全局可预测、菌株感性雠校等合成生物学领域的要津问题与挑战。估计恶果以一作或通信作家发表于Nat. Commun.、Mol. Syst. Biol.、Brief. Bioinform.、Metab. Eng.和Trends. Biotechnol.等国外驰名期刊。基于鲁洪中博士的斟酌恶果,共有6项科研恶果专利正在苦求中。以上两项斟酌得到国度要点研发权谋(2022YFA0913000)、上海市浦江东说念主才权谋以及国度当然科学基金(22208211和22378263)等神气的资助。
估计论文投合:
卡通色图《Molecular Systems Biology》:https://doi.org/10.1038/s44320-024-00060-7
《Briefing in Bioinformatics》:https://doi.org/10.1093/bib/bbae409亚洲桃色网