1/0
颜宁回国是因为AI让结构生物学家“失业”?复旦教授释疑
上观新闻2022-11-15 06:31:00

最近,网上流传着一个关于结构生物学家颜宁回国“真实原因”的说法,称AlphaFold 2(阿尔法折叠2)等人工智能系统的问世,让结构生物学家面临“失业”困境。知乎上有人写道:“颜宁教授看到AlphaFold,就像骁勇善战的部落首领看到了航空母舰。不是颜宁不行,而是英国DeepMind太强大了。”

事实是否如此?解放日报·上观新闻记者采访了计算生物学家、复旦大学复杂体系多尺度研究院院长马剑鹏教授。他带领团队已开发出功能与AlphaFold 2类似的OPUSFold(作品折叠)系统。他直言:“AI(人工智能)让一流结构生物学家失业,是我听过的最荒唐的说法。”

AI助力摘取“皇冠上的明珠”

“阿尔法折叠2”是谷歌旗下深度思维(DeepMind)公司的产品,与“阿尔法围棋”相仿,都是采用机器学习技术的人工智能系统。在2020年举行的国际蛋白质结构预测大赛上,“阿尔法折叠2”夺得冠军,它预测的蛋白质三维结构与实验测定的结构只有很小差异,被《科学》杂志评为“2020年十大科学突破”之一。

“阿尔法折叠2”预测(蓝色)和实验测定(绿色)的蛋白质结构几乎完全吻合。来源:DeepMind

为何要用人工智能系统预测蛋白质三维结构?马剑鹏解释,蛋白质由一系列氨基酸折叠而成。氨基酸线性排列成一条长链,把它放到水里,整条链会在微秒至毫秒内折叠成一个稳定的三维结构。研究氨基酸长链如何自发地折叠成三维结构,简称“蛋白质折叠”问题,因其重要性和复杂性,被视作现代分子生物学“皇冠上的明珠”。在应用领域,小分子药物研发的基础就是蛋白质结构解析,只有探明目标蛋白质的“三维地图”,才能找到药物作用于蛋白质的靶点。

对科学家来说,测定氨基酸序列相对容易,但解析蛋白质结构的难度很大,因为蛋白质结构取决于几千个氨基酸各个原子间的相互作用力。根据已知氨基酸序列,用计算机预测蛋白质结构的运算量,连世界上最快的超级计算机也很难承受。

随着深度学习、强化学习等人工智能技术的兴起,计算生物学出现了跨越式发展。“阿尔法折叠2”等系统在学习实验测定的大量蛋白质结构后,具备了根据氨基酸序列准确预测结构的能力。今年,深度思维公司发布数据集更新,称“阿尔法折叠2”已预测几乎所有已知的蛋白质。

颜宁院士通过微博回应传言

既然人工智能系统可以准确预测蛋白质结构,那么结构生物学家是否会面临“失业”困境?

据介绍,结构生物学是一门研究生物大分子的三维空间结构、动态过程和生物学功能的交叉性学科。解析各种蛋白质的三维结构,是结构生物学家的一项主业。作为国际知名的结构生物学家,颜宁教授曾在清华大学、普林斯顿大学工作,是美国国家科学院外籍院士、美国艺术与科学院院士。本月,她透露自己已向普林斯顿大学递交辞呈,不久后将全职回国,参与创建深圳医学科学院。

颜宁教授演讲。来源:视觉中国

对于网传颜宁回国“真实原因”的说法,她已通过微博回应:在她研究的电压门控钠离子和钙离子通道领域,“阿尔法折叠2”学习了她带领团队解析的多个生物结构后,去年的预测精度达到了颜宁团队2017年的水平,今年则没有进步。“AI团队做预测,我们做实验,测试新型小分子与蛋白的相互作用,迄今为止预测无一正确。”

“干湿结合”成为生物学趋势

马剑鹏表示,“阿尔法折叠2”远远没有达到取代结构生物学家的能力。目前,它只能预测单链蛋白质的结构,基本不具备预测多链蛋白质结构的功能。而且在单链蛋白质预测方面,由于人工智能预测基于对已知蛋白质结构的比对学习,它对与其同源的蛋白质结构预测是比较准确的,然而面对拥有“孤儿序列”(氨基酸序列独一无二)的蛋白质时,“阿尔法折叠2”往往就无法准确预测了。

另外,在蛋白质侧链预测方面,“阿尔法折叠2”也有较大的提升空间。2021年,复旦大学复杂体系多尺度研究院在英国《生物信息学简报》上发表论文,报告他们开发的“作品折叠”在蛋白质侧链预测精度上,比“阿尔法折叠2”高。据介绍,蛋白质三维结构由主链和侧链搭建而成。药物分子与蛋白质的结合大多通过与氨基酸侧链相互作用来实现,所以人工智能系统对侧链结构的精准预测,对新药研发具有重要价值。

蓝色为蛋白质侧链天然构象,红色为“作品折叠”预测结果。

由此可见,人工智能并不会让结构生物学家“失业”,两者不是取代关系,而是互补关系。“AlphaFold 2对颜宁这样的一流实验结构生物学家来说,有百利而无一害。”马剑鹏说,“实验结构生物学家也是要用计算机建模的,AlphaFold 2、OPUSFold这类软件可以加快建模速度,提高蛋白质结构解析的效率。”

如今,“干湿结合”已成为结构生物学研究的趋势。长期以来,开展计算生物学研究的“干实验室”是生物学的配角。随着人工智能的兴起,这个配角已逐渐成长为主角,与实验生物学家工作的“湿实验室”更紧密地结合在一起,共同探索生命分子结构的奥秘。

“真正的研究者都乐于拥抱技术进步,善于用各种技术去探寻、解答自己感兴趣的问题。”颜宁表示,“我期待AI越来越强大。”

栏目主编:黄海华题图来源:视觉中国图片编辑:朱瓅未经正式授权严禁转载本文,侵权必究

作者:俞陶然
选稿:朱雯
知识产权、免责声明以及媒体合作联系
继续了解
知识产权声明

【知识产权声明】

除本司(指上海东方网股份有限公司)另行声明外,本司网页及客户端产品(以下简称“本网”),包括但不限于东方新闻、翱翔、东方头条等,所涉及的任何资料(包括但不限于文字、图标、图片、照片、音频、视频、图表、色彩组合、版面设计、商标、商号、域名等)的知识产权均属本司和资料提供者所有。未经本司书面许可,任何人不得复制、转载、摘编、修改、链接、镜像或以其他任何方式非法使用东方网的上述内容。对于有上述行为者,本司将保留追究其法律责任的权利。

东方网、东方新闻、翱翔,以上均为本司享有权利之合法商标,未经本司书面授权,任何单位或个人不得使用上述商标,或将上述商标用作网站、媒体名称等。

【免责声明】

1、凡本网注明来源“东方网”或“东方新闻”或带有东方网LOGO、水印的所有内容,包括但不限于文字、图片、音频视频,版权均属本司所有,任何媒体、网站或其他任何形式的法律实体和个人未经本司书面授权均不得转载、链接或以其他方式复制传播。与我司签订有关协议或已经获得本司书面授权许可的媒体、网站或其他任何形式的法律实体和个人,应在授权范围内使用,且必须注明来源“东方网”。其目的在于传递更多信息,并不意味着本司赞同其观点或认可其内容的真实性。如果其他媒体、网站或其他任何形式的法律实体和个人使用,必须保留本司注明的“稿件来源”,并自负全部法律责任。如擅自篡改为“稿件来源:东方网”,本司将依法追究责任。

2、擅自使用东方网名义转载不规范来源的信息、版权不明的资讯,或盗用东方网名义发布信息,设立媒体账号等,本司将依法追究其法律责任。

3、鉴于本网发布主体、发布稿件来源广泛,数量较多,如因作者联系方式不详或其他原因未能及时与著作权拥有者取得联系,或著作权人发现本网转载了其拥有著作权的作品时,请主动来函、来电与本司联系,或与本司授权的中国文字著作权协会联系,提供相关证明材料,我方将及时处理。
中国文字著作权协会联系方式:
联系人:赵洪波 唐亚静
地 址:北京西城区珠市口西大街120号太丰惠中大厦1027-1036室
联系电话:010-65978917
邮 箱:wenzhuxie@126.com

4、本网所有声明以及其修改权、更新权及最终解释权均属本司所有。

【媒体合作】

本司为尊重保护著作权,鼓励有益于社会主义精神文明、物质文明建设的作品的创作和传播,促进互联网良性发展,本着平等互惠、资源共享的原则,诚邀各类媒体、网站、单位、个人与本网建立友好的合作关系。
媒体合作、内容转载请联系
联系人:杨老师
联系电话:021-22899781