128张GPU炼出中国版AlphaFold2：训练代码全开源，打开浏览器就可体验，北大元培系AI公司打造-六六导航站

128张GPU炼出中国版AlphaFold2：训练代码全开源，打开浏览器就可体验，北大元培系AI公司打造

2025-07-19 13:49:00 小编：六六导航站

中国版AlphaFold2，来了！

Uni-Fold，官宣即开源，还为科研者提供了测试接口和在线试用。

半年前，AlphaFold2和RoseTTAFold两个顶级AI算法齐齐引发生物学界、AI学界大地震。

半年后，这个横空出世的Uni-Fold，不光能完整复现AlphaFold2。

其预测精度超过RoseTTAFold、与AlphaFold2相当，效率还超AlphaFold2 2-3倍。

更重要的是，背后的团队不是如谷歌这样的互联网巨头，也不是数十年深耕于此的顶尖高校团队。

而是一家成立刚3年的AI创业公司——深势科技。

这个Uni-Fold究竟有何看头？接下来一看究竟。

AlphaFold2开源的消息曾一度火爆全场，等稍微冷静下来大家才发现，真正把它用起来并不容易。

用谷歌官方提供的Colab资源吗？可以，请排队。

自己有算力资源想部署？也可以，不过AlphaFold2只开源了模型推理部分的代码，并没有开源训练代码。

这意味着部署好后只能按AlphaFold2设计好的流程使用，难以针对特定的研究项目做一些迁移调整。

比如拿去预测蛋白质复合物结构，研究蛋白质与小分子相互作用，又或者与电镜实验相结合，这些都无能为力。

再加上，该代码基于谷歌自研的可微分计算框架JAX及TPU硬件平台开发，高度依赖谷歌生态系统。

最后，AlphaFold2虽然模型开源，但调好的参数组合却不开放商业使用。

谷歌母公司Alphabet对AlphaFold2有着自己的商业化打算，11月新成立的子公司Isomorphic Laboratories便是其第一步。

鉴于这样的局限性，像深势科技这样的创业团队得自己想办法。

他们的办法，便是根据开源模型自己复现AlphaFold2的训练部分。

经过几个月的攻关，他们终于在128块英伟达V100上复现了AlphaFold2的全规模训练。

其中遇到最大的困难是GPU资源有限，难以同时进行多次训练来比较效果。于是他们只好在设计上下功夫，尽量减少试错次数。

没想到因此有了一些额外的收获。

经过混合精度、MPI 并行以及数据异步读取等一系列优化后，复现模型做到了在相同硬件下推理效率还比AlphaFold2公开版高上2-3倍。

另外复现的模型也不再依赖谷歌生态，增加了与英伟达GPU、国产DPU等硬件体系的适配性。

模型搞定了，那接下来最关键的问题就是，预测精度如何？

团队用CASP14蛋白预测任务中的绝大部分序列进行了测试。

其中包括基于模版建模的两种难度（TBM-easy/hard），以及最具挑战性的无模版建模（FM），发布时Uni-Fold平均Cα-lDDT达到82.6。目前模型还在持续改进中，精度有望再上一层楼。

这个成绩超过了RoseTTAFold，与公开版AlphaFold2模型接近。

对于这个精度媲美原版、推理效率还更高的蛋白质结构预测工具，他们决定将其推理代码、训练代码全部开源，命名为Uni-Fold。

深势科技公布训练代码的举动受到业界广泛好评，连深度学习预测蛋白质结构的先驱、芝加哥丰田计算技术研究所的许锦波教授都评价道：

Uni-Fold的出现，让每个研究者都可以训练自己的模型。这无疑将进一步推动技术的发展。对整个蛋白质折叠领域来说，都是令人激动的消息。

深势科技这家成立仅3年的公司，为什么能成为国内首家复现Alphafold2全规模训练的团队？

复现后又为何要率先公开训练代码？

下面就来一探究竟。

实际上，在推出Uni-Fold之前，深势科技这个初创团队就已经颇受业内关注：

一年狂揽三轮融资，最近一轮达数千万美元，由高瓴创投领投。

从团队背景看，创始人兼首席科学家张林峰，北京大学元培学院出身，在普林斯顿大学获应用数学系博士学位。

另一位创始人兼CEO孙伟杰同样来自北大元培，后继续在北京大学深造，获管理学硕士学位。

孙伟杰在科技领域分析及投资经验丰富，张林峰则偏重技术。他的研究方向包括统计物理、分子模拟和机器学习及其应用。

此外担任首席科学顾问的是中科院院士、北京大学教授鄂维南。

北大元培系AI创业公司这个标签，算是深势科技受到资本青睐的原因之一。

再看技术实力，由鄂维南院士领衔的数十人科研队伍，包含物理建模、数值算法、机器学习、高性能计算及药物和材料计算等多个领域人才。

他们大多来自世界一流高校、科研机构和企业。

其中许多人拥有交叉背景，深势科技特别介绍了一位高中搞过生物竞赛，大学主修人工智能又参加过超算研究的同学。

这样的人了解不同学科的基础知识和术语体系，对团队协作沟通大有好处。

有着多学科交叉这样的特点，深势科技自述致力于“以新一代分子模拟方法打造微尺度工业设计平台”。

其中的新一代分子模拟方法，指「多尺度建模+机器学习+高性能计算」新研究范式。

新范式由深势科技首创，在保证了计算效率和精度的基础上还具备通用性，可为药物、材料等领域带来新的计算模拟及设计工具。

比如鄂维南、张林峰共同参与研究的一项技术，用机器学习方法将分子动力学极限提升至10亿原子规模同时保持高精度。

这项成果在2020年获得有「超算届诺贝尔奖」之称的戈登·贝尔奖，还与「量子优越性」和「人造太阳」等成果一起当选2020中国十大科技进展。

基于这样的团队背景和科研实力，也就不难理解深势科技为何能在这么短的时间内复现AlphaFold2全规模训练。

但作为一家创业公司，光有上述两种因素还不够，创造行业价值才是当前大环境下的题中之义。

有算法工具的突破做基础，Unif-Fold配套解决方案也已集成到他们自己的药物设计平台Hermite，免费注册即可测试使用。

Hermite基于云计算，无需操心模型部署、环境配置问题，只要打开

猜你喜欢

MusicTGA-HR提示指令
RappingAI提示指令
Boomy提示指令
TwoShot提示指令
Weet提示指令
Muzaic Studio提示指令
PlaylistGenius AI提示指令
HookGen提示指令
DadaBots提示指令

相关AI应用

Playlistable提示指令
Riffusion提示指令
WZRD提示指令
Natural Language Playlist提示指令
Cyanite.ai提示指令
Piano Genie提示指令
Synthesizer V提示指令
Cosonify提示指令
Musico提示指令

推荐AI教程资讯

精选推荐

PromptHero2025-01-02提示指令
法智2025-01-02法律助手
SmartWriteAI2025-02-18法律助手
Briefly2025-02-11法律助手
Audyo2025-02-17提示指令
ChatGPT Gratis2025-02-12提示指令