OpenAI刚刚以罗莎琳德·弗兰克林的名字命名了其首个特定领域的人工智能模型——这位英国化学家的X射线晶体学工作帮助揭示了DNA的双螺旋结构,而她在生前则被剥夺了对此的荣誉。
GPT-罗莎琳德,于周四揭晓,是一个专为生物学、药物发现和转化医学设计的推理模型。这是OpenAI所称生命科学模型系列中的第一个——直接瞄准一个市场,许多专门实验室从大学到谷歌DeepMind都在争夺这个位置。
根据专家的说法,在美国,将药物从靶点发现到监管批准平均需要10到15年。这段时间大部分消失的不是在灵光一闪的时刻,而是在无止境的工作中:解析数千篇论文、查询数据库、设计试剂和解释模糊的结果。这正是GPT-罗莎琳德试图解决的问题。
OpenAI认为,该模型可以压缩早期阶段的工作。正如公司所说,GPT-罗莎琳德旨在帮助科学家“探索更多的可能性,浮现出可能被忽视的关联,并更早地得出更好的假设。”
基准测试至少在某种程度上支持了这一雄心。在BixBench——一个围绕真实世界生物信息学任务构建的基准——GPT-罗莎琳德记录了0.751的通过率,是已发布结果的模型中最高分。在LABBench2中,它在11项任务中有6项优于其前身GPT-5.4。
GPT-罗莎琳德在涉及生命科学的每一个案例中都超过了GPT 5.4,但它是一个高度特定的模型,在其他领域将表现不佳。
OpenAI还宣布Dyno Therapeutics将帮助测试和评估其基于未公开的RNA序列的模型,以排除记忆化的可能性。GPT-罗莎琳德的十次最佳提交在序列预测任务中位于人类专家的95百分位以上,而在生成任务中约为84百分位。
也就是说,OpenAI的生命科学研究负责人Joy Jiao对该模型的实际能力持谨慎态度。她解释说,公司并不认为罗莎琳德是一个能够自主创造新治疗方案的模型,但对记者表示,它可以在加速研究方面提供极大帮助。“我们确实认为有一个真正的机会来帮助研究人员在科学过程的一些最复杂和最耗时的部分中加快进展,”Jiao在新闻发布会上说,如同《洛杉矶时报》所述。
围绕该模型的生态系统可能与模型本身同样重要。OpenAI还将发布一个免费的生命科学研究插件,用于Codex,连接超过50个科学数据库和工具——蛋白质结构查找、序列搜索、文献综述、基因组管道。拥有GPT-罗莎琳德访问权限的企业用户可以在其上使用推理层。其他用户则可以使用标准模型的插件。
OpenAI已为这一发布安排了一系列制药和生物技术客户,包括安进、莫德纳和赛默飞世尔科技。同时,它还与洛斯阿拉莫斯国家实验室进行了一项关于AI引导蛋白质和催化剂设计的研究合作。
“生命科学领域在每一步都需要精确。问题高度复杂,数据高度独特,风险极高,”安进公司AI和数据高级副总裁Sean Bruich在官方公告中表示。
对罗莎琳德的访问是有意限制的。该模型仅限美国企业使用,需经过资格和安全审核。担忧并非抽象:一个超过100位科学家的国际联盟已呼吁对用于训练AI的生物数据实施更严格的控制,引用了病原体设计的风险。OpenAI的限制性推出正是对此的直接回应。在研究预览期间,使用将不会消耗现有的API积分。
这也不是OpenAI首次进入科学工作流程。今年一月推出的Prism科学写作工作区是第一步。GPT-罗莎琳德是更尖锐、更专业的后续产品——并且发出了特定领域模型正在成为严肃竞争前沿的信号。
尚没有完全由AI发现的药物通过了三期临床试验。这个数字仍然是零。但如果GPT-罗莎琳德能帮助研究人员在成千上万的实验室中更快地设计出更好的实验,那么对发现的影响以及发现的时间可能会是整个游戏的关键。这就是这里的实际论点,值得密切关注。
免责声明:本文章仅代表作者个人观点,不代表本平台的立场和观点。本文章仅供信息分享,不构成对任何人的任何投资建议。用户与作者之间的任何争议,与本平台无关。如网页中刊载的文章或图片涉及侵权,请提供相关的权利证明和身份证明发送邮件到support@aicoin.com,本平台相关工作人员将会进行核查。