OpenAI GPT-Rosalind

美国OpenAI公司于16日(美国时间)发布了专为生命科学研究设计的模型“GPT-Rosalind”。该模型旨在支持生物学、药物开发及转化医学领域的研究,目前以ChatGPT、Codex及API的预览版形式向研究机构开放。

GPT-Rosalind是首款针对生命科学研究优化的系列模型,覆盖化学、蛋白质工程、基因组学等多个科学工作流程。它不仅能进行分子、蛋白质、基因、信号通路及疾病生物学的推理,还支持文献综述、序列与功能解析、实验设计及数据分析等多阶段工作流程。该模型名称来源于为DNA双螺旋结构发现做出贡献的日本科学家罗莎琳德·富兰克林。

性能评估

在性能测试中,GPT-Rosalind在生物学和化学领域的推理能力,如化学反应机制、蛋白质结构及DNA序列解析方面,表现优于GPT-5、5.2及5.4版本。基准测试中,它在针对生物信息学和数据分析设计的BixBench中表现出色,在LABBench2的11个测试项目中,有6项超过了GPT-5.4。尤其在分子克隆相关的DNA和酶试剂设计任务CloningQA中,提升尤为显著。

在使用未公开的RNA序列进行功能预测和序列生成任务的评估中,GPT-Rosalind的预测准确率超过了人类专家的95百分位,生成任务的表现也达到了约84百分位。

Life Science Research Plugin

此外,OpenAI还推出了针对Codex的插件“生命科学研究插件”,该插件已在GitHub公开,支持模型连接50多种科学工具和数据源,进一步扩展了模型的应用范围。

插件示意