研究室の仮説から製薬会社の棚へ——その道のりは、現代の産業における最も過酷なマラソンの一つであり、通常10〜15年、投資は数十億ドルに及びます。
進展がしばしば阻まれるのは、生物学そのものが抱える本質的な謎だけが理由ではありません。実際の実験設計用の装置、ソフトウェア、データベースの間で研究者が手作業で切り替えを強いられる、「分断されていてスケールしにくい」ワークフローがあるからです。
しかしOpenAIは、このプロセスを加速し、より効率的で、より簡単に、そして理想的にはより生産的にすることを目的に、特化型モデルGPT-Rosalindを新たにリリースします。先駆的な化学者ロザリンド・フランクリンにちなんで名付けられたこの推論モデルは、DNAの構造の発見に不可欠だった彼女の業績に由来します(そして、男性の同僚ジェームズ・ワトソンとフランシス・クリックによって見落とされることがしばしばありました)。この新しいフロンティアの推論モデルは、生物科学分野の研究のための専用の知的レイヤーとして機能するように設計されています。
AIの役割を、汎用のアシスタントから、領域特化の「推論」パートナーへと切り替えることで、OpenAIは生物学および化学の発見に対する長期的なコミットメントを示しています。
GPT-Rosalindが提供するもの
GPT-Rosalindは、単に文章生成を速くすることだけを目的としているわけではありません。証拠を統合し、生物学的仮説を生成し、実験を計画するように設計されています。これらは従来、専門家による人手の統合に何年も必要とされてきた作業です。
中核にあるのは、科学的ワークフロー向けに最適化された新しい一連のモデルの第1弾である点です。これまでのGPTが一般的な言語タスクに優れていた一方で、このモデルは、ゲノミクス、タンパク質工学、化学にまたがるより深い理解のために微調整されています。
その能力を検証するために、OpenAIは複数の業界ベンチマークでモデルを試験しました。実世界のバイオインフォマティクスとデータ解析の指標であるBixBenchでは、公開スコアがあるモデル群の中でGPT-Rosalindがトップのパフォーマンスを達成しました。
さらに、LABBench2によるよりきめ細かなテストでは、モデルは11のタスクのうち6つでGPT-5.4を上回り、最も大きな伸びが見られたのはCloningQAでした。CloningQAは、分子クローニング手順のための試薬を、エンドツーエンドで設計することを要するタスクです。
モデルの最も印象的な性能シグナルは、Dyno Therapeuticsとの提携からもたらされました。未公開の「汚染されていない」RNA配列を用いた評価で、GPT-Rosalindには配列から機能を予測し、配列を生成するように課題が与えられました。
さらにCodex環境で直接評価すると、モデルの提出物は、予測タスクにおいて人間の専門家の95パーセンタイル超の順位となり、配列生成では84パーセンタイルに到達しました。
この水準の専門性は、一般的なモデルが見落としがちな「専門家にとって関連性の高いパターン」を特定できる、高度な協働者としてモデルを活用できることを示唆しています。
新しいラボのワークフロー
OpenAIは単にモデルをリリースするのではなく、研究者がすでに使っているツールに統合するためのエコシステムを立ち上げています。その中心にあるのが、GitHubで利用可能なCodex向けライフサイエンス研究プラグインの新機能です。
科学研究は有名なほどサイロ化しています。単一のプロジェクトでも、研究者がタンパク質構造データベースを参照し、20年分の臨床文献を調べ、その後配列操作用の別ツールを使う必要があるかもしれません。新しいプラグインは、このような複数ステップの問いに対して統一された出発点を提供する「オーケストレーションレイヤー」として機能します。
スキルセット:このパッケージには、生化学、人間の遺伝学、機能ゲノミクス、臨床エビデンス向けのモジュール式スキルが含まれています。
接続性:これにより、50以上の公開マルチオミクスデータベースおよび文献ソースへモデルを接続できます。
効率性:このアプローチは、「長期にわたる、ツールを多用する科学的ワークフロー」を対象とし、タンパク質構造の照会や配列検索のような繰り返し可能な作業を研究者が自動化できるようにします。
限定的でゲート付きのアクセス
生物学的構造を再設計できる可能性を持つモデルの力を考えると、OpenAIは、広範な「オープンソース」または一般向けの公開ではなく、Trusted Access(信頼されたアクセス)プログラムを選んでいます。
このモデルは、米国の資格を持つエンタープライズ顧客向けに、研究プレビューとして提供を開始します。この制限付きの展開は、「有益な利用」「強固なガバナンス」「制御されたアクセス」という3つの中核原則に基づいて構築されています。
アクセスを申請する組織は、明確な公共的利益を伴う正当な研究を行っていることを確認するため、資格審査と安全性レビューを受ける必要があります。
一般用途のモデルとは異なり、GPT-Rosalindは、強化されたエンタープライズレベルのセキュリティ制御を前提に開発されています。エンドユーザーにとっては、つまり:
アクセス制限:使用は、セキュアで適切に管理された環境内での、承認済みユーザーに限定されます。
ガバナンス:参加する組織は、悪用防止のための厳格な統制を維持し、特定のライフサイエンス研究プレビューの利用条件に同意する必要があります。
コスト:プレビュー期間中、モデルは既存のクレジットやトークンを消費しません。これにより、研究者は(悪用を防ぐガードレールの対象となるものの)直ちに予算上の制約を受けることなく試すことができます。
初期の業界パートナーからの好意的な反応
今回の発表は、製薬分野およびテクノロジー分野におけるOpenAIパートナーから大きな賛同を得ました。
AmgenのAIおよびデータ担当SVPであるSean Bruichは、この協力により同社が高度なツールを「患者さんに対する医薬品の提供をどう加速するか」という形で活用できるようになると述べました。加えて、その影響は、研究室を支える専門的なテクノロジー基盤にも表れています:
NVIDIA:ヘルスケアおよびライフサイエンス担当VPのKimberly Powellは、領域に基づく推論と高速化された計算の融合を、「従来のR&Dにかかる何年もの時間を、すぐに実行可能な科学的インサイトへ圧縮する方法」として説明しました。
Moderna:CEOのStéphane Bancelは、このモデルが「複雑な生物学的エビデンスをまたいで推論する」能力を持ち、チームがインサイトを実験ワークフローへと変換するのを支援できる点を強調しました。
The Allen Institute:CTOのAndy Hicklは、GPT-Rosalindが、データを見つけて整列させるような手作業のプロセスを、エージェント型のワークフローの中で「より一貫して再現可能」にすることで際立っていると述べました。
これは、OpenAIがすでに現場で得ている具体的な成果にも基づいています。たとえばGinkgo Bioworksとの協力では、AIモデルがタンパク質生産コストを40%削減することに貢献しました。
ライフサイエンスにおけるロザリンドとOpenAIの次の展開は?
GPT-RosalindにおけるOpenAIのミッションは、「有望な科学的アイデア」と、医療の進歩に必要な実際の「エビデンス、実験、意思決定」とのギャップを縮めることです。
同社は、AIによる触媒設計や生物学的構造の改変を探るために、ロスアラモス国立研究所のような機関と連携することで、GPT-Rosalindを単なるツールではなく、「発見における有能なパートナー」として位置付けています。
ライフサイエンス分野がますますデータ密度の高い領域になっていく中で、ロザリンドのような専用の「推論」モデルへの移行は、生物学と化学における「広大な探索空間」を切り開くための標準になっていく可能性があります。



