知能材料モデリング: ポリスルホン膜の機械的特性予測における大規模言語モデルと部分最小二乗回帰の比較

arXiv cs.AI / 2026/3/17

💬 オピニオンIdeas & Deep AnalysisModels & Research

共有:

要点

化学計量学ベースラインを上回り、破断伸び（EL）では約40%の RMSE 削減を実現し、データ不足設定で MAE を 11.63% から 5.18% に低減しました。
ヤング率（E）および引張強度（TS）について、LLMs は PLS と統計的に同等であり、構造-特性相関が強い場合には線形手法が競争力を持つことを示しています。
LLMs は実行間のばらつきがはるかに小さく（≤3%）、PLS は最大で47% に達することから、小データ領域でのロバスト性が高いことを示唆します。
本研究は、LLM でエンコードされた知識と、解釈可能な潜在変数モデルを組み合わせたハイブリッドアーキテクチャを提案し、少データ材料探索を最適化します。

Abstract

ポリスルホン（PSF）膜の機械的特性を、構造記述子から予測することは、実験研究に典型的に見られる極端なデータ不足のため、いまだ困難です。この問題を検討するため、本研究は、4つの大規模言語モデル（LLMs）（DeepSeek-V3、DeepSeek-R1、ChatGPT-4o、GPT-5）を用いた知識駆動推論を、孔径（PD）、接触角（CA）、厚さ（T）、孔隙率（P）の測定値に基づくヤング模量（E）、引張強度（TS）、破断時の伸び（EL）を予測するための部分最小二乗回帰（PLS）と比較してベンチマークしました。これらの知識駆動型アプローチは、化学計量学的基準に対して、性質特異的な利点を示しました。ELに関しては、LLMsは統計的に有意な改善を達成し、DeepSeek-R1とGPT-5がそれぞれRMSEの削減を40.5%および40.3%で提供し、平均絶対誤差を

11.63\pm5.34

%から

5.18\pm0.17

%へ低減しました。実行間の変動は、PLS（最大47%）と比較してLLMsで顕著に抑制されました（≤3%）。EおよびTSの予測は、アプローチ間で統計的な均衡を示し（q≥0.05）、強い構造-特性相関を持つ特性には線形手法が十分な性能を示すことを示唆します。誤差のトポロジー分析は、データレジームの影響によって支配される系統的な平均回帰挙動を明らかにし、モデルファミリの制約よりもデータ領域の影響が大きいことを示しました。これらの知見は、ブートストラップ不安定性下で非線形かつ制約感受性のある特性に対してLLMが優れている一方、解釈可能な潜在変数分解を必要とする線形関係にはPLSが依然競争力を持つことを確立します。示された補完性は、解釈可能なフレームワーク内でLLMがエンコードした知識を活用するハイブリッドアーキテクチャが、小データ材料探索を最適化する可能性を示唆します。

Day 10: 230回の奮闘セッション、結局は一人の人間が文書を読むことに尽きる

Dev.to

本番環境で壊れる、バイラルなAIコーディングデモの背後に潜む5つの危険な嘘

Dev.to

二つのボット、混乱したサーバー: NimbusがAIエージェントのアイデンティティについて明らかにしたこと

Dev.to

OpenTelemetryがLLMトレーシングを標準化しました。コード上では実際にはこのようになっています。

Dev.to

PIXIU: 金融分野向けの大規模言語モデル、指示データ、および評価ベンチマーク

Dev.to

知能材料モデリング: ポリスルホン膜の機械的特性予測における大規模言語モデルと部分最小二乗回帰の比較

要点

Abstract

関連記事

Day 10: 230回の奮闘セッション、結局は一人の人間が文書を読むことに尽きる

本番環境で壊れる、バイラルなAIコーディングデモの背後に潜む5つの危険な嘘

二つのボット、混乱したサーバー: NimbusがAIエージェントのアイデンティティについて明らかにしたこと

OpenTelemetryがLLMトレーシングを標準化しました。コード上では実際にはこのようになっています。

PIXIU: 金融分野向けの大規模言語モデル、指示データ、および評価ベンチマーク

関連おすすめサービス

Notta搭載AI議事録イヤホン ZENCHORD1

AI搭載ボイスレコーダー Plaud

画像高画質化AIツール Aiarty Image Enhancer