Abstract
ポリスルホン(PSF)膜の機械的特性を、構造記述子から予測することは、実験研究に典型的に見られる極端なデータ不足のため、いまだ困難です。 この問題を検討するため、本研究は、4つの大規模言語モデル(LLMs)(DeepSeek-V3、DeepSeek-R1、ChatGPT-4o、GPT-5)を用いた知識駆動推論を、孔径(PD)、接触角(CA)、厚さ(T)、孔隙率(P)の測定値に基づくヤング模量(E)、引張強度(TS)、破断時の伸び(EL)を予測するための部分最小二乗回帰(PLS)と比較してベンチマークしました。これらの知識駆動型アプローチは、化学計量学的基準に対して、性質特異的な利点を示しました。ELに関しては、LLMsは統計的に有意な改善を達成し、DeepSeek-R1とGPT-5がそれぞれRMSEの削減を40.5%および40.3%で提供し、平均絶対誤差を11.63±5.34%から5.18±0.17%へ低減しました。実行間の変動は、PLS(最大47%)と比較してLLMsで顕著に抑制されました(≤3%)。EおよびTSの予測は、アプローチ間で統計的な均衡を示し(q≥0.05)、強い構造-特性相関を持つ特性には線形手法が十分な性能を示すことを示唆します。誤差のトポロジー分析は、データレジームの影響によって支配される系統的な平均回帰挙動を明らかにし、モデルファミリの制約よりもデータ領域の影響が大きいことを示しました。これらの知見は、ブートストラップ不安定性下で非線形かつ制約感受性のある特性に対してLLMが優れている一方、解釈可能な潜在変数分解を必要とする線形関係にはPLSが依然競争力を持つことを確立します。示された補完性は、解釈可能なフレームワーク内でLLMがエンコードした知識を活用するハイブリッドアーキテクチャが、小データ材料探索を最適化する可能性を示唆します。