Abstract
坑井掘削テレメトリは、基本的なラベリングの非対称性を持ちます。すなわち、地表センサデータは1~Hzで連続的に生成される一方で、ラベル付きの坑井内計測はコストが高く、間欠的で、かつ入手が限られています。坑井内メトリクス予測に関する現在の機械学習アプローチは、すべてが、最初からの完全教師あり学習を普遍的に採用していますが、このデータ状況には不適切です。本研究では、坑井掘削メトリクス予測に対するマスク付き自己符号化器(MAE)による事前学習の、最初の実証的評価を提示します。公開されているUtah FORGEの地熱井2本を用い、複数変数の掘削テレメトリ約350万タイムステップを構成データとして使用し、72種類のMAE構成に対する体系的なフルファクタ設計空間探索を行います。そして、Total Mud Volumeの予測タスクにおいて、教師ありLSTMおよびGRUのベースラインと比較します。その結果、最良のMAE構成は、教師ありGRUベースラインに比べてテスト平均絶対誤差を19.8 ext{%}低減しますが、教師ありLSTMベースラインには6.4 ext{%}劣ります。設計次元の解析により、潜在空間の幅が支配的なアーキテクチャ選択であることが示されます(テストMAEとの相関としてPearson r = -0.59)。一方で、マスキング比率は効果がほとんどありません。これは、1~Hzの掘削データにおける高い時間的冗長性によって説明される、予期しない発見です。これらの結果は、MAE事前学習を掘削分析の実行可能なパラダイムとして位置づけ、またそれが最も有益となる条件を特定します。