[D]SQLのみで分類器を訓練する(反復的最適化なし)

Reddit r/MachineLearning / 2026/3/23

📰 ニュースDeveloper Stack & InfrastructureTools & Practical UsageModels & Research

要点

  • SEFRは、SQL(BigQuery)だけで実装された軽量な線形分類器であり、反復的最適化を行わない。
  • 5.5万件の詐欺検出データセットにおいて、SEFRはAUC 0.954を達成した一方、ロジスティック回帰はAUC 0.986だった。
  • 完全に並列化可能な定式化と反復最適化の欠如により、SEFRは約18倍の高速化を実現している。
  • この投稿は、SQLだけで分類器を訓練することによりデータベースネイティブMLの実用性を示し、精度と速度のトレードオフを強調している。
  • レポートはRedditの投稿を通じて共有されており、SQLのみを使用したBigQueryでのエンドツーエンドMLを詳述するMedium記事へのリンクが含まれている。

軽量な線形分類器である SEFR を、完全に SQL(Google BigQuery 上で)実装し、ロジスティック回帰と比較するベンチマークを実施しました。

55,000件の不正検知データセットで、SEFR は AUC 0.954 を達成します。 一方、ロジスティック回帰は 0.986 ですが、SEFR は完全に並列化可能な定式化のおかげで約18倍高速です(反復的な最適化はありません)。

submitted by /u/CriticalofReviewer2
[リンク] [コメント]