LLM-jp FT-LLMコンペに直球ど真ん中ストレートを投げ込んだ(つもりの)話

Zenn / 2026/3/26

💬 オピニオンIdeas & Deep AnalysisModels & Research

共有:

要点

「LLM-jp FT-LLMコンペ」に直球で投入する（つもりの）開発・試行錯誤の姿勢が中心で、勝ち筋を狙いに行く考え方が語られています
どのような方向性でファインチューニングやLLM活用を進めるか、コンペ用の実装・方針に関する示唆が含まれます
競技形式（評価軸）に対して、ストレートな設計判断で成果を取りにいくプロセスが読み取れる内容です
技術ブログとして、実験の前提・狙い・結果（や反省）に接続するスタイルが特徴です

松尾研究所の尾崎です．25卒でデータサイエンティストをやっています．本記事では，LLM-jp FT-LLMコンペティションにおける我々チームの取り組みをご紹介します．NLP2026で発表した論文「LLM-jp FT-LLMコンペにおける数学推論能力向上の取り組み」（尾崎・力岡・渡部・Jeong）の内容をベースに，ブログ向けに再構成しています．このコンペは，LLM-jpが主催するファインチューニングの公開コンペティションで，llm-jp-4-8b(2026/03/23現在未公開)をベースモデルとして，中学校・高等学校レベルの数学問題500問の正答率を競うというものです．推論時にはllm...

この記事の続きは原文サイトでお読みいただけます。

原文を読む →

生成AIで従来型インフラは限界に、IOWN APNで距離と遅延の壁を克服

日経XTECH

生成AIで従来型インフラは限界に、IOWN APNで距離と遅延の壁を克服

日経XTECH

AIによる「同質化のわな」から抜け出せるか、技術戦略責任者が議論

日経XTECH

プロンプト・マーケットの規制：証券法、知的財産、そしてプロンプト・アセットの取引

Dev.to

Mercorの競合Deccan AI、25Mドル調達、インドから専門家を確保

Dev.to

LLM-jp FT-LLMコンペに直球ど真ん中ストレートを投げ込んだ(つもりの)話

要点

関連記事

生成AIで従来型インフラは限界に、IOWN APNで距離と遅延の壁を克服

生成AIで従来型インフラは限界に、IOWN APNで距離と遅延の壁を克服

AIによる「同質化のわな」から抜け出せるか、技術戦略責任者が議論

プロンプト・マーケットの規制：証券法、知的財産、そしてプロンプト・アセットの取引

Mercorの競合Deccan AI、25Mドル調達、インドから専門家を確保

関連おすすめサービス

Notta搭載AI議事録イヤホン ZENCHORD1

AI搭載ボイスレコーダー Plaud

画像高画質化AIツール Aiarty Image Enhancer