[P] ColQwen3.5-v3 リリース + ケーススタディ

Reddit r/MachineLearning / 2026/3/18

📰 ニュースTools & Practical UsageModels & Research

共有:

要点

ColQwen3.5-4.5B-v3 は 45億パラメータを搭載してリリースされる予定で、MTEB ViDoRe ランキングの平均スコアが 75.67 で、平均値ベースの第1位と報告されています（公開は保留中）。
モデルは、パラメータ数とメモリ使用量がほぼ半分、埋め込み次元数は前回の第1位より約13倍少ないとして、はるかに高い効率性を主張しています。
完全な評価の追跡が公開されており、候補ごとの結果ファイルと、トレーニング手法とケーススタディを詳述したブログ投稿が含まれています。
公式には colpali-engine と vLLM（ROCm + CUDA）での即時利用をサポートしており、著者はすでに 9B のバリアントのトレーニングを始めています。

シリーズの最新のcolqwen3.5-4.5Bモデルを共有できてうれしいです。

ColQwen3.5-4.5B-v3は、公開待機中のMTEB ViDoReリーダーボードで平均75.67の値で#1（平均）です。パラメータ数は約半分、埋め込み次元は約13分の1、前回の#1モデルのメモリ使用量の約半分です。

所感: V3はV3 English u@5でv2をわずか上回り(0.6034 vs 0.6023)、大きな計算量に対して僅かな向上です。実際の勝利はV2ベンチマークの跳躍と、V3で80億パラメータのモデルを超えたことでした。そこが、さらなる最適化とモデルおよびトレーニングデータの制限を受け入れる境界を引く決断をした理由です。

完全な評価の経緯は公開されており、試したすべての候補の結果ファイルが含まれています。

リンク：

モデル（V1、V2、V3）： https://huggingface.co/athrael-soju/colqwen3.5-4.5B-v3（モデルカードは修正が必要な場合があります）
すべての評価ファイルは公開していますので、私の課題を確認したい場合は： https://huggingface.co/datasets/athrael-soju/colqwen-optimization-trail
ブログ投稿における完全なトレーニング手法とケーススタディ： https://athrael.net/blog/research/diminishing-returns-benchmark-optimization
Mtebリーダーボード（左サイドバーからViDoRe V3を選択）： https://huggingface.co/spaces/mteb/leaderboard

ColQwen3.5-4.5B-v3はすでにcolpali-engineとvLLM（ROCm + CUDA）で公式サポートされているため、実際に使用できます。

ライセンス: Apache 2.0

現在、9Bバリアントをよりシンプルなセットアップでトレーニングしており、それが完了したら投稿します。

投稿者 /u/madkimchi
[リンク] [コメント]

コンテンツクリエイターのためのAIプロンプト完全ガイド

Dev.to

追跡業務の自動化：フェスティバル出店者のコンプライアンスのためのAI

Dev.to

山積みからプロトコルへ：スケール時のベンダーコンプライアンスにおけるAI活用

Dev.to

MCPスキルとMCPツール: サーバーを正しく構成する方法

Dev.to

テックキャリアに4年間も費やしている

Dev.to

[P] ColQwen3.5-v3 リリース + ケーススタディ

要点

関連記事

コンテンツクリエイターのためのAIプロンプト完全ガイド

追跡業務の自動化：フェスティバル出店者のコンプライアンスのためのAI

山積みからプロトコルへ：スケール時のベンダーコンプライアンスにおけるAI活用

MCPスキルとMCPツール: サーバーを正しく構成する方法

テックキャリアに4年間も費やしている

関連おすすめサービス

Notta搭載AI議事録イヤホン ZENCHORD1

AI搭載ボイスレコーダー Plaud

画像高画質化AIツール Aiarty Image Enhancer