AI Navigate

[P] ColQwen3.5-v3 リリース + ケーススタディ

Reddit r/MachineLearning / 2026/3/18

📰 ニュースTools & Practical UsageModels & Research

要点

  • ColQwen3.5-4.5B-v3 は 45億パラメータを搭載してリリースされる予定で、MTEB ViDoRe ランキングの平均スコアが 75.67 で、平均値ベースの第1位と報告されています(公開は保留中)。
  • モデルは、パラメータ数とメモリ使用量がほぼ半分、埋め込み次元数は前回の第1位より約13倍少ないとして、はるかに高い効率性を主張しています。
  • 完全な評価の追跡が公開されており、候補ごとの結果ファイルと、トレーニング手法とケーススタディを詳述したブログ投稿が含まれています。
  • 公式には colpali-engine と vLLM(ROCm + CUDA)での即時利用をサポートしており、著者はすでに 9B のバリアントのトレーニングを始めています。

シリーズの最新のcolqwen3.5-4.5Bモデルを共有できてうれしいです。

ColQwen3.5-4.5B-v3は、公開待機中のMTEB ViDoReリーダーボードで平均75.67の値で#1(平均)です。パラメータ数は約半分、埋め込み次元は約13分の1、前回の#1モデルのメモリ使用量の約半分です。

所感: V3はV3 English u@5でv2をわずか上回り(0.6034 vs 0.6023)、大きな計算量に対して僅かな向上です。実際の勝利はV2ベンチマークの跳躍と、V3で80億パラメータのモデルを超えたことでした。そこが、さらなる最適化とモデルおよびトレーニングデータの制限を受け入れる境界を引く決断をした理由です。

完全な評価の経緯は公開されており、試したすべての候補の結果ファイルが含まれています。

リンク:

ColQwen3.5-4.5B-v3はすでにcolpali-engineとvLLM(ROCm + CUDA)で公式サポートされているため、実際に使用できます。

ライセンス: Apache 2.0

現在、9Bバリアントをよりシンプルなセットアップでトレーニングしており、それが完了したら投稿します。

投稿者 /u/madkimchi
[リンク] [コメント]