CLARIN-PT-LDB: ポルトガル語用のオープンLLMリーダーボード—言語・文化・礼儀性を評価する

arXiv cs.CL / 2026/3/16

📰 ニュースIdeas & Deep AnalysisModels & Research

共有:

要点

本論文は、欧州ポルトガル語のLLMを評価するためのオープンなリーダーボードであるCLARIN-PT-LDBを提示します。
ポルトガル文化との整合性とセーフガードを網羅するベンチマークを導入することで、評価のギャップに対処します。
これらのベンチマークには、欧州ポルトガル語ではこれまで利用できなかった新規の側面が含まれており、言語、礼儀正しさ、文化のよりニュアンスのある評価を可能にします。
リーダーボードとリソースは Hugging Face Space で提供されており、研究者と開発者にとってアクセスしやすい評価プラットフォームを提供します。

要旨: 本論文は、欧州ポルトガル語（PT-PT）用の Open Large Language Models（LLM）のリーダーボードの開発と、それに関連するベンチマークについて報告する。このリーダーボードは、欧州ポルトガル語のLLM評価のギャップを埋めるための取り組みとして登場するもので、これまでこの言語のこの変種に特化したリーダーボードが存在していなかった。本論文は、欧州ポルトガル語のベンチマークでこれまで利用可能になっていなかったパフォーマンスの側面を扱う新規ベンチマークについても報告しており、具体的にはモデルのセーフガードとポルトガル文化への整合性を含む。このリーダーボードは https://huggingface.co/spaces/PORTULAN/portuguese-llm-leaderboard で利用可能です。

生成AIが「下手な鉄砲」型サイバー攻撃を増やす、足元固めを急ごう

日経XTECH

文書の内容を学習なしでLLMに反映、Sakana AIの新技術 RAG代替は可能か

日経XTECH

NEC、「暗黙知」をAIで可視化—危険の予兆を映像から検出し、改善アドバイスを自動生成する技術を世界初開発

Innovatopia

LLMが数学の未解決問題を解いた日 — Epoch.ai FrontierMathと、人間とAIの協働が開く新しい研究スタイル

Qiita

AI生成で児童性的虐待をリアルに描写した画像・動画は前年比14％増の8029件確認されたという報告、特に動画件数は1年で260倍以上も増加

GIGAZINE

CLARIN-PT-LDB: ポルトガル語用のオープンLLMリーダーボード—言語・文化・礼儀性を評価する

要点

関連記事

生成AIが「下手な鉄砲」型サイバー攻撃を増やす、足元固めを急ごう

文書の内容を学習なしでLLMに反映、Sakana AIの新技術 RAG代替は可能か

NEC、「暗黙知」をAIで可視化—危険の予兆を映像から検出し、改善アドバイスを自動生成する技術を世界初開発

LLMが数学の未解決問題を解いた日 — Epoch.ai FrontierMathと、人間とAIの協働が開く新しい研究スタイル

AI生成で児童性的虐待をリアルに描写した画像・動画は前年比14％増の8029件確認されたという報告、特に動画件数は1年で260倍以上も増加

関連おすすめサービス

Notta搭載AI議事録イヤホン ZENCHORD1

AI搭載ボイスレコーダー Plaud

画像高画質化AIツール Aiarty Image Enhancer