QiMeng-CodeV-SVA: RTLに基づく双方向データ合成を用いたハードウェアアサーション生成のための特化型LLM群の訓練

arXiv cs.CL / 2026/3/17

📰 ニュースIdeas & Deep AnalysisModels & Research

共有:

要点

本論文は、高品質な実世界のSVAコーパスの不足を解消するため、巨大規模のオープンソースRTLを活用してLLMを実世界のSVA生成へ導くデータ合成フレームワークを提案する。
NL-SVAの意味的同値性を信頼性高く判定するデータ選択手法として双方向翻訳を導入する。
合成データを用いてCodeV-SVAという一連のSVA生成モデルを訓練し、CodeV-SVA-14BはFunc.@1においてNL2SVA-Humanで75.8%、NL2SVA-Machineで84.0%を達成し、GPT-5やDeepSeek-R1と同等・上回る性能を示している。
本研究は、RTLに基づく領域特化型LLMがハードウェア検証タスクに適用可能であることを示し、将来の検証ツールや手法に影響を与える可能性がある。

要約: SystemVerilog Assertions（SVAs）はハードウェア検証にとって極めて重要です。最近の研究では汎用のLLMsを活用して自然言語の特性をSVAsに翻訳する（NL2SVA）ことが行われていますが、データ不足のため性能は低いです。我々は高品質な実世界のSVAコーパスの不足とNL-SVAの意味的等価性を判断する信頼できる方法の欠如という二つの課題に取り組むデータ合成フレームワークを提案します。前者には、大規模なオープンソースのRTLを用いてLLMsが実世界のSVAを生成するガイドとし、後者には双方向翻訳をデータ選択の手法として用います。合成データを用いて、CodeV-SVAという一連のSVA生成モデルを訓練します。特に、CodeV-SVA-14BはFunc.@1においてNL2SVA-Humanで75.8％、NL2SVA-Machineで84.0％を達成し、GPT-5やDeepSeek-R1といった高度なLLMsと肩を並べるか、それを上回る水準に達しています。

返却形式: {"translated": "翻訳されたHTML"}

追跡業務の自動化：フェスティバル出店者のコンプライアンスのためのAI

Dev.to

MCPスキルとMCPツール: サーバーを正しく構成する方法

Dev.to

2026年にすべてのコンテンツクリエイターが必要とする500のAIプロンプト（20件の無料サンプル付き）

Dev.to

娘のためのAIを活用したゲームを作る — 第1部: 彼女も作れるとしたら？

Dev.to

数学には思考の時間が、日常知識には記憶が必要であり、新しいTransformerアーキテクチャは両方を実現することを目指す

THE DECODER

QiMeng-CodeV-SVA: RTLに基づく双方向データ合成を用いたハードウェアアサーション生成のための特化型LLM群の訓練

要点

関連記事

追跡業務の自動化：フェスティバル出店者のコンプライアンスのためのAI

MCPスキルとMCPツール: サーバーを正しく構成する方法

2026年にすべてのコンテンツクリエイターが必要とする500のAIプロンプト（20件の無料サンプル付き）

娘のためのAIを活用したゲームを作る — 第1部: 彼女も作れるとしたら？

数学には思考の時間が、日常知識には記憶が必要であり、新しいTransformerアーキテクチャは両方を実現することを目指す

関連おすすめサービス

Notta搭載AI議事録イヤホン ZENCHORD1

AI搭載ボイスレコーダー Plaud

画像高画質化AIツール Aiarty Image Enhancer