要約: 効率的なコミュニケーションには、意味を符号化する際の情報性と単純さのバランスを取ることが求められます。情報ボトルネック(IB)フレームワークはこのトレードオフを形式的に捉え、自然言語システムが最適な精度と複雑さの境界の近くにクラスタ化すると予測します。色彩や動きといった視覚的領域で支持されている一方、文脈中の語といった言語的刺激は未検証のままです。私たちはこのギャップに対処するため、翻訳をIB最適化問題として位置づけ、ソース文を刺激として、ターゲット文を圧縮された意味として扱います。これにより、IB分析を並列コーパス上で直接実行できるようになります。フランス語の小説を英語・ドイツ語・セルビア語に翻訳した際の空間前置詞へこの手法を適用しました。情報性を推定するため、パイルソーティングのパイロット研究(N=35)を実施し、前置詞のペアの類似性判断を得ました。これらの判断を予測する低ランク射影モデル(D=5)を訓練し、予測との相関係数(Spearman相関: 0.78)を得ました。前置詞の実証翻訳は、反事実的な代替案よりもIBの最適境界に近く、空間領域における伝達効率の圧力を人間の翻訳者が示す予備的な証拠を提供します。より広く言えば、この研究は、翻訳が言語間の意味体系を形作る認知的効率性の圧力を窓のように示す可能性があることを示唆します。
情報ボトルネックの視点からの翻訳:並列テキストにおける空間前置詞の効率性分析
arXiv cs.CL / 2026/3/23
📰 ニュースIdeas & Deep AnalysisModels & Research
要点
- 本研究は翻訳を情報ボトルネック最適化として再定義し、異言間のマッピングにおける情報性と単純さのトレードオフを分析する。
- フランス小説の英語・ドイツ語・セルビア語への翻訳を横断して、空間前置詞の情報性を並列テキストを用いて推定する。
- 低ランク射影モデル(D=5)は前置詞に対する人間の類似性判断をSpearmanのρ=0.78で予測し、IBフロンティアの予想と一致する。
- 結果は、翻訳者が空間意味論においてコミュニケーションの効率性圧力を示す予備的な証拠を提供し、翻訳が言語間の意味論を形作る認知的効率性を明らかにする可能性を示唆している。