AI Navigate

コンテンツ分析における大規模言語モデルの人間中心のワークフロー

arXiv cs.AI / 2026/3/23

💬 オピニオンTools & Practical UsageModels & Research

要点

  • LLMはチャットインターフェースよりもAPI経由で活用すべきであり、コンテンツ分析のための3つのタスクからなるワークフローとして、アノテーション、要約、情報抽出を提案します。
  • このワークフローは明確に人間中心であり、研究者が各段階を設計・監督・検証することで厳密性と透明性を確保します。
  • このアプローチは複数の分野の洞察を統合し、ブラックボックス挙動、プロンプト感度、幻覚(ハルシネーション)等の制約に対処する検証手順とベストプラクティスを提供します。
  • 実務的な導入のため、著者らは補足資料としてプロンプトライブラリと、使用手順を詳述したJupyter Notebook形式のPythonコードを提供します。

Abstract

While many researchers use Large Language Models (LLMs) through chat-based access, their real potential lies in leveraging LLMs via application programming interfaces (APIs). This paper conceptualizes LLMs as universal text processing machines and presents a comprehensive workflow for employing LLMs in three qualitative and quantitative content analysis tasks: (1) annotation (an umbrella term for qualitative coding, labeling and text classification), (2) summarization, and (3) information extraction. The workflow is explicitly human-centered. Researchers design, supervise, and validate each stage of the LLM process to ensure rigor and transparency. Our approach synthesizes insights from extensive methodological literature across multiple disciplines: political science, sociology, computer science, psychology, and management. We outline validation procedures and best practices to address key limitations of LLMs, such as their black-box nature, prompt sensitivity, and tendency to hallucinate. To facilitate practical implementation, we provide supplementary materials, including a prompt library and Python code in Jupyter Notebook format, accompanied by detailed usage instructions.