最新の論文1,000万本を対象にしたインタラクティブなセマンティックマップ [P]

Reddit r/MachineLearning / 2026/4/29

💬 オピニオンDeveloper Stack & InfrastructureIdeas & Deep AnalysisTools & Practical UsageModels & Research

要点

  • 科学文献を「空間的な探索」でたどれるようにすることを目的とした、インタラクティブなセマンティックマップについて説明しています。
  • OpenAlex から最新の1,000万本の論文を取得し、タイトルと要旨から SPECTER 2 を用いて埋め込み(embeddings)を生成しています。
  • 埋め込みの次元削減に UMAP を使い、密度ピークに対する Voronoi 分割で意味的な近隣(セマンティック・ネイバーフッド)を形成します。
  • 地図上に表示されるトピックラベルは独自のラベリング手法で生成されており、現時点では開発途上だとされています。
  • キーワード検索とセマンティック検索の両方に対応し、さらに機関・著者・トピックなどを分析・ランキングする層も備えているとのことです。
最新の公開論文1000万本のインタラクティブなセマンティックマップ [P]

空間的な探索によって複雑な科学の世界をナビゲートするのを助けるための地図を作りました。

仕組み:

OpenAlexから最新の1000万本の論文を取得し、タイトルと抄録に対してSPECTER 2を使って埋め込み(embeddings)を生成しました。

UMAPで次元削減を行い、その後、密度のピークに対してVoronoi分割を適用して、異なる意味的な近傍(neighborhoods)を作成しました。

浮かんでいるトピックラベルは、カスタムのラベリングアルゴリズムによって生成しています(もちろん、まだ作業中です!)。

キーワードによる検索とセマンティック検索の両方に対応しており、さらに機関・著者・トピックなどのランキングのための分析(analytics)レイヤーもあります。

インタラクティブな地図を試してみたい方は、ここで無料で使えます:The Global Research Space

フィードバックや提案は大歓迎です!

投稿者: /u/icannotchangethename
[リンク] [コメント]