kreuzcrawl は高性能な Web クロールエンジンです。特定の実行環境を強制せずに複数の言語にまたがってネイティブに動作しながら、構造化データを確実に抽出できるように設計されています。こちらをご覧ください: https://github.com/kreuzberg-dev/kreuzcrawl
MCP サーバーは最初から統合されており、主要なユースケースとして Web クロール AI エージェントを可能にします。ストリーミングのクロールイベントにより、リアルタイムで進捗を追跡できます。バッチ操作は何百もの URL を同時に処理し、部分的な失敗にも耐えます。ブラウザレンダリングは JavaScript が多用される SPA をサポートし、WAF 検出も含まれます。
対応している言語インターフェースは Rust、Python、Typescript/Node.js、Go、Ruby、Java、C#、PHP、Elixir、WASM、そして C FFI で、それぞれのバインディングはコアエンジンに直接接続します。
Kreuzcrawl は Kreuzberg org の一部です: https://kreuzberg.dev/
フィードバックや貢献を歓迎します :)
[リンク] [コメント]




