要約: 大量かつ多様で高速なデータ生成を考慮すると、ビッグデータのための特徴選択手法の調査はさまざまな応用と利点をもたらす。無関係かつ冗長な特徴を除去することで、特徴選択はデータ次元を削減し、それによって意思決定システム内での最適な意思決定を容易にする。ハイブリッド情報システムでの特徴選択の主要なツールの一つがファジーラフ集合理論である。しかし、本理論は大きく二つの課題に直面している。第一に、高次元空間における交差操作によるファジー同値関係の取得は時間とメモリを多く消費し得ること。さらに、この方法はノイズを生みやすく、特徴選択過程を複雑化させる。そこで本論文の目的と革新性はこれらの問題に対処することである。我々はオブジェクト間の結合距離を計算し、それを用いてファジー同値関係を導出する新しい特徴選択モデルを提案した。特徴選択問題を直接解くのではなく、この問題を適切なメタヒューリスティックアルゴリズムによって解決可能な最適化問題に再定式化した。この新手法をFSbuHDと名付けた。FSbuHDモデルは導入した二つのファジー同値関係のいずれかを選択することにより、通常モードと楽観モードの二つのモードで動作する。モデルはUCIリポジトリの標準的なデータセットで検証され、他のアルゴリズムと比較された。本研究の結果は、FSbuHDが過去の手法やアルゴリズムと比較して、特徴選択において最も効率的かつ効果的な方法の一つであることを示している。
ハイブリッド情報システムにおける通常および楽観的状態でのファジーラフ集合理論に基づく新しい特徴選択モデリング
arXiv cs.AI / 2026/3/11
Ideas & Deep AnalysisModels & Research
要点
- 本論文はファジーラフ集合理論に基づく新しい特徴選択モデルFSbuHDを提案し、高次元のハイブリッド情報システムにおける課題に対処している。
- FSbuHDはオブジェクト間の結合距離を計算し、計算負荷が高くノイズが多い交差操作を避けてファジー同値関係を導出する。
- 特徴選択問題を最適化問題に再定式化し、メタヒューリスティックアルゴリズムを用いて通常モードと楽観モードで解決する。
- UCIデータセットでの実験結果は、FSbuHDが既存の特徴選択手法よりも効率性と効果の両面で優れていることを示している。
- 本手法はビッグデータ応用において、関連性の低い冗長な特徴を削減し、データ次元を低減して最適な意思決定を促進する点で特に価値が高い。