アイサイトに深層学習、ステレオカメラどこまで進化スバル寄稿

日経XTECH / 2026/5/6

💬 オピニオンSignals & Early TrendsIdeas & Deep AnalysisIndustry & Market Moves

共有:

要点

スバルの運転支援「アイサイト」はステレオカメラで障害物を認識し、車両制御により衝突被害軽減を狙う。
スバルは2020年代後半に向けて、ステレオカメラへ深層学習（ディープラーニング）を適用して性能をさらに高める方針だ。
自動車機能の進化は画像処理の進化と連動しており、センサー解像度（モノクロVGA→メガピクセル級）やカラー化が、検出能力の向上につながってきた。
最新アイサイトでは約230万画素のRGGB撮像素子を採用し、深層学習によって複雑な画像認識を可能にしている。
スバルは画像処理ロジックを内製し、エンジニアが実道路で得た珍しい場面をもとに適合・改良を重ねる開発スタイルが特徴で、研究開発は30年以上継続している。

　SUBARU（スバル）の運転支援技術「アイサイト」。ステレオカメラで障害物を認識し、車両を制御することで衝突時の被害を軽減できる。自動車メーカーでは珍しく画像処理ロジックを内製するスバルは、2020年代後半にAI（ディープラーニング、深層学習）技術を採用し、さらに性能を高める考えだ。ステレオカメラにディープラーニングを適用すると何ができるのか。AI開発拠点SUBARU Lab副所長の齋藤徹氏が解説する。（日経クロステック）

齋藤徹（SUBARU Lab副所長）

さいとう・とおる　1979年生まれ。東京都渋谷区出身。慶應義塾大学環境情報学部卒業。2004年富士重工業（現SUBARU）入社後、画像認識分野を中心にアイサイトの研究開発に一貫して従事する。20年、AI開発拠点SUBARU Labの立ち上げを主導し同Lab副所長。画像認識分野における登録特許52件。

[画像のクリックで拡大表示]

　カメラやミリ波レーダーなどを利用した運転支援機能が多く商品化されています。SUBARUでは1999年に「レガシィランカスター」に採用した「ADA（アクティブ・ドライビング・アシスト）」が最初の商品で、「車間距離警報」「車線逸脱警報」「車間距離制御クルーズコントロール」「カーブ警報／制御」という4つの機能を搭載しました（図1）。2020年に発売した「レヴォーグ」や「アウトバック」では、高速道路のレーンチェンジ支援など多くの新機能をアイサイトに追加しています（図2）。

図1　ADAのステレオカメラ

レガシィランカスター（1999年）に採用（出所：SUBARU）

[画像のクリックで拡大表示]

図2　新世代アイサイトでさらに進化

2020年に発売したレヴォーグ（出所：SUBARU）

[画像のクリックで拡大表示]

　カメラを使った自動車機能の進化の歴史は、画像処理の進化の歴史ともいえます。00年ごろは画像センサー部の解像度が低く、モノクロのVGA（約30万画素）が一般的でした。最近はメガピクセル（100万画素）級が主流となり、カラー化も進み、多くの物体を検出できるカメラへと進化してきました。

　SUBARUの最新のアイサイトでは、約230万画素のRGGB撮像素子を使っています。最近ではディープラーニングを使った技術開発が主流となり、複雑な画像認識ができるようになってきました。

　SUBARUにおけるカメラの研究開発の歴史は長く、1989年から30年以上続いています（図3）。画像処理のロジックを内製しており、SUBARUのエンジニアがプログラムのソースコードを書いています。画像処理とクルマを一体となって開発しているのがSUBARUの特徴であり、エンジニアが世界中の道路で直面した珍しい場面などを自身で感じながら適合や改良を加えてノウハウを蓄積してきました。

図3　ステレオカメラの30年間の歴史

（出所：SUBARU）

[画像のクリックで拡大表示]

　本稿ではノウハウの蓄積であるアイサイトの画像処理ソフトウエアがどのように構成されているのか、将来どんな進化を目指しているのかを解説します。

最初の認識は物体にあらず

　アイサイトの画像処理は、ステレオカメラを用いることが特徴です。ステレオカメラとは、2つのカメラに映る物体の位置の違い（視差）から距離を測定できるもの。三角測量の基本的な原理に基づき、非常にシンプルな仕組みで測距できます。

　単眼カメラを用いた物体認識では一般に、クルマや人といった検出したい対象を探すアルゴリズムを構築します。一方でSUBARUのステレオカメラの場合、最初は物体ではなく路面を探します（図4）。

図4　距離だけを用いて「一般物体検出」を実行する

（出所：SUBARU）

[画像のクリックで拡大表示]

　ステレオカメラでは単眼カメラと異なり障害物までの距離情報を含んだ点群データが得られます。つまり最初に路面などの走行可能領域を3次元的に認識しておけば、走行可能領域内にある点群が即座に判別できることを意味します。

　そしてSUBARUは、走行可能空間内にあるすべての点群を障害物と認識します。車両や人だけを検出しようとする一般のアルゴリズムに対して、このほうがあらゆる障害物を認識できる可能性があると考えているからです。SUBARUではこのアルゴリズム構成を「General Object Detection（一般物体検出）」と呼んでいます。

　次に、一つひとつの物体の動きを算出します。先ほど抽出した道路上に存在する障害物候補に対して、どこからどこまでが一つの物体の塊なのかを判定し、それぞれがクルマや人、壁などのうち何であるのかをグルーピングします（図5）。

　物体の種類を特定した後、カメラの撮像フレーム間の動作量を計測し、各物体の速度に変換します。こうして物体の位置、サイズ、速度、種類を算出することで、車両を制御する必要がある対象物（ターゲット）かどうかを判定します。

図5　ターゲットの認識手順

近接する距離の物体をグループ化して一つの物体として検出し、時系列でみることで動きを算出する（出所：SUBARU）

[画像のクリックで拡大表示]

　ステレオカメラは、一般的な単眼カメラと同様に画像中の輝度パターンを用いた物体認識のロジックを併用できることも強みとなります。アイサイトでは、クルマや人、ブレーキランプ、タイヤといった特徴的な物体については距離情報だけに頼るのではなく、機械学習を用いた識別器を併用します（図6）。ステレオ認識と単眼認識、双方のいいとこ取りによりロバスト（頑健）な画像処理を実現します。

図6　パターン認識も実施

ステレオカメラによる「一般物体検出」とは別に、単眼カメラの情報から機械学習を用いた識別器も併用（出所：SUBARU）

[画像のクリックで拡大表示]

　ただし、現状のアルゴリズムでは判別できない対象が存在します。一例が、白線の存在しない道路。白線がない場合、走行領域の境界線となる路肩は縁石や草、砂利、側溝などあらゆるパターンが考えられます。すべてに対応したアルゴリズムの構築は極めて難しい。この難題にディープラーニングで解決を試みるのが最近のトレンドです（図7）。

　認識アルゴリズムにディープラーニングを採用することは、何かを「検出」するアルゴリズムから、恐らくこうだろうという「推論」のアルゴリズムに変わることを意味します。ディープラーニングでは大量の学習データを用いて、統計的にそれらしい確率を求めます。ターゲットに対応した明確なアルゴリズムがなくても、過去の学習データから何かしらの確率を算出できるのが特徴です。

　白線が全く見えない雪道を人間が初めて走る場合、過去に走った道路の経験を基に走れる経路が分かるイメージでしょうか。

図7　ディープラーニングによる認識例

（出所：SUBARU）

[画像のクリックで拡大表示]

　SUBARUが現在力を注いでいるのが、ステレオカメラとディープラーニングの融合です。ディープラーニングは学習に基づいた推論であるため、その性能は学習データで決まります。

　一方、ステレオカメラは道路環境のあらゆる物体を三次元的にとらえることができるため、過去のデータ量に左右されません。ステレオカメラの「実直」に測距できる強みと、ディープラーニングによる統計に基づいた推論を組み合わせることで、自動車の画像認識でブレークスルーを実現したいと考えています。

　SUBARUは自動車メーカーであるため自ら走行試験を行っており、学習用の走行データを大量に保有しています。20年12月にAI開発拠点SUBARU Labを東京・渋谷に新たに開設し、ステレオカメラとディープラーニングの融合に挑んでいます（図8）。

[画像のクリックで拡大表示]

図8　SUBARU Labの様子

LabのURLはhttps://recruiting-site.jp/s/subaru-lab/（出所：SUBARU）

[画像のクリックで拡大表示]

ディープラーニングを路肩の認識精度向上に

　ディープラーニングによる進化とは、本質的には「表現力」と「大局性」の向上と考えています。逆にいえば、従来の機械学習はディープラーニングと比べて「局所的」で「表現力」が低いものでした。

　局所的とは、認識対象を四角状に切り取った範囲の特徴的な情報だけを使って、あらかじめ人が設計したHOG（Histogram of Oriented Gradients：局所領域の輝度の勾配方向を角度ごとにヒストグラム化した特徴量）やHaar-like（局所領域の輝度の明暗差から求めた特徴量）などに基づいて認識することを意味します。

スケール差が課題、悩ましい受容野

この記事は有料会員限定です

Black Hat USA

AI Business

NTT系の次世代型データセンター案、冷却用電力半減と「迷惑施設」脱却をアピール

日経XTECH

トヨタ車体富士松工場、eve autoを導入構内運搬車をレベル4で自動運転化

日経XTECH

キオクシア、27年にAI向け100倍速SSD 「NVIDIAから要望」

日経XTECH

半導体チップ接続に光電融合、NVIDIA5年前倒しの採用に驚き

日経XTECH

アイサイトに深層学習、ステレオカメラどこまで進化スバル寄稿