日立製作所は2017年3月27日、防犯カメラなどが撮影した映像に深層学習(ディープラーニング)を適用して、人物を特定したり抽出したりできる技術を開発したと発表した。人物の性別や年齢層といった複数の特徴を同時に判定できるほか、「しゃがむ」「走る」「物を拾う」といった行動も識別できる。空港や駅といった大規模施設などでの警備や防犯用途の需要を狙い、2019年3月までに実用化を目指す。

日立が開発した技術では、「キョロキョロする」「物を拾う」などの動きも識別できる
[画像のクリックで拡大表示]

 開発した技術は、カメラが撮影した映像中の人物の特徴を判定可能だ。性別や年齢層、髪型、服装の種類、色、所持品など12種類の特徴について100項目以上の外見に関する特徴を判定できる。

 「従来も、複数の特徴をそれぞれ別々のニューラルネットで処理させる技術は開発されてきた。しかし、計算量が膨大だったため実用的ではなかった」。日立製作所システムイノベーションセンタ メディア研究部の村上智一 主任研究員はこう説明する。

日立製作所システムイノベーションセンタ メディア研究部の村上智一 主任研究員
[画像のクリックで拡大表示]

 日立が開発した技術は、これらの特徴を同時に判定するニューラルネットを使う。それぞれの特徴について別々に計算して判定するのではなく、「それぞれに共通する計算を先に済ませてから、性別や服装といった個別の計算を実行する」(村上氏)。同社が開発してきた、それぞれの特徴を別々のニューラルネットで計算する手法に比べて、計算量を約40分の1に削減できた。

 このほか、同一人物を映像中から抽出できる技術も開発した。人物の全身画像を解析して、顔画像だけで解析する場合に比べて、抽出の精度を高めた。

 開発した技術は、OSS(オープンソースソフトウエア)のフレームワークを使っているが名称は非公開。市販のカメラが撮影した映像にも適用できる。提供開始時にはソフトウエアとして販売される見通しだ。