IoT(インターネット・オブ・シングズ)機器からデータを収集し、AI(人工知能)で分析する――。企業がデジタルトランスフォーメーション(DX)に取り組むなか、こうしたデータの利活用が進んでいる。

 厄介なのはデータ分析の「前処理」にかかる時間がばかにならないことだ。多種多様なIoT機器から送られてくるデータはフォーマットも様々でそのまま分析に使えない。結果的に分析の「前」にデータの欠損を補ったり、フォーマットをそろえたりする「データクレンジング」処理が必要となっている。

 「データサイエンティストが前処理に費やす時間は分析作業全体の8割といわれている」。日立製作所の足達直アプリケーションサービス事業部サービスソリューション本部デジタルソリューション推進部主任技師は困った現状をこう説明する。

使えば使うほど賢くなる

 こうしたなか、日立製作所はデータクレンジング処理の効率を高め、データサイエンティストが本来の分析業務に注力できるようにするWebサービスを開発した。2019年10月2日に提供を始めた、データ前処理の新サービス「Data Preparation Service」である。

 データクレンジングに関する製品・サービスは他社も提供している。日立の新サービスが差異化できるポイントについて、足達主任技師は「AI」を挙げる。「データの特徴や関連性をAIで分析している。統合時に統合できるカラムなどを画面に表示することで、目的のデータを素早く用意できるようになる」(足達主任技師)。

 具体的にはData Preparation Serviceが搭載するデータプロファイルと呼ばれる機能だ。AIがデータの特徴や傾向を解析し、その結果を表示したGUI画面上で不要なデータを取り除いたりフォーマットを統一したりできるようにする機能である。数値データから速度や緯度経度といった項目名を推定することも可能だ。

不要なデータなどを可視化するデータプロファイル機能
(出所:日立製作所)
[画像のクリックで拡大表示]

この先は有料会員の登録が必要です。今なら有料会員(月額プラン)が12月末まで無料!

日経 xTECHには有料記事(有料会員向けまたは定期購読者向け)、無料記事(登録会員向け)、フリー記事(誰でも閲覧可能)があります。有料記事でも、登録会員向け配信期間は登録会員への登録が必要な場合があります。有料会員と登録会員に関するFAQはこちら