本記事はロボットとAI技術の専門誌『日経Robotics』のデジタル版です

 様々な用途に機械学習を適用する際の第一のハードルは、学習データを十分用意できるかどうかである。大量のデータを揃えるのが難しいだけでなく、多くの項目から成るデータの場合は所々の項目で値が欠落した「歯抜け」の状態が生じがちだ。そうなると学習に使えなくなってしまう。

  こうした課題に対処できる技術を、東芝と統計数理研究所が共同で開発した。一部の項目が欠損したデータを使って回帰モデルを学習させる際、従来手法よりも高い精度を実現できる。

 開発した技術は、数十〜数万もの説明変数から、ある変数の値を予測する線形モデルの作成に使う。汎用性が高く、多様な用途で利用を見込める。

  東芝が想定する応用は、半導体工場などで製造工程から得られる各種のデータ(温度や圧力など)から製品の品質(半導体の電気的特性など)を予測する用途である(表1図1)。

この先は日経Robotics購読者限定です。