本記事はロボットとAI技術の専門誌『日経Robotics』のデジタル版です

 機械学習ベースのシステムが、人手で設計したシステムの性能を凌駕してしまう。この動きがロボットをはじめとする各種機器の制御に広がろうとしている。横河電機と奈良先端科学技術大学院大学(NAIST)が研究対象に選んだのは化学プラントだ(図1)。

 両者はプラントにおける化学物質の生産量や品質などを大幅に改善し得る強化学習技術「FKDPP(factorial kernel dynamic policy programming)」を開発した1)

 教師なし学習の一種であり、実環境で数十回ほどの試行錯誤を実行すれば、自動的に適切な方策(policy)を得られる。

図1 酢酸ビニル製造プラントのシミュレータを対象に
横河電機とNAISTは、酢酸ビニルモノマ(VAM:vinyl acetate monomer)の製造プラントのシミュレータにFKDPPを適用して効果を調べた。図はシミュレータの構成で、今回は⑦と⑧の部分を制御の対象にした。横河電機の子会社であるオメガシミュレーションが同社のプラントシミュレータ「Visual Modeler」上で開発した。(図:オメガシミュレーション)
[画像のクリックで拡大表示]

 化学プラントでは、蒸留塔への蒸気の流量やタンクへ入る物質の温度など、多様なパラメータを設計段階で決める必要がある。

 従来は人間が実験などを繰り返したりすることで、こうしたプラント内のパラメータを決めていたが、原材料を変更した場合などは、再度、それらを検討し直す必要がある。

 強化学習技術を使えば、プラントの設計時や再変更などの作業を自動で最適化でき、開発期間の短縮も期待できる。ロボット向けを想定した技術を基にしており、今回の成果をロボットに応用できる可能性もある。

 現在はプラントのシミュレータの一部工程に適用して、効果の高さを確かめた段階である。今後は、制御対象をプラント全体に広げるとともに、顧客の実プラントでの実証実験も進め、5年程度をめどに順次実用化していく考えだ。

この先は日経Robotics購読者限定です。