人の実績データに頼らずに自己競争により学習を行うビジネス向けAI技術を開発

サプライチェーンの発注問題において在庫や欠品による損失を人の判断の1/4にできることを確認

 

 株式会社日立製作所(執行役社長兼CEO:東原 敏昭/以下、日立)は、複数のAI(Artificial Intelligence:人工知能)を相互接続したAI群でビジネスを表現し、AI群同士がコンピューター上で自己競争を行うことで、人が用意した実績データに頼らずに学習を行うビジネス向けのAI技術を開発しました。サプライチェーン上の複数の企業によるビジネスを模擬した「ビールゲーム」に本AI技術を適用したところ、人の経験に基づいた判断と比べて、在庫や欠品による損失を約1/4に低減できることを確認しました。すでに囲碁などの対戦型ゲームでは、自己競争によるAIの学習の有効性が示されていましたが、今回、不確定要素の多いビジネスの問題についても、自己競争を活用した学習が有効であることを示すことができました。

 通常、ディープラーニングなどを用いたAIは、大量の実績データから学習することで予測や判断を行います。そのため、大量のデータが入手できない場合には、正確な予測や判断が難しくなるという課題がありました。囲碁などの対戦型ゲームにおいては、AIが自己競争によって自ら生成した大量のデータを用いて学習することで賢くなることが確認されていますが、不確定要素の多いビジネスの問題に適用できるかは不明でした(*1)。

 今回、日立は、ビジネスの問題に適用可能な、自己競争を活用して学習するAI技術を開発しました。今回開発したAI技術では、ビジネスに関わる企業を、ディープラーニングを用いたAIエージェントで表し、複数のAIエージェントを相互接続したAI群でビジネスを表現します。各AIエージェントは、置かれた状況を考慮して、お互いにモノや情報のやりとりを繰り返すことで、損失低減などの与えられたアウトカム(*2)の向上に有効なアクションを学習します。学習を行う際には、AI群をコンピューター上に複数生成し、同時並行で学習を実行します。そして、それぞれのAI群の全体のアウトカムを競わせる「自己競争」を何千回と繰り返すことで、より良いアウトカムを追求します(図1)。

 ※図1は添付の関連資料を参照

 ※以下は添付リリースを参照

以上

 

 リリース本文中の「関連資料」は、こちらのURLからご覧ください。

図1

http://release.nikkei.co.jp/attach_file/0467211_01.JPG

添付リリース

http://release.nikkei.co.jp/attach_file/0467211_02.pdf