AI(人工知能)を使ったシステム構築の中核となるのが、機械学習を使ったモデルの構築だ。数え切れないアルゴリズムが登場する中、どのように適切なアルゴリズムを選ぶのか。構造化データに対するアルゴリズムについて説明する。

 ここでは、AIの「中身」ともいえるモデルを構築するためのアルゴリズムについて、どのような種類があり、何に生かせるのかということを説明していきます(図1)。

図1 今回の連載で取り上げる範囲
[画像のクリックで拡大表示]

 アルゴリズムの基礎知識について、じっくりと説明するのには訳があります。読者の皆さんは「手っ取り早く、AIを使ったシステム構築のポイントだけを知りたい」と思うかもしれません。ところがAIを使ったシステム構築には、以下のようなポイントを理解することが必要になります。

  • AIシステムの構築では、データの蓄積とそれに基づくアルゴリズムの定期的な「洗い替え(モデルマネジメント)」が重要になる。そのためには概念設計レベルで運用構想が必要となる
     
  • AIの活用にはデータが重要である。とはいえ、単なる蓄積用のデータと各アルゴリズムに学習させるためのデータセットは異なる。そこで、データセットのカラム定義時に「どれだけデータを増やせるか」がカギとなる
     
  • データ量だけがAIの精度に貢献するわけではない。「3V(Volume=量、Variety=種類、Velocity=更新頻度)」などの観点によるデータ品質評価や、「現在ないデータの定義」が推奨される

 これらのAIシステムの構築における重要なポイントは、通常の企業システム構築とは大きく異なります。AIに初めて触れる方にとって、具体的にイメージするのは、なかなか難しいものです。

 利用する要素技術についてある程度理解しておかなければ、システム設計を行うことは簡単ではありません。これは一般的な企業システムの開発と同様です。一般的な企業システムの場合、システム設計にはデータベースやセキュリティの技術、プログラミング言語の違いや制約などについてある程度の理解が必要です。

 同様に、AIを用いたシステムの設計においても、ある程度の要素技術の理解は必要なのです。そこでAIシステム構築の中心であるアルゴリズムについて、じっくりと理解することが重要になってきます。

 ここでは、正確さよりも分かりやすさを優先しました。そのため、一般的な機械学習技術などの説明とは細部で異なる部分があるかもしれません。正確な一方で難しすぎてわからない説明よりも、厳密な定義とは若干異なる部分があっても理解可能な説明を優先するという執筆方針で臨んでいることをご了承ください。

この先は有料会員の登録が必要です。今なら有料会員(月額プラン)が12月末まで無料!

日経 xTECHには有料記事(有料会員向けまたは定期購読者向け)、無料記事(登録会員向け)、フリー記事(誰でも閲覧可能)があります。有料記事でも、登録会員向け配信期間は登録会員への登録が必要な場合があります。有料会員と登録会員に関するFAQはこちら