機械学習(Machine Learning)を簡単にいえば、コンピューターに大量のデータを与えて法則性を学習させ、新しいデータに対して正しく予測・推測するルールを獲得することである。出来上がったデータ処理ルールは、学習済みの機械学習モデル(学習済みモデル)であり、いわゆるAIである。

 一般に機械学習のクラウドサービスには、大きく分けて三つの種類がある。

 一つめは「学習済みモデル」のサービス。典型的な用途に限定されるが、利用者は自前で学習データを用意する必要も学習させる必要もなく、すぐに使うことができる。

 二つめは、利用者独自の機械学習モデルを開発する、「カスタムモデル作成」のサービスである。利用者は自前で学習データを用意し学習させる必要があるが、自社の用途に合わせた機械学習モデルを作成できる。

 これら「学習済みモデル」と「カスタムモデル作成」の中間的な存在が三つめだ。クラウド事業者が提供する学習済みモデルに対して、利用者の自前のデータを追加学習させて、カスタムモデルを作成する。いわば「追加学習型モデル作成」である。ベースとなる学習済みモデルによって用途や精度が制限されるが、利用者が一からカスタムモデルを作るより学習データがケタ違いに少なくて済み、学習処理が簡単になる。

 GCPでは、これら「学習済みモデル」「カスタムモデル作成」「追加学習型モデル作成」という三つの種類の機械学習サービスを全て提供している(図1)。

図1 GCPの機械学習サービス
[画像のクリックで拡大表示]

 米Googleはインターネット検索やメールなど様々なネットサービスを通じて機械学習に使える大量のデータを日々得ている。これが、学習済みモデルのサービス、追加学習型モデル作成のサービスでの優位点になっていると考えられる。

 今回は、GCPの学習済みモデルのサービスについて見ていこう。カスタムモデル作成、追加学習型モデル作成のサービスについては、次回以降に取り上げる。

六つの学習済みモデル

 GCPで提供されている学習済みモデルは六つあり、扱うデータの種類によって「言語処理」「音声処理」「視覚処理」の三つに分けられる。

 言語処理のモデルは、自然言語のテキストの構造と意味を解析する「Cloud Natural Language API」、自然言語のテキストを異なる言語に翻訳する「Cloud Translation API」。音声処理のモデルは、音声をテキストに変換する「Cloud Speech-to-Text API」、テキストを読み上げる「Cloud Text-to-Speech API」。視覚処理のモデルは、画像を解析して情報の抽出や分類を行う「Cloud Vision API」、動画を解析して情報を抽出し検索できるようにする「Cloud Video Intelligence API」である。

 いずれもREST APIを通じて利用するため、サービス名の末尾にAPIが付く。

 以下で、これらの学習済みモデルを一つずつ説明していく。

この先は有料会員の登録が必要です。有料会員(月額プラン)は初月無料!

日経 xTECHには有料記事(有料会員向けまたは定期購読者向け)、無料記事(登録会員向け)、フリー記事(誰でも閲覧可能)があります。有料記事でも、登録会員向け配信期間は登録会員への登録が必要な場合があります。有料会員と登録会員に関するFAQはこちら