日本でもGCP(Google Cloud Platform)の利用がユーザー企業に広まってきた。データウエアハウス「BigQuery」やAI(人工知能)など、データ分析関連サービスの支持は高い。Webアプリやモバイルアプリが手軽に作れるプログラム実行基盤「Google App Engine(GAE)」も企業に浸透している。リクルートテクノロジーズ、ブレインパッド、富士ゼロックスの事例からGCPのメリット、活用手法をひも解こう。

BigQueryの分析スピードは桁違い

 リクルートテクノロジーズでは、2015年夏から秋にかけてデータ解析用途でGCPの利用検討が始まった。従来のAWS(Amazon Web Service)に加えて、GCPのデータウエアハウス「BigQuery」を利用し始めた。

 AWSでは、仮想マシン「Amazon EC2」やストレージ「Amazon S3」、データウエアハウス「Amazon Redshift」などを利用。オンプレミス環境にあった分散処理ソフト「Hadoop」で構築した分析基盤を同様のAWSサービス「Amazon Elastic MapReduce(EMR)」に移行したうえで、「リクナビやカーセンサーといったサービスでデータ分析に使ってきた」(リクルートテクノロジーズ ITソリューション統括部 データテクノロジーラボ部の松田徹也氏)。

リクルートテクノロジーズ ITソリューション統括部 データテクノロジーラボ部の佐伯嘉康氏(左)、同 松田徹也氏
[画像のクリックで拡大表示]

 リクルートテクノロジーズではGCPのデータ分析性能を検証する目的でAWSと比較してみた。その結果、「GCPのほうが最大で数百倍速いという結果が出た」(リクルートテクノロジーズ ITソリューション統括部 データテクノロジーラボ部の佐伯嘉康氏)。分析環境は、AWSはRedshiftにクエリーサービス「Amazon Athena」を組み合わせた。GCPはBigQueryである。単純なデータ抽出処理や、データサイズが小さい検証パターンではAthenaのほうが速いケースもある。しかし「データサイズが大きくなるほどAthenaは大きく処理性能が低下し、BigQueryと差が開いた。ジョイン処理もBigQueryのほうが速かった」(同氏)。

 BigQueryは自動でスケールアウトして処理を実行し、データ量により課金される。「無邪気に使っているとコストがかさむ場合もあるので、上限設定を設けるなどの対処が必要」と、松田氏は注意点を話す。また厳格なセキュリティを求める企業システムでは、GCPのアクセス制御で物足りないケースもある。社内の特定端末からのみアクセス許可するように、リクルートテクノロジーズでは自社でクラウド管理機能を作成しGCPを使っている。

次ページ以降は日経 xTECH Active会員(無料)の方のみお読みいただけます。