図●データ統合・分析共通PaaSの概要(出典:日本ユニシス)
[画像のクリックで拡大表示]

 日本ユニシスは2015年7月7日、ビッグデータ分析のためのソフトウエア一式を月額制のクラウドサービスとして提供する「データ統合・分析共通PaaS」()を発表、同日提供を開始した。DWH(データウエアハウス)構築用の並列RDBMS(リレーショナルデータベース管理システム)とHadoopを中核とし、さらにこれらを組み合わせて活用するデータ統合ソフトを提供する。ビッグデータ分析基盤を初期投資を抑えて導入できる。

 料金(税別)は、初期構築費用が100万円で、月額利用料が75万円から。PaaS自体の売上やデータを活用する業務アプリケーションの開発などで、今後3年間で50億円の販売を目指す。ソフトウエア一式を稼働させるIaaS基盤としてはAWS(Amazon Web Services)を利用している。今後、Microsoft Azure上でも提供する予定。

 大きく三つのソフトをクラウド型で提供する。(1)データを収集して加工/蓄積するエンジンとして、マップアール・テクノロジーズのHadoopディストリビューション「MapR」を提供。(2)データを統合したり分析したりするためのDWHエンジンとして、日本ヒューレット・パッカードの「HP Vertica Analytics Platform」(HP Vertica)を提供。(3)これらを組み合わせて活用するデータ統合ソフト「汎用データ処理ツール」は、日本ユニシスが自社開発した。

 汎用データ処理ツールを使うと、MapRとHP Verticaを用いて、各種データの収集、形式変換やクレンジング、マスターやテーブルの更新、データ分析結果をBIソフト参照、---といった、ビッグデータ分析/活用に必要な一連の作業を実施できる(表1)。この結果、データを収集/蓄積して分析する業務アプリケーションやBIシステムを容易に構築できるようになる。一方で、汎用データ処理ツールを使わない場合、同等の機能を実現するには、MapRとHP Verticaの機能を理解した上でJavaによるプログラミングが必要になる。

表1●汎用データ処理ツールのモジュール構成
モジュール名機能
データ取得ユーザー企業がアップロードした各種ファイルを取得し、MapRサーバーの所定フォルダーに転送する
データ加工「データ取得」で取得したファイルに対して形式加工を実施し、標準のCSV形式に変換する(区分コード設定、変更、データクレンジング処理を含む)
蓄積整形済ファイルをMapRサーバーに蓄積(バックアップ)する
データロード整形済ファイルを所定のHP Verticaテーブルに登録する
マスター更新マスター関連テーブルを連携するデータ内容で全件更新する
結合テーブル更新連携するデータ内容で統合テーブルを更新する
データ統合ひも付けた情報をもとにマスターデータとトランザクションデータを統合する
データ分析協調フィルタリングを実施する。購買履歴などをもとに、行動・購買が類似した他のユーザーの情報を用いて推論し、訴求の対象とする商品や顧客のリストを作成する