TOPマネジメント > データレイクとは?データウエアハウスとの違いやデメリットは(...

マネジメント

データレイクとは?データウエアハウスとの違いやデメリットは(下)

2018/10/19

Andy Patrizio InfoWorld

 ビッグデータに関する話題を追っている人は、「データレイク」という言葉を聞いたことがあるはずだ。レイク(湖)という響きから連想されるイメージのとおり、いわばデータをため込んでおく大きな貯水池のようなものである。

前回から続く)

 このほか、データレイク関連の商用製品は、次のような団体やベンダーが扱っている。

  • Apache Software Foundation:データレイクやアナリティクスでデータルーティングや変換に使うオープンソースのツールとして「Apache NiFi」がある。これを利用した商用版の製品は、Hortonworksから「DataFlow」の名で出ている。

  • Cambridge Semantics:「Anzo Smart Data Lake」を手がけている。企業のデータに構築するセマンティックレイヤーを活用して、オンデマンドの準備と分析や、グラフのモデルを利用したデータ分析のビジュアルな表示などを可能にする。

  • 日立ヴァンタラ:データレイクという言葉を最初に提起した米Pentahoは、現在は日立ヴァンタラの傘下に入っている。データレイクに限らずデータ統合ツールとして知られる「Pentaho」は、Hadoop、Spark、Kafka、NoSQLとの統合が可能で、セキュリティ、ガバナンス、連携、データ変換に対応する。

  • Trifacta:同社の「Wrangler」は、AIや機械学習アルゴリズムを活用して、自動化されたシンプルなデータ処理や、アナリストあるいはビジネスユーザーとの連携を実現する。個別のデータセットや複数のワークフローに関して、データ変換手順の流れを視覚的に追跡して提示する。

  • Zaloni:データレイクプラットフォーム「Zaloni Data Platform」を提供している。クラウドとオンプレミスの展開をサポートし、管理プラットフォーム、データカタログ、データガバナンス、セルフサービスのデータ準備ツールを備え、エンドツーエンドの処理をカバーする。

↑ページ先頭へ