ITpro Special ITpro

戦略的情報活用最前線 後編 インフォメーション・オンデマンドの両輪をなすコア・テクノロジー「データ連携技術」と「マスターデータ管理技術」

IBMが提唱するインフォメーション・オンデマンド(IOD)とは,企業に散在するデータを特定アプリケーションの軛(くびき)から解き放ち,企業変革に欠かせないイノベーションの源泉となる『情報統合』を推進する戦略だ。IODは,データ連携技術(物理統合・仮想統合)とマスターデータ管理技術の2つの柱からなる。これらのテクノロジーを実装したIBMのソリューションの特徴と合わせて紹介しよう。

バッチローディングの並列処理によりデータの物理統合を効率化
―「IBM WebSphere DataDtage Enterprise Edition」―

各拠点・部門に分散する基幹システム(オペレーショナル・システム)のデータをデータウエアハウス(以下,DWH)に物理的に集約・統合するためには,ETLツールを活用したバッチローディングが必要である。

「ところが,組織内において急増するデータが,バッチ・システムの処理能力を大幅に上回るようになっています。スピード経営への移行を阻むだけでなく,ビジネスの継続性の観点からも憂慮すべき事態です」と,日本IBMの森英人氏は警告を発する。

DWHへのバッチ処理は一般に,ソースデータのTransform,Enrich(Clean),Loadという手順を踏んで行われる。各プロセスにおいてその都度,アプリケーションはディスクにアクセスし,データの読み込み・書き込みを行うフローである。しかしながら,データが今と比較して少量であった時代から続くこの方式は,膨大なデータが流通する今日の情報活用の実態に追従できなくなりつつある。

SOAの実装においてユーザーが陥りやすい失敗として,森氏は,「SOAにおけるインフォメーションが特定のプロセス内でのみ検討されてしまうこと」を挙げる。例えば,前述の受発注システムにおいてアプリケーションのサービス化を実現したとして,そのサービスが従来から扱っているデータベースに格納された受発注データのみにしかアクセスでないとしたら,他の部門や会社の受発注プロセスから呼び出して利用することができず,そのサービスの再利用性が下がるという。「企業においてインフォメーションを活用する基盤,すなわちIODがなければ,SOAへの投資は無駄に終わる恐れがあるでしょう」(森氏)。またSOAの導入がまだ先の企業にとっても「IT投資に対する最も期待される効果はインフォメーションの活用である」ことからIOD環境の実現は重要な意味があると強調する。「IBM WebSphere DataStage Enterprise Edition」(以下,DataStage)は,バッチローディングにおけるジョブを適切に分割して,短時間で処理を完了させるパーティション化機能,データベース並列インターフェース,スケーラブルなハードウエア環境に対応する並列処理機能などを備えている。

ETLの処理において,ジョブを並列化するメリットは大きい。理由はもちろん,バッチ処理時間の短縮である。DataStageを活用することで,例えば深夜0時~翌朝6時のバッチ処理が数十分程度に短くなった実例が存在する。この企業では,翌日の業務に支障を来たさず余裕を持って処理できるようになることでビジネス継続性は格段に高められた。

それだけではない。新しいビジネスモデルやサービスなど,イノベーションを企業にもたらす。そのひとつが,24時間365日運営されるECサイトの立ち上げだ。バッチ処理時間がきわめて短くなることで,ほぼノンストップで世界中にサービスを提供することができる。

ほかにも「ジョブの並列化はバッチローディングに用いられるハードウエア環境やシステム投資の考え方にも再考を促しています」と森氏は指摘する。ハイエンドのSMP(Symmetric Multi Processor)システムから,よりリーズナブルなMPP(Massively Parallel Processing)やクラスターシステムへの移行に道を拓くことになるという。DataStageはあらかじめジョブのパーティショニングを行い,処理をパイプライン化する。分割されたデータは複数のプロセッサ上で実行され,4個のプロセッサを使えるならば1個の場合と比べて4倍のスピードで,100個あれば100倍のスピードで処理できる。つまり,ジョブを分割して複数のCPUに割り当てることで時間やリソースを効率的に使える。

「パイプライン処理には多数のメモリなどが必要であり,これが初期投資や運用管理上の課題でしたが,近年では高性能なブレードサーバが入手しやすくなっています」と森氏。従来のように,わざわざ高価な64ビットのSMPサーバを選ぶ必要はなくなりつつある。

DB2などのパラレルデータベース製品も拡充されており,業容の変化・拡大にスケーラブルに対応できる並列化されたバッチローディング環境は,スピード経営を考えるうえで本命視されている。

■Building Scalable Software: Runtime Execution

Building Scalable Software: Runtime Execution

※画像をクリックすると拡大します

仮想テーブルを介してデータソースを統合し,シングルビューを提供
―「IBM WebSphere Federation Server」―

物理統合に加えて,データ連携技術におけるもうひとつの柱が仮想統合である。拠点や部門を越えた情報活用が求められる中で,分散した異なる種類のデータソースに透過的かつリアルタイムにアクセスする重要性は企業内においてますます高まっている。

通常,バックエンドのデータソースにOracleやSQLサーバが混在する環境で,ユーザーが各データにアクセスしようとする場合,個別のシステムやアプリケーションを介して別々に接続するか,あるいはSystem iのようなフロントシステムの実体テーブルにバックエンドのデータを入出力する,中間ファイルの生成用プログラムを開発するのが一般的だ。しかし,このやり方ではバックエンドに新たなデータベースサーバが追加されるたびにユーザー側のビューが複雑化するか,中間ファイル作成用の新規プログラム開発が発生することになる。

これに対応したソリューションが「IBM WebSphere Federation Server」(以下,Federation Server)である。バックエンドのデータソース群とユーザーアプリケーションの間に,DB2上で稼動するFederation Serverを導入する。そして,内部の仮想テーブルを介してデータをやり取りすることでデータソースの差異を吸収。ユーザー側におけるシングルビューを確保する。

従来方式との大きな違いは,System iなどのフロントシステムを,「DB2クライアント」と見なし,またFederation ServerをバックエンドのOracleサーバやSQLサーバからは「Oracleクライアント」や「SQLクライアント」のように見なして扱う点だ。DB2はデータのマッピングや物理的なコネクション変換機能を担っている。この結果,新たにデータベースをバックエンドに追加しても,DB2を新たに追加したDBサーバのクライアントDBとして認識させるだけでよい。

「各データソースのクライアントライブラリーや設定は必要ですが,新たにプログラム開発することに比べれば,その導入は至ってシンプル」と森氏は述べる。サポートデータソースも非リレーショナル・データソースからXMLなどの構造化(半構造化)データ,ライフサイエンス系データなど,ほぼ制約がない。

仮想テーブルを使うことにともなう処理パフォーマンスの低下も抑えた。その中核として機能するのが,「Global Optimizer」である。最も効率的なアクセス・パスをFederation Server内部にビットマップ・インデックスなどの形式で保持しており,検索時のパフォーマンスなどを劣化させないのである。

また,Federation Serverでは,リアルタイムの参照・更新のほか,2フェーズコミットによる更新にも対応。複数のデータソースの更新時にひとつでも失敗した場合は,すべてロールバックを行って整合性を確保する。「基幹システムなど,トランザクションシステムにおいても採用実績を伸ばしています」と森氏は話す。

■フェデレーション・アーキテクチャー(リレーショナル・ラッパー)

フェデレーション・アーキテクチャー(リレーショナル・ラッパー)

※画像をクリックすると拡大します

時間の経過とともに散乱する顧客情報をマスターデータベースに統合
―「IBM WebSphere Customer Center」―

データ連携技術と並ぶ,IODにおけるもうひとつの軸がマスターデータ管理技術である。物理統合と仮想統合が地理的・空間的に分散した情報を統合するための技術とすれば,マスターデータ管理技術は時間の経過とともに散乱していく情報を統合するためのテクノロジーに位置づけられる。

具体的には,業務システムごとに個別管理されているマスターデータを一元的に統合し,整合性が確保されたマスターデータベースで管理する。「マスターデータベースとは,データを集めることが目的ではなく,あらゆるデータの整合性をとることにポイントがあります」と森氏も述べる。

日本IBMでは,顧客データを統合するためのソリューションとして,「IBM WebSphere Customer Center」(以下,WCC)を提供している。顧客の名前,住所,電話番号などに,年齢や勤務先などの個人情報および,家族関係などの多角的なリレーションシップ情報を柔軟かつデータベース横断的に紐付けることができる。

しかもWCCは,先進的なベストプラクティスに基づく顧客データモデルを持っており,業務に適した必要十分な項目を抽出することが可能だ。それを活用することで,営業活動を支援するだけでなく,不正取引の抑止など各種リスク管理やコンプライアンス対応にも生かせる。

すでに先行導入している米国の銀行では,全米1700店舗における顧客情報をWCCで統合。顧客マスターにはメッセージングハブを介してダイレクトにアクセスし,コールセンターで蓄積された情報など大量データについてはETLツールによるバッチ処理で更新している。システム導入の結果,コールセンター業務およびリスク管理の改善,クロスセリングに効果をあげ,顧客満足度の向上や金融サービスにおける競争力の強化を達成している。

マスターデータベースの構築において顧客データの統合は,最も端的に導入成果の現れやすい領域でもある。今後,日本でも導入が加速しそうだ。

物理・仮想統合からなるデータ連携技術と,マスターデータ管理技術を両輪とするIODは,SOA構築の必要条件であるとともに,企業内に散在するデータをイノベーションを生み出す情報資産に変える実効性ある経営手法といえる。

「ダイナミックに変化し続ける経営環境や情報活用の中で変革を遂げるにはどうすればよいか――」。その鍵を求める企業の問いに対して日本IBMが自信を持って示す回答である。

■お客様事例:米国金融業B銀行

お客様事例:米国金融業B銀行

※画像をクリックすると拡大します

bunner

お問い合わせ先 日本アイ・ビー・エム株式会社
IOD推進部
SALESASC@jp.ibm.com

▲ このページのトップへ戻る

ITproについて会員登録・メールマガジン購読ITproプレミアム(有料サービス)MyITproについてITpro Researchについて
ITproへのお問い合わせ・ご意見日経BP書店日経BPケータイメニュー広告について
著作権リンクについて|個人情報保護方針/ネットにおける情報収集/個人情報の共同利用についてサイトマップ

日経BP社Copyright (C) 1995-2010 Nikkei Business Publications, Inc. All rights reserved.
このページに掲載されている記事・写真・図表などの無断転載を禁じます。著作権は日経BP社,またはその情報提供者に帰属します。
掲載している情報は,記事執筆時点のものです。