「問題を解決するために、統計やソフトウエア開発・プログラミング、ビジネス問題解決、ソフトウエアツールの活用などの知識やスキルを統合活用する。これがデータサイエンティストに関する古典的な定義だ。だが、非常に大切なのに無視されがちな役割がある」。

 こう指摘するのは、データサイエンティストのセルゲイ・ユルゲンソン(Sergey Yurgenson)氏である。機械学習自動化ツールを提供する米データロボット(DataRobot)のアドバンスドデータサイエンスサービス ディレクターとして、顧客の問題解決を手掛ける傍ら、後進の指導を務めている。

米データロボットでアドバンスドデータサイエンスサービス ディレクターを務めるセルゲイ・ユルゲンソン氏
[画像のクリックで拡大表示]

 データサイエンティストは世界中に数えきれないほど存在する。データサイエンス/機械学習関連のコンペティションとして知られる「Kaggle」には11万2607人が登録されている(2019年6月14日時点)。どのような人材までをデータサイエンティストと呼ぶかにもよるが(AI人材やデジタル人材との違いも曖昧になりつつある)、少なく見積もっても世界にKaggle登録者の数十倍はいるとみられる。

 ユルゲンソン氏は、中でも世界屈指の存在と言える。元世界ランキング1位であり、最高位のGrandmasterの称号を持つ。現在も11万2607人中、409位に付けている。

 そんな元世界チャンピオンが挙げる、データサイエンティストの無視されがちな役割とは何か。同氏は「翻訳(トランスレーション)だ」と表現する。

現場の専門家との対話を重視

 ユルゲンソン氏が指摘する翻訳とは「ビジネス側の人たちと話をして、ビジネス上の課題をデータサイエンスの課題に置き換える」ことを指す。「これこそデータサイエンティストが果たすべき最も大切な仕事だと考えている」と同氏は強調する。

 データサイエンティストとして現場でどのように翻訳を進めるか、同氏はいくつか例を挙げて説明してくれた。例えば、手元にあるデータの質や量に問題があり、「そんなデータ、とても使えない」と頭を抱えてしまう場合。「日本に限らず、そうしたケースは珍しくない。センサーで得たシグナルが微小で、統計の知識だけでは解けないような場合がそうだ。データを入手できたとしても、それが顧客がいま抱えている課題の解決にはつながらない場合も多い」(ユルゲンソン氏)。

 そうした場合、ユルゲンソン氏は発想を変えてみるという。「今あるデータを、いま提示されている課題ではなく、ビジネス側の人に役立つ別の問題解決に使えないかと考えてみる」(同)。

この先は会員の登録が必要です。有料会員(月額プラン)は初月無料!

日経 xTECHには有料記事(有料会員向けまたは定期購読者向け)、無料記事(登録会員向け)、フリー記事(誰でも閲覧可能)があります。有料記事でも、登録会員向け配信期間は登録会員への登録が必要な場合があります。有料会員と登録会員に関するFAQはこちら