ここまで来た、「超ビッグデータ」で予見医療

ImPACTプログラムの進捗、シンポジウムで公開

2017/07/05 09:30
大下 淳一=日経デジタルヘルス

 個人の生体情報やレセプトなどの公的医療データをこれまでとはケタ違いの規模で収集・解析し、その時系列の変化や地域性を明らかにすることで、予見・先取型で持続可能な医療を実現する――。そんな目標を掲げ、2016年度に始まった国家プロジェクトの具体的な成果が見えてきた。日常の生体・環境情報をIoT(Internet of Things)の仕組みで収集し、クラウドで高速に解析する基盤が整いつつあり、地域における患者の分布や受療行動、薬剤処方傾向などを可視化できる効果も分かってきた。

パネルディスカッションの様子
クリックすると拡大した画像が開きます

 このプロジェクトは、内閣府のImPACTプログラム(革新的研究開発推進プログラム)に採択された「社会リスクを低減する超ビッグデータプラットフォーム」。2016年4月の本格始動からの約1年間の成果が、内閣府と科学技術振興機構(JST)が2017年6月30日に開催した「2017年度シンポジウム」で披露された(関連記事1)。

 同プロジェクトは2016~2018年度の3年間を実施期間とする。これまで収集・解析の対象とされてきたビッグデータをはるかにしのぐ「非連続な量のデータを、非連続なスピードで収集・解析・処理できるプラットフォームを構築する。そのうえでこれを、医療とものづくりの社会問題の解決に生かす」(プログラム・マネージャーを務める京都大学 工学部 教授の原田博司氏)。具体的には、ストレージアクセス速度が従来比10万倍のビッグデータ処理基盤などを開発することで、医療や製造の分野で発生する数百億レコード規模のデータを数分以内に処理できるようにする。

 今回のプロジェクトの大きな特徴は、データの時系列での収集・解析に力を入れること。「世の中にはさまざまなビッグデータがあるが、時系列に並んでいるものは少ない。時系列化されたデータを複数連携させ、新たな価値創造につなげているデータベースも少ない」(原田氏)。

京都大学の原田博司氏
クリックすると拡大した画像が開きます

 そこで今回は、例えば医療分野であれば、レセプトやDPC(包括医療費支払い制度)データなどの公的医療データ(マクロデータ)と、個人の生体情報を連続計測したデータ(ミクロデータ)の両方に関して、時系列での収集・解析を行う。これを通じ、病気の発症や進行を個々人レベルで予測可能とすることで、健康寿命の延伸や医療費の削減につなげる。地方自治体や国の「政策にも使えるような情報基盤を確立する」(原田氏)ことが大きな目標だ。

 こうした目標に沿い、4つの開発プロジェクトを並行して進める。データ収集・解析基盤を構成する「超ビッグデータ創出ドライバ(プロジェクトリーダー:京都大学の原田博司氏)」と「超ビッグデータ処理エンジン(同:東京大学 生産技術研究所 教授の喜連川優氏)」、およびその出口となる「ヘルスセキュリティ(同:自治医科大学 学長の永井良三氏)」と「ファクトリセキュリティ(同:三菱電機 情報技術総合研究所 統轄の早川孝之氏)」だ。6月30日のシンポジウムでは、各プロジェクトの担当者がこれまでの開発の進捗を紹介した。

感染症の流行マップを10分で

 まずは「超ビッグデータ創出ドライバ」について、プロジェクトリーダーの原田氏が説明した。このプロジェクトでは、ビッグデータの収集を担うネットワーク基盤を開発し、数~数十kmの範囲に存在する数万台規模のモニター/センサーが生み出すデータを収集できるようにする。

血圧計の計測データを伝送するIoTゲートウェイのデモを披露
クリックすると拡大した画像が開きます

 数kmエリアまでの「狭域系」ではWi-SUN(Wireless Smart Utility Network)方式、数十kmをカバーする「広域系」ではWi-RAN(Wireless Regional Area Network)方式を採用する考え。前者を京都大学とローム、後者を京都大学と日立国際電気が中心となって開発している。

 このうち狭域系では、Bluetooth Low Energy(BLE)による無線通信機能を搭載した血圧計などで測ったデータを「広域につなぐ接続が重要になる。狭域と広域、超狭域と狭域をブリッジする技術を開発する」(原田氏)。開発成果の一端として紹介したのが、Wi-SUN FAN(Field Area Network)を搭載した小型IoTゲートウェイ。BLE搭載機器などで収集した情報を、マルチホップによる多段中継で伝送する仕組みだ。

 超ビッグデータ創出ドライバでは、こうしたデータ収集の仕組みをパブリッククラウドにソフトウエア(OS)として実装できるようにする。既に「AWS(Amazon Web Services)上にOSに相当するプラットフォームを構築している」(原田氏)ところだという。このプラットフォームに、モバイル端末などからアクセスできる環境を整えていく。

東京大学の喜連川優氏
クリックすると拡大した画像が開きます

 「超ビッグデータ処理エンジン」については、プロジェクトリーダーの喜連川氏が、非順序型の実行原理を備え、必要な時に必要なデータ処理リソースを投入できる「エラスティック(伸縮可能)非順序型」の処理エンジンへの取り組みを紹介した。ストレージアクセス速度は、従来比4万倍に当たる約400万回/秒を達成し、目標とする1000万回/秒(従来比10万倍)に近づきつつあるという。

 こうした進化により、「手足口病やインフルエンザの流行の季節変動を、10分くらいで算出できる」(喜連川氏)データ処理基盤が整ってきた。2017年秋には、約2000億レコードに相当する6年分の公的医療データも解析可能になる見通しという。

カテ治療や抗菌薬処方の実態が明らかに

 プロジェクトの2つの出口のうち、ヘルスセキュリティでは大きく2つのテーマに取り組む。第1に、医療提供の需給バランスや経済性を分析し予測する「医療介護・社会リスクシミュレーター」を開発する。解析対象はレセプトやDPCデータなどの公的医療データで、いわゆるマクロ系の解析だ。自治医大と産業医科大学、東京大学、医療経済研究機構が中心となって取り組む。

 第2に、心臓病を中心とする重篤な疾患について、その予見や重症化予防を可能にする「心臓関連疾患リスクシミュレーター」を開発する。解析対象は家庭用医療機器やセンサー端末から集まる生体・環境計測データ、さらには院内の検査・治療情報や電子カルテなどで、ミクロ系の解析に当たる。自治医大が中心となって取り組む。

自治医大の永井良三氏
クリックすると拡大した画像が開きます

 このプロジェクトについては、プロジェクトリーダーを務める自治医大の永井氏が全体の概要を説明。続いて、心臓関連疾患リスクシミュレーターへの取り組みを自治医大 教授の苅尾七臣氏が紹介し、医療介護・社会リスクシミュレーターへの取り組みを医療経済研究機構 研究副部長の満武巨裕氏と東京大学教授の橋本英樹氏がそれぞれ紹介した。

 自治医大の永井氏は、これからの医療では疾患の発症を「これまでよりも個別・層別化して予見することが求められる。そのためにはデータが重要になる」とプロジェクトの狙いを説明した。高額な医療費が話題となったがん治療薬(免疫チェックポイント阻害剤)を引き合いに、医療をめぐる「社会保障システムも病気になる」(永井氏)と指摘。現場目線で個々の患者に最適な医療を提供するだけでなく、持続可能な医療提供体制や保険制度を模索する取り組みでもあることを強調した。

 自治医大では今回のプロジェクトに先駆けて、虚血性心疾患などに対するカテーテル検査・治療の適正化を目的とするデータベース構築を進めてきた。自治医大と東京大学、九州大学、東北大学がデータシェアリングで協力。心臓カテーテル検査レポートの標準データベース「CAIRS-DB」、およびこれと連携する多目的臨床データ登録システム「MCDRS」を開発した。

 これにより、450種類もの項目を通じて心臓病のハイリスク者を可視化・層別化する情報基盤ができた。参加5施設の合計で年間2000症例ほどの心臓カテーテル治療が行われていることから、同治療について2000症例/年×450項目という「世界的にも大きなデータベース」(永井氏)を扱えることになる。多施設のカテーテル治療を一括で分析することで、使用するステントの種類の施設間の違いなどが分かるようになった。

 このほか永井氏は医療介護・社会リスクシミュレーターの開発の一環として自治医大が取り組んでいる、熊本県におけるレセプトデータの分析結果を紹介した。抗菌薬の処方データの分析では、同県において第3世代セフェムと呼ばれるタイプの抗菌薬が高頻度に処方されていることが分かった。第3世代セフェムは、さまざまなタイプの菌に効くものの抗菌力が弱く、耐性菌をつくってしまう恐れがあるとされる。こうした薬剤が「大量に、しかも子供達にも使われている」(永井氏)という実態が明らかになった。

「住宅まるごと」リアルタイムで評価

 続いて登壇した自治医大の苅尾氏は、家庭用医療機器やセンサー端末から集まる生体・環境計測データに基づく心臓関連疾患リスクシミュレーターへの取り組みを紹介した。開発の狙いは、個々人の生体情報や環境情報を時系列で収集・分析することで「脳卒中や心筋梗塞、大動脈解離といった循環器のイベント(重大事象)を予測する」(苅尾氏)ことにある。

 循環器のイベントは「一日にしてはならず、だが不連続で起こる」(苅尾氏)という特徴がある。これまでも、ある基礎疾患を持つ場合などにこうしたイベントの発生確率がどれくらい高まるかを、統計的に算出することはできた。ただし「個々人に対して、いつどこでイベントを起こすかを予測するようなデータは皆無だった」(同氏)。

自治医大の苅尾七臣氏
クリックすると拡大した画像が開きます

 今回の開発では、イベントの発生を個々人に対して時間や場所を含めて予測するバイオマーカーとして、血圧に着目。血圧の時系列の変化を解析することで、イベント発生のトリガー要因を明らかにすることを目指す。ここに向けて、24時間血圧や脈波といった生体情報に加え、気温や気圧などの環境情報も同時に収集。「住環境と循環器リスクのビッグデータを、住宅まるごとリアルタイムで評価する」(苅尾氏)という方法を取る。

 これに対応する環境センシング機能付きの血圧計を自治医大とエー・アンド・デイ(A&D)が共同開発(関連記事2)。血圧の日内・日間変動を解析したり、気温や気圧、活動量に対する血圧の感受性を調べたりすることで「新たなデバイスととともに(新たな)疾患概念を作ろうとしている」(苅尾氏)。こうした研究を全国の自治医大の関連医療機関でネットワーク化して進め、「全国どの地域にいてもイベント・ゼロ」(同氏)の実現を目指すとした。

「急性期医療のニーズが高まる」と予測

医療経済研究機構の満武巨裕氏
クリックすると拡大した画像が開きます

 医療経済研究機構の満武氏は、NDB(レセプト情報・特定健診等情報データベース)や三重県の医療・介護データを用いて、地域ごとの医療の需給バランスを可視化したり、医療費・介護費を推計したりするモデルを開発中。その成果を「自治体などにツールとして提供していく」(満武氏)。

 三重県に関する分析では、さまざまな疾患の地域別の有病率や、受療行動などが明らかになってきた。満武氏と共同研究を行っている東京大学の喜連川氏が紹介したデータによれば、大きな医療機関の少ない三重県南部の患者は、かなり離れた場所にある医療機関まで通院している傾向があることが分かってきた。糖尿病の非患者群が時間の経過とともにどのように罹患・重症化していくかといった、疾患の時系列の推移も可視化できるようになった。

 死亡前半年間の医療費・介護費に関する分析も成果の一つ。ターミナル・看取加算ありとなしの群における、医療費・介護費の傾向の違いなどが明らかになってきた。

東京大学の橋本英樹氏
クリックすると拡大した画像が開きます

 最後に登壇した東京大学の橋本氏は、がんや心臓病、糖尿病などの患者数の将来推計や死亡移行推計に基づく、医療・介護ニーズ予測モデルへの取り組みを紹介した。この研究では、国民生活基礎調査や人口動態調査、国勢調査などのデータを活用。男女・年代別に、がんや心臓病、糖尿病など12種類の疾患の組み合わせ(4096通り)に対応する死亡移行や新規疾病発生率を計算した。これにより、10年後や20年後の疾病発生率や死亡率を個々人のレベルで予測できる。

 この開発では、日本の疾病発生率や死亡率に関する「疫学(的なデータ)をほぼ仮想的に再現できるようになった」(橋本氏)。構築した予測モデルによれば、日本の後期高齢者ではこれから「脳卒中よりもがんや心臓病、呼吸器疾患などが大きな問題となる可能性が示唆された。介護以上に、急性期医療の提供体制が問われるかもしれない」と橋本氏は話している。