SAS Institute Japan(SAS)は2018年8月4~5日の2日間、「なつやすみ 親子でデータサイエンス2018」と題したイベントを開催した。データサイエンティストの不足が叫ばれる中で、人材育成支援を目的とした取り組みだ。小学校2~6年生とその保護者が、2日間合計で50組ほど参加した。

SAS Institute Japanの本社で開かれた「なつやすみ 親子でデータサイエンス2018」の様子
[画像のクリックで拡大表示]

 小学生にデータサイエンスとはハードルが高そうだが、いったいどんな内容なのだろう。ちょうど記者には小学4年生の娘がいるので、一緒に体験してみることにした。

 SASのイベントだし、同社のツールを使いながら、大規模データ分析を体験するのではないか。当初、記者はそんな先入観を抱いていた。だが実際の内容は、それとは大きく異なっていた。

自分の頭や手足を使って、データを集める

 イベントへの参加申し込み後、事務局から届いたのは1通のメール。事前準備と、その結果をまとめた提出資料についての案内が書かれている。

 改めてイベントの告知ページをよく見てみると、事前準備として「分析テーマを設定する」「仮説を立てる」「仮説に基づいたデータを集める」という作業が必要だという。例として、「周囲の大人に聞いて、子供の頃の夢が叶う確率を調べる」「天気予報と実際の天候から、予報が当たる確率を調べる」などが挙げられている。

 事前に仮説を立てた上で自分でデータを集め、グラフを作るなどして分析する。そこから、自分の仮説が正しかったかどうかを検証する。ここまでが、事前の課題として課せられる。イベント当日は、事前準備の内容を基に分析結果をポスターとしてまとめるという。そのカリキュラムのどこにも、分析ツールのツの字もない。ITに頼るのでなく、自らの手足や頭を動かしてデータ分析を体験する内容なのだ。

 どうやら思ったよりもかなり手強そうだ。しかも事前準備の期間は1週間強しかない。平日は記者にも仕事があるし、限られた時間で何を調べようか。娘と相談し、「東京は、昔に比べて暑くなっているのか」をテーマにした。娘はちょうど地球温暖化について学んだばかりだし、折しも今年は記録的な猛暑だ。「きっと暑くなっているはずだ」との仮説を立てた。

 テーマが決まったら次はデータ集め。気象庁のWebサイトにアクセスしたところ、気象データや天気予報など多種多様なデータをダウンロードできるようになっている。暑さを調べるなら最高気温だろう、と娘。そこで、東京の8月の最高気温データを入手した。

 これを紙に印刷し、まずは温度ごとに色分けしてみた。低い温度は青系、高い温度は赤系で塗り分けてみる。年を追うごとに赤系が増えていくのでは、と考えたが、はっきりした傾向は見られない。折れ線グラフにすれば、右肩上がりになるのでは。そう娘と相談しながら過去70年分ほどの気温を方眼紙にプロットしたが、期待したような形にはならない。

過去70年分ほどの8月の最高気温(上)や1年の平均気温(下)の変化を折れ線グラフで表してみたが、はっきりとした上昇傾向は読み取れない
[画像のクリックで拡大表示]