MUDSの1学年後期に開講されている「人類と人工知能」において、オープンデータ(*1)から花粉飛散量とスギの植生と風の影響を分析したグループを紹介します。データサイエンティストに必要なプログラミングスキルを磨く授業の取り組み内容です!

今回の課題は、オープンデータを実際に検索・取得し、Pythonを用いて分析・マイニングをすることによって、意外と気づかない、思わず納得してしまうインサイト(洞察、発見)を見つけてプレゼンテーションを行う。

スギ花粉症患者を対象に以下2点をオープンデータから明らかにした
課題①花粉症の症状の緩和に効く食材
課題②花粉から逃れるのに適した地域

課題①の分析に用いた手法

 ・全国を対象に各観測地点における以下2つのデータを可視化
  スギ花粉飛散量・スギ花粉症有病率

・図1と図2の色のつき方の傾向は同じように見えたが、相関係0.334574
  と弱い相関だった。岩手県と宮城県のように、花粉飛散量は同程度でも有病
  率が大きく違うところに注目し、食べ物が要因として関係しているのではな
  いかという仮説を立てて分析した。

・「花粉飛散量が多い」割に「花粉症有病率が低い」都道府県は、データから山形県・青森県・岩手県・茨城県民である。花粉症対策で摂ると良いとされる食材の消費量を他県と比較することによって、花粉症の症状の緩和に特に効く食材を見つける。

①の分析結果
 ・花粉症の症状の緩和、予防には青魚と発酵食品は候補として挙げられた食材
  の中でも特に効果があると思われる。
  参考文献:総務省統計局「家計調査(二人以上の世帯)品目別都道府県庁所在
  市及び政令指定都市ランキング」(2015)

②の分析に用いた手法

・全国を対象に各観測地点における以下4つのデータを可視化
スギの植生・スギ花粉飛散量・スギ花粉症有病率・風向

・ヒートマップから花粉飛散量が低い地点に加えて、風上である地点を抽出

・スギが多く生えているところでスギ花粉症患者が多いわけではなく、その近隣の都道府県で花粉飛散量が多いことが分かった。要因は、風の影響ではないかという仮説を立てて分析した。

<風向の可視化方法>

①2019/2/15 〜 2019/4/30の観測期間における毎時の風向を集計

②風配図を作成

③日本地図上の各観測地点にプロット

④一目で分かりやすいように矢印に変換

図3 対象期間の四日市市の風配図

②の分析結果

矢印が示す風下に花粉が多く飛散していることが示された。花粉から逃れるのに適した地域は、調査期間において花粉飛散量が少なかった地域かつ風上にある地点とする。その条件に当てはまるのは岩手県南部・宮城県北部・新潟県・福島県南西部・長野県北部・滋賀県・京都府などが挙げられる。

まとめ

①花粉症の症状の緩和に効く食材

効くとされる食材は世間で複数挙げられているが、今回特に効きそうな食材を導き出せた。

②花粉から逃れるのに適した地域

引っ越す機会に地域を選ぶ余地があるなら参考になるかも?

Qitaに詳しい分析方法が掲載されているのでぜひチェックしてみてください!

オープンデータから花粉飛散量とスギの植生と風の影響を分析する(前処理編)https://qiita.com/TakuTaku36/items/40cb590b0ae0c6340f8c

オープンデータから花粉飛散量とスギの植生と風の影響を分析する(可視化編)https://qiita.com/TakuTaku36/items/e9fa09b38f86be188070

※1 オープンデータ
誰でも許可されたルールの範囲内で自由に複製・加工や頒布などができるデータを指す。国や地方自治体や企業から配布されていることが多い。

Category
Tags

No responses yet

    コメントを残す

    メールアドレスが公開されることはありません。 * が付いている欄は必須項目です