h.yamada/ 2021年 5月 6日/ 技術

こんにちは、ヤマダです。
GWにエゾリスを見ました。中々のベストショットです。

前回から大分時間が空きましたが、またまた北海道コロナのオープンデータを使用して可視化してみたいと思います。

今回は感染者の初期症状の集計をしてみました。
使用したデータはこちらの「010006_hokkaido_covid19_patients.csv」になります。

Tableau Prepでクレンジング

クレンジング内容としては、、
* 症状の項目は区切り毎にバラした。(発熱、頭痛の2つの症状があれば、それぞれカウントされる)
* データの年代は0-100歳まで10歳区切りとなっているが、70歳以上をまとめた。年代が不明のものは対象外。
こんな処理フローです。(項目の変換とPIVOTの変換)

Tableauで可視化

クレンジングしたデータをTableauで可視化した内容がこちらになります。
棒グラフは全年代の症状の集計結果となります。
多いのは発熱、咳、全身倦怠感でした。
※棒グラフをクリックすると円グラフがハイライト表示されます

円グラフは年代毎の症状の割合です。
* 内容としては、、10歳未満が症状無しが多い
* 年代が上がるにつれて発熱の症状が多くなる

症状ではないですが、非公表も年代が上がると多いことがわかります(爆
分析結果として一般的に公表されている症状とあまり変わらない内容でしたー

今日はこんなところで、ではでは。

ノーストーチは社員を募集しております。
興味のある方はこちらから是非ご応募ください!

About h.yamada

初めに触ったBIはPentaho、QlikView約10年、特にQlikを使用した基盤構築やってます。 Tableau Desktop Certified Associateの資格も持ってました(有効期限切れ)