無料BIツールTableau Public版を使った川崎市施設別WiFiアクセス数の可視化

無料BIツールTableau Public版を使った川崎市施設別WiFiアクセス数の可視化

お久しぶりの投稿です。
業務的な忙しさに加えて他のことに興味が向いてしまっていたために、3ヶ月くらい当ブログを放置してしまいました。
ただ、こんなに放置していたのにも関わらず、定期的に見てくたださっている方がいらっしゃるようでした。
素直に嬉しい思いでした。
私が何かを発信する意義はゼロではないと思いますので、投稿再開いたします。

さて、今回はBI(Business Inteligence)ツールの1つTableauを紹介します。
Tableauは現業務で活用しているツールであり、アドホック分析(定型化されていない自由な切り口での分析)やデータの可視化(ビジュアリゼーション)に優れています。
Tableauの活用例の1つとして、実際に川崎市の施設別WiFiアクセス数のオープンデータを使った簡易なデータ可視化もやってみます。

Tableauとは

Tableauは一言でいうと、Excelのピボットをより高機能にしたツールです。
Tableauを使うことで、DB操作に必要なコード(SQLクエリなど)を書かなくても、複数のデータソースのデータを結合させた表計算ができます。
また、データ可視化(ビジュアリゼーション)機能が豊富なのでデータの視覚的な理解に役立ちます。

今回紹介するのはTableau Publicという無料ライセンス版ですが、テキストデータをデータソースとして読み込めるので、十分活用の場があると思います。
(データ分析が必要とされる現場では、データがxlsxやcsvで管理される場合が結構多いので)

川崎市の施設別WiFiアクセス数(オープンデータ)を使ったデータ可視化

データの取得

川崎市のHPからオープンデータを取得します。
今回使用するオープンデータは、2016年の川崎市の施設におけるWiFiアクセス数です。


余談ですが、昨今、公的機関がデータ公開する機運(オープンデータ戦略の推進)が高まっています。
自分が住んでいる地区のデータも結構公開されていたりするので、確認してみると面白いかもしれません。

データ加工

2016年の川崎市の施設におけるWiFiアクセス数のデータ「2016train_wifi_count.csv」が、どのようなデータなのかを確認します。
ほとんどの場合、オープンデータは公開されている状態のままではデータ分析で利用できません。
BIツールに読み込めるようにデータを整形する必要があります。


BIツールに読み込むためには以下の加工が必要です。

  1. 4行目までの説明部分の削除
  2. 合計レコードの削除
  3. カラム名称の追加


これでやっと、Tableauで読み込めるようになります。
日付が横持ちになっていますが、Tableauの機能で縦持ちに変更します

Tableauへデータ接続

Tableauを起動し、加工した「2016train_wifi_count.csv」をデータソースに設定します。

・日付が横持ちになっているので、縦持ちに変更しています。
・カラム名称を変更しています。

Tableauでデータ可視化

細かいTableau上での操作の説明は、他のページにお任せします。
ここでは、Tableau Publicで作成したダッシュボード(Tableauではvizと呼ばれます)をお見せします。

日付のスライダーを設定することで、任意の期間でデータを可視化できます。
ダッシュボード(viz)から、武蔵小杉駅でのWiFiアクセス数が他の施設よりも圧倒的に多いことがわかります。
また、経年的にWiFiアクセス数がどの施設でも増加トレンドということもわかります。
2016年のデータということもあり、スマホの普及、WiFi設置数の増加、WiFiの機能的な改善が重なっているのかもしれません。