レストランの来客数予測@Kaggle〜準備編

レストランの来客数予測@Kaggle〜準備編

最近の業務は、TableauというBI(Business Inteligence)ツールを使ったデータの可視化がメインです。

データを可視化することで、戦略的な課題のあぶり出しや、顧客のセグメンテーションに役立てたりしています。

ただ、データ分析による未来予測は、現在のミッションに入っていません。

向学のため、未来予測も勉強していかないとなぁと思い、Kaggleのコンペを見ていたら、こんなものがありました。

レストランの来店数予測、面白そうですね。

コンペで戦えるほど優秀ではないので、勉強と割り切ってこの課題をやってみようと思います。

ということで、まずは準備として、このコンペの概要とお題となるデータの説明をします。

レストラン経営における課題

どれくらい顧客の来店を予測できるか?

レストラン経営における主な課題はこれに尽きます。

毎日どれくらいのお客さんが来店して、どれくらい料理を注文してくれるかを予測することは、経営の安定化に直結します。

来店予測ができれば、食材の仕入れを最小限にとどめられるのでストックがたまる(あるいは廃棄する)こともありませんし、さらにはスタッフのシフトの最適化にも繋がります。

しかし、レストランへの顧客の来店は、天気や競合のレストランの状況によって不規則に変動するため、予測は困難を極めます。

特に、新規にオープンしたレストランにとっては、蓄積しているデータ量が少ないために予測はより一層困難です。

もし、蓄積されたデータから、各レストランの来店数を正確に予測できるようなモデルを作成できれば、レストランにとっての恩恵は計り知れないものとなるでしょう。

お題のデータ

このコンペは、リクルートが主催しています。

リクルートは、ホットペッパーグルメ、Airレジ、レストランボードというサービスを展開しており、まさにレストランの来店予測に必要なBigDataを一元集約している企業です。
(リクルートのサービスは上記以外にも多岐にわたります。今や、HR業界の枠を超えた、BigData解析のリーディングカンパニーです。)

このコンペではリクルートが提供する、予約情報や来店情報を使って、過去のデータから将来の来店数を予測するチャレンジをします。

お題となるデータは、レストランの来店客に関する時系列データとなります。

リクルートがホットペッパーグルメ、Airレジ、レストランボードといったサービスで蓄積してきた、予約・訪問・その他サイトから得られるデータです。

学習用データは2016-2017年4月のデータあり、そこで予測モデルを構築します。

そして、テスト用データである2017年4月の最終週から5月のデータへ、予測モデルの当てはめを行います。

ゴールデンウィークの来店数をどう見積もるかがポイントになりそうです。

次回からコツコツチャレンジしていこうと思います。