Kaggle

2/2ページ

レストランの来客数予測@Kaggle〜準備編

最近の業務は、TableauというBI(Business Inteligence)ツールを使ったデータの可視化がメインです。 データを可視化することで、戦略的な課題のあぶり出しや、顧客のセグメンテーションに役立てたりしています。 ただ、データ分析による未来予測は、現在のミッションに入っていません。 向学のため、未来予測も勉強していかないとなぁと思い、Kaggleのコンペを見ていたら、こんなものがあ […]

タイタニック号の乗客の生存予測〜誰でも理解できる予測モデルの構築

明けましておめでとうございます。 今年初投稿です。 明日からいよいよ仕事が始まりますね。 今年の抱負は「できない理由ではなく、できる方法を探す!」です。 仕事でも趣味でも、新しい分野にどんどんチャレンジして、スキルや知見を貯めていかねば。 さて、今回はまたタイタニック号の乗客の生存予測に関してです。 前から投稿している内容とは異なり、中学数学レベルの内容で誰にでもわかるようなモデルを作って予測して […]

タイタニック号の乗客の生存予測~Kaggleに挑戦(その3)

3度目のチャレンジです。 今回は、ロジスティック回帰分析ではなく、機械学習の一つであるランダムフォレストを使ってタイタニック号の乗客の生存予測をします。 また、新たにFamilySize(家族数)とCabin(部屋番号)を説明変数に入れてモデルを作っています。 さて、スコアは伸びるのでしょうか? FamilySize(家族数)と生存の関係 推測ですが、タイタニック号の沈没事故において、家族は一緒に […]

タイタニック号の乗客の生存予測~Kaggleに挑戦(その2)

前回の投稿から1週間。 Kaggleのチュートリアルコンペであるタイタニック号の乗客の生存予測にリベンジしました。 ※前回の投稿はこちら 前回は、学習用データ、テストデータの変数であるAge(年齢)の欠損値を、単純に学習用データの中央値で補完しました。 今回は、乗客のName(名前)の敬称とAge(年齢)との関係性に着目して、Age(年齢)の欠損値をより正確に補完して予測しました。 2018年12 […]

タイタニック号の乗客の生存予測~Kaggleに挑戦(その1)

だんだん冬が近づいてきましたね。 そろそろシャツ1枚で外出するのは、世間体的に宜しくないシーズンとなってまいりました。 さて、今回はKaggleという統計学を学んだ者にとっては胸が熱くなるようなサービスがあったので、統計解析手法の復習もかねてチャレンジしてみようと思います! (まずはKaggleにアプライすることをゴールにしています、、、) お題はタイタニック号の乗客の生存予測です。 タイタニック […]