2019年3月

時系列データに対する特徴量エンジニアリング手法のまとめ

つい最近、『時系列データ分析』という時系列データ分析の超入門書を読んだのですが、実際に機械学習モデルを構築するためにはどうやって特徴量を生成するべきなのか良く分からなかったのでいろいろ調べてみました。 ちなみにこの本は、自己相関とは何かとか、ARCH、GARCHといった主要な統計モデリングの手法を理解するのには最適だと思います。ただ、機械学習モデルにどう特徴量として時系列データを組み込むのかは説明 […]

来月の商品の売上数を予測する〜Kaggle Predict Future Salesに挑む(その2)

前回の投稿からだいぶ経ってしまいましたが、Kaggleの「Predict Future Sales」に再度取り組んでみました。 タスクの概要については以下の記事をご参照ください。 今回は前回とは違い、一応機械学習モデルを入れています。 今回のポイントはマスタであるitem_categories(商品カテゴリ)とshops(店舗)から大分類的な情報を生成したことと、商品売上数と商品売上金額についてラ […]

『確率思考 不確かな未来から利益を生みだす』を読んだ感想

久々に書評を投稿します。 実はこの本が出版されてすぐ、本屋の平積みにあったのを気まぐれに買って読んでいたのですが、内容がサッパリ頭に入っておりませんでした。 今になってふともう一度読んでみようかと思って読み直してみると、なかなか良書でした。 タイトルはとっつきづらいですが、内容はそんなこと一切なく、今後の自分の人生におけるあらゆる意思決定の精度を向上できたり、また、後悔のない意思決定ができるように […]