2017年11月

『ビッグデータを活かすデータサイエンス -クロス集計から機械学習までのビジネス活用事例』を読んだ感想

新年度の事業戦略をデータ分析という観点から支援したいなぁと思っていた矢先、こんな本が書店の平積みにあったのでつい買って読んでしまいました。 フォントが大きく、余白が多いので、1日で読めました笑 ちなみにこの本の著者である里氏は、データサイエンティストの入門書として有名な以下の本の著者であったりもします。 さて、本書を読んだ感想ですが、とにかくわかりやすいです。 クロス集計から機械学習まで幅広い手法 […]

タイタニック号の乗客の生存予測~Kaggleに挑戦(その3)

3度目のチャレンジです。 今回は、ロジスティック回帰分析ではなく、機械学習の一つであるランダムフォレストを使ってタイタニック号の乗客の生存予測をします。 また、新たにFamilySize(家族数)とCabin(部屋番号)を説明変数に入れてモデルを作っています。 さて、スコアは伸びるのでしょうか? FamilySize(家族数)と生存の関係 推測ですが、タイタニック号の沈没事故において、家族は一緒に […]

タイタニック号の乗客の生存予測~Kaggleに挑戦(その2)

前回の投稿から1週間。 Kaggleのチュートリアルコンペであるタイタニック号の乗客の生存予測にリベンジしました。 ※前回の投稿はこちら 前回は、学習用データ、テストデータの変数であるAge(年齢)の欠損値を、単純に学習用データの中央値で補完しました。 今回は、乗客のName(名前)の敬称とAge(年齢)との関係性に着目して、Age(年齢)の欠損値をより正確に補完して予測しました。 2018年12 […]

『怖い絵(角川文庫)』を読んだ感想

来月、上野の森美術館の「怖い絵展」に行くことになりました。 人生初の美術館です。 美大出身のお友達と行くので、どんな風に鑑賞するのかをみっちりレクチャーしてもらおうと思います(^^) とは言え、何も勉強せずに美術館へ行くより、少しくらいは予備知識を仕入れた上で鑑賞したいものです。 ということで、Amazonの電子書籍でこんなタイムリーな本を見つけたので早速ポチって読んでみました。 本書を読み、絵画 […]

タイタニック号の乗客の生存予測~Kaggleに挑戦(その1)

だんだん冬が近づいてきましたね。 そろそろシャツ1枚で外出するのは、世間体的に宜しくないシーズンとなってまいりました。 さて、今回はKaggleという統計学を学んだ者にとっては胸が熱くなるようなサービスがあったので、統計解析手法の復習もかねてチャレンジしてみようと思います! (まずはKaggleにアプライすることをゴールにしています、、、) お題はタイタニック号の乗客の生存予測です。 タイタニック […]

深夜に浅草寺へ行ってみよう!

この間、浅草寺へ行ってきました。 浅草寺と言えば、今や世界でも注目される超メジャーな観光スポットです。 どの時間に行っても、日本人や外国人観光客でごった返していて、情緒もへったくれもあったもんじゃないですね。 でも、深夜(2:00~4:00)の浅草寺は違います。 終電後は人がめったにいないので、仲見世通りを独占できます。 なので、こんな風に三脚を仲見世通りの真ん中に立てて、写真を撮ることだってでき […]

『ロジカルデータ分析』を読んだ感想

はやくも3連休が終了です。 私はずっと都内にいましたが、サイクルモードに行ったり、舞浜方面へサイクリングへ出かけたりと充実した休暇を過ごせて、リフレッシュできました。 さて、そんな連休ですが、『ロジカルデータ分析』という本を読んでみました。 本書を読むことで、データ分析を新事業企画という立場でどう活用していけばよいのか、具体的なイメージ作りができると思ったからです。 巷にあふれるデータ分析系の本と […]

『西洋美術史入門 (ちくまプリマー新書)』を読んだ感想

近々、美術館に行くかもしれません。 ということで、こんな本を読んでみました。 ちくまプリマー新書ですし、簡単に西洋美術史の概要を学ぶにはちょうどいいかと思いまして。 さて、本書で印象に残ったのは以下の2点でした。 絵画などの美術作品はごく近代まではメディアとして機能した 現代とは違い、中世のヨーロッパでは識字率が著しく低かったため、小食者、貴族、商人等の一部を除いて、一般庶民は言葉は話せても文字は […]