『トークンエコノミービジネスの教科書』を読んだ感想

最近、日経の『「ソニーの車」を生む革命 ブロックチェーンの可能性』というニュースを読んで、ブロックチェーンが気になっています。 中国ではコロナ禍以降、ブロックチェーンをベースにしたアプリが多数生まれていて、中国政府も積極的に推奨しているのだとか。 (ブロックチェーン技術の客観性、安全性、信頼性が中国製品やサービスへの信頼復活のチャンスになると考えているらしい。) ということで、まずはブロックチェー […]

MPR(Mean Percentage Ranking)〜暗黙的にユーザの嗜好を得られるレコメンドシステムにおけるオフライン評価指標の紹介

レコメンドシステムにおけるオフライン評価指標の一つであるMPR(Mean Percentage Ranking)について書かれた論文を見つけました。 今回はその調べた結果をまとめます。 ちなみに、レコメンド文脈でのオフラインorオンライン評価とは以下を意味します。 分類 説明 オンライン評価 実際にユーザにレコメンドを実施し、ユーザがどれだけ反応したかを評価すること。 Ex. A/Bテスト オフラ […]

『外資系コンサル流・「残業だらけ職場」の劇的改善術 「個人の働き方」も「組織の体質」も変わる7つのポイント』を読んだ感想

KindleのUnlimitedの対象になっていたので読んでみました。 多くの企業がこぞって「働き方改革」を推進する昨今、確かに会社の制度として労働時間が厳しく規制されてきていると感じます。 しかし、仕事量は労働時間を規制する以前とは変わらないため、結局、会社に申請せずにコソコソ職場に居残って仕事したり、家に持ち帰って仕事したりと闇残業を助長しているように感じます。 そういった、職場に蔓延る長時間 […]

『いい緊張は能力を2倍にする』を読んだ感想

先日、AmazonでKindle本を物色している際にこの本がレコメンドされていました。なかなか高評価もついていて気になったので読んでみました。 筆者は精神科医で、巷にあふれている精神論を唱えた本とは一線を画し、科学的な根拠を示しながら緊張への対処法を紹介していきます。 例えば、馴染みのある緊張を緩和する方法としては「深呼吸を繰り返す」とか「人という字を掌に書いて飲み込む」などがありますが、そういっ […]

タイタニック号の乗客の生存予測〜80%以上の予測精度を超える方法(モデル構築&推論編)

本当に今更なテーマなのですが、以下の記事の後編を書きました。 1年以上も前のお話です笑 submitした結果が良くて満足してしまい、記事にするのを忘れていたようです。 コメントいただいた方、ありがとうございました。 さて、本編では前編での探索的データ解析をもとにモデルを構築し、推論します。 環境準備 以下のディレクトリ構造で進めていきます。 ├── data │   ├── processed │ […]

代表的なレコメンド評価指標の実装と可視化

最近、業務でレコメンドシステムの評価指標(メトリクス)の調査に取り組んでいます。 Precision@KやRecall@K、MAP@Kといったオフラインにおけるレコメンド指標の概要(簡単なsampleを使った説明)に関してはwebページの随所にみられますが、その実装コードや実際に指標を使って結果を比較している記事はなかなか見つかりません。 なので、今回は実際にテストデータをいくつか作成し、各指標を […]

『ビッグデータ分析のシステムと開発がこれ1冊でしっかりわかる教科書』を読んだ感想

つい先日、データエンジニアの方と「データサイエンス組織はプロダクトの開発でどこまで責任を持つべきなのか」という話をする機会がありました。 組織が大きくなり、エンジニアリング/サイエンスの分業が進んでいるからこそ、その境目に関しての議論が出てくるのでしょう(おそらく今後も)。 その際、データエンジニアの仕事、ひいては、データ分析/機械学習プロダクトの開発や運用の全体像をきちんと把握していないと、実り […]

大学のテストや統計検定で頻出の確率分布のまとめ

統計検定の試験勉強がてら、テストで頻出する確率分布を一覧化してみました。 各々の確率分布の詳細に関しては、数理統計学をテーマにしている専門書や、webにアップされている大学の講義資料などで把握できますが、確率(密度)関数、期待値、分散、最尤推定量などが一箇所にまとまって整理されている書籍やwebページはありませんでした。 大学の数理統計学のテストや統計検定(特に統計検定1級など)の勉強や試験直前の […]

『最高の結果を出すKPIマネジメント』を読んだ感想

以前から気になっていた本ですが、ようやく機会があって読みました。 プロダクトの施策に関わるデータアナリスト/サイエンティストとして、もっと早くに読んでおくべき本だったと思いました。 以下、本書を読んで思ったことです。 ダメダメなKPIを設定しているケースは本当によく見かける 本書では、「ダメダメなKPI」を設定しているケースとして以下の3点が挙げられていました。 ①たくさんの数値目標を設定している […]

東京五輪マラソン開催地で話題の札幌と東京の平均・最高気温のトレンドをTableauで可視化してみた

東京五輪マラソンの開催地が札幌に決まりました。 ニュース番組を見ていると、「札幌だって東京より暑い日がある」とか「札幌は涼しくない」とかいう発言を多々見受けるので、実際に気象データを取得して確認してみました。 なお、筆者はチケットも購入していないので家でゴロゴロ観戦するだけなので、どちらの開催地でも良いと思っています。 準備 測定対象期間 以下の競技開催日程をみると、女子マラソンは8月2日、男子マ […]