『失敗の本質』を読んだ感想

最近、『それでも、日本人は「戦争」を選んだ』※を読んだり、ゆっくり解説シリーズの歴史モノだったり、Amazon Primeの戦争映画を観たりしています。 ※日清戦争から太平洋戦争に至るまでがテーマで、当事者たちが何を考えて戦争という手段を選んだのか、また当時の国民が戦争に対してどんな感情を抱いていたのかを定量的なデータや文献の記録から読み解いています。 そんな中、歴史好きの友人から『失敗の本質』を […]

『岩波データサイエンス Vol.3』を読んだ感想

会社の後輩が社内ブログで因果推論の記事を書くということで、各所でお勧めされている『岩波データサイエンス Vol.3』を読んでみました。 ちなみに、事前に『効果検証入門〜正しい比較のための因果推論/計量経済学の基礎』を読んでいたため、傾向スコアによるマッチングや、IPW(Inverse Propensity Weighting)の理論をある程度理解した状態で本特集を読んでいます。 本特集では特に、『 […]

コロナ禍による概念ドリフト(Concept Drift)が機械学習タスクに与える影響

先日、全国で緊急事態宣言が解除され、ようやくコロナ禍の波を1つ超えた感があります。 しかし、コロナ禍によって人々の行動や需要が大きく変わっているため、コロナ禍の前後のデータは業界によっては全く傾向が異なると捉えるべきでしょう。 ここで気になるのは、コロナ禍以前から運用されている機械学習系サービスへの影響です。 本記事ではこういった感染症のパンデミックによる概念ドリフト(Concept Drift) […]

『データ分析のための数理モデル入門』を読んだ感想

Amazonを眺めていたら、今月の新刊の中でも特に気になるタイトルだったのでポチって読んでみました。 Twitterでも本書を読んだ感想がいくつか投稿されていますね。 結論、実務で数理モデルを扱っている方にとってはこういう数理モデルもあるのかと視野を広げるのにも役立ちますし、そもそも数理モデルとは何かを知りたい方にとっても数理モデリングに関する幅広い知識が身につくので、両者ともに一読の価値があると […]

『ビッグデータを支える技術―刻々とデータが脈打つ自動化の世界』を読んだ感想

会社のデータエンジニアの諸先輩方から熱くオススメされていたので読んでみました。 ※ちなみに、2020/6/1に弊社の新人も本書の書評を書いています。 以前読んだ『ビッグデータ分析のシステムと開発がこれ1冊でしっかりわかる教科書』では、タイトル通りビッグデータ分析に関する話題を広く扱っていましたが、本書ではデータ処理をどのようにシステム化するかの説明に特化しています。 (BIやMLサービスによる意思 […]

よく使われる2つのスコアの集約関数と複比ユニノルムとの比較

最近、相互推薦システムについて調べていて、Latent Factor Models and Aggregation Operators forCollaborative Filtering in Reciprocal Recommender Systemsという論文を読んでいます。 その中で、2つの選好スコアの集約関数についての記載がありました。ここで、選好スコアとは、ユーザAがユーザBをどれくら […]

レコメンド結果にMMRを適用して多様性を考慮した順位の入れ替えをやってみた

最近、Gunosyの方が書いた『多様性の導入による推薦システムにおけるユーザ体験向上の試み』という論文を読み、多様性を考慮したレコメンド手法に興味を持ちました。 この論文によれば、多様性を導入したレコメンドによって、ユーザのサービス継続率や利用日数が向上するのだとか。 そこで、上記をきっかけに引用文献等をいろいろ調査していたところ、MMR(Maximal Marginal Relevance:周辺 […]

『Rで学ぶ確率統計学一変量統計編』を読んだ感想

長い休みを使って統計学の基礎を復習しようと思い、この本を読んでみました。 ちなみに、本書はTJO氏のブログで以下と紹介されています。 東大出版会シリーズとほぼ同等の理論的な解説を伴った上で、Rでそれを現実のデータに対して実践するとどういう結果が得られるか?を丁寧に例示しており、今後の統計学テキストの新たなスタンダードになっていくのではないか 出典:https://tjo.hatenablog.co […]

『効果検証入門〜正しい比較のための因果推論/計量経済学の基礎』を読んだ感想

遅ればせながら読みました。 本書は各効果検証手法の説明が丁寧で、実サービスで運用する際の注意点も詳細に書かれています。 因果推論系の本を読むのは初めてでしたが、私のような入門者や実サービスへの導入を検討している方にも有用な本だと思いました。 また、因果推論のアプローチによって経済的な事象の効果を評価する計量経済学という分野にも興味が湧きました。 本書では、RCT(randomized contro […]

ランクがある2つのリストの相関係数の算出にAverage Precisionを導入する方法

最近、『A new rank correlation coefficient for information retrieval』という論文を読みました。 本論文では、ランクがある2つのリストにおける相関係数を算出するために、Average Precisionを利用することを提案しています。 従来、こういったランクがある2つのリストにおける相関係数としてはスピアマンの順位相関係数やケンドールの順位 […]