『日本人の原点がわかる「国体」の授業』を読んだ感想

近頃、戦争関連の資料を読む機会が多いです。 『失敗の本質』を読んでからというもの、日本に限らず他国がどういうプロセスで意思決定をして戦争という手段を行使したのかを調べています。 さて、今回は長いこと積読していた本書を改めて読んだので、簡単に紹介します。 本書では、「国体」の話、古事記や日本書記から読み解く日本建国の精神、天皇と国民の君民共治(天皇と国民が一体となって国がまとまる)、「和」の精神と未 […]

推薦システムの手法のまとめ

長いこと業務でレコメンドアルゴリズムの開発を担当しているのですが、そういえば推薦システム(Recommender System)で用いられている手法の全体観をちゃんと抑えていなかったなぁと感じることが最近ありました。 ということで今回は一度基礎に立ち返って、推薦システムで用いられている手法をまとめることにします。 なお、紹介した手法の具体的な実装方法は紹介せず、推薦システムの全体像を捉えることを目 […]

自然言語処理ライブラリspaCyが日本語対応したので試してみた

spaCyという自然言語処理のためのライブラリがバージョン2.3にアップデートされ、日本語に対応しました。 このアップデートによって、ベクトルを内包するモデルのサイズやロードにかかる時間が減少し、さらに単語ベクトルの精度が向上したとのことです。 公式ドキュメントを見ると、単語のセグメンテーションと品詞タグ付けにはSudachiPyを利用しているようです。 今回は早速、spaCyを使って日本語の分か […]

Streamlitで確率分布のシミュレーションアプリを作ってみた

巷でFlaskはオワコンと言わしめている、StreamlitというMLツールを使ってみました。 Streamlitは、Pythonスクリプトだけでwebアプリを作成できるツールです。 公式ページ曰く、Streamlitはデータサイエンティストや機械学習エンジニアがほんの数時間で美しくパフォーマンスの高い を作るための最も簡単なフレームワークとのこと。 Streamlit’s open-source […]

『失敗の本質』を読んだ感想

最近、『それでも、日本人は「戦争」を選んだ』※を読んだり、ゆっくり解説シリーズの歴史モノだったり、Amazon Primeの戦争映画を観たりしています。 ※日清戦争から太平洋戦争に至るまでがテーマで、当事者たちが何を考えて戦争という手段を選んだのか、また当時の国民が戦争に対してどんな感情を抱いていたのかを定量的なデータや文献の記録から読み解いています。 そんな中、歴史好きの友人から『失敗の本質』を […]

『岩波データサイエンス Vol.3』を読んだ感想

会社の後輩が社内ブログで因果推論の記事を書くということで、各所でお勧めされている『岩波データサイエンス Vol.3』を読んでみました。 ちなみに、事前に『効果検証入門〜正しい比較のための因果推論/計量経済学の基礎』を読んでいたため、傾向スコアによるマッチングや、IPW(Inverse Propensity Weighting)の理論をある程度理解した状態で本特集を読んでいます。 本特集では特に、『 […]

コロナ禍による概念ドリフト(Concept Drift)が機械学習タスクに与える影響

先日、全国で緊急事態宣言が解除され、ようやくコロナ禍の波を1つ超えた感があります。 しかし、コロナ禍によって人々の行動や需要が大きく変わっているため、コロナ禍の前後のデータは業界によっては全く傾向が異なると捉えるべきでしょう。 ここで気になるのは、コロナ禍以前から運用されている機械学習系サービスへの影響です。 本記事ではこういった感染症のパンデミックによる概念ドリフト(Concept Drift) […]

『データ分析のための数理モデル入門』を読んだ感想

Amazonを眺めていたら、今月の新刊の中でも特に気になるタイトルだったのでポチって読んでみました。 Twitterでも本書を読んだ感想がいくつか投稿されていますね。 結論、実務で数理モデルを扱っている方にとってはこういう数理モデルもあるのかと視野を広げるのにも役立ちますし、そもそも数理モデルとは何かを知りたい方にとっても数理モデリングに関する幅広い知識が身につくので、両者ともに一読の価値があると […]

『ビッグデータを支える技術―刻々とデータが脈打つ自動化の世界』を読んだ感想

会社のデータエンジニアの諸先輩方から熱くオススメされていたので読んでみました。 ※ちなみに、2020/6/1に弊社の新人も本書の書評を書いています。 以前読んだ『ビッグデータ分析のシステムと開発がこれ1冊でしっかりわかる教科書』では、タイトル通りビッグデータ分析に関する話題を広く扱っていましたが、本書ではデータ処理をどのようにシステム化するかの説明に特化しています。 (BIやMLサービスによる意思 […]

よく使われる2つのスコアの集約関数と複比ユニノルムとの比較

最近、相互推薦システムについて調べていて、Latent Factor Models and Aggregation Operators forCollaborative Filtering in Reciprocal Recommender Systemsという論文を読んでいます。 その中で、2つの選好スコアの集約関数についての記載がありました。ここで、選好スコアとは、ユーザAがユーザBをどれくら […]