『とある弁当屋の統計技師(データサイエンティスト) 2 ―因子分析大作戦―』を読んでみた

『とある弁当屋の統計技師(データサイエンティスト) 2 ―因子分析大作戦―』を読んでみた

先日、『とある弁当屋の統計技師(データサイエンティスト) ―データ分析のはじめかた―』の書評を投稿しました。

今回は、その続編である『とある弁当屋の統計技師(データサイエンティスト) 2 ―因子分析大作戦―』の書評です。

本作品のストーリーは、新米データサイエンティストの二項文太が、クライアントの娘である正規乱子が在籍する高校のクラスの、期末試験の平均点を上げるために奮闘するというものです。

試験科目である現代文、英語、世界史、数学、情報処理、理科の6教科の得点に影響を与えていると考えられる、理系因子、文系因子を想定して因子分析を進めていくプロットは、リアリティがあり、現場での活用もイメージしやすいと思いました。

解説されている統計解析の手法は以下になります。

  1. 因子分析
  2. 主成分分析
  3. 2グループ間の平均値のt検定(対応がある場合のみ)
  4. 分散分析

数式による説明を最小限にとどめているものの、因子分析と主成分分析を対比した説明は非常に明快で、理解しやすいと思います。

前作では未知データの予測がメインでしたが、本作では既存データの関係性の説明をメインにしています。

因子分析、主成分分析の概要を知りたい人や、現場での検証フェーズでお困りの方には一読の価値があります。

それにしても、この『とある弁当屋の統計技師(データサイエンティスト)』シリーズは面白くて読みやすいですね。

機械学習をテーマにした続編を期待したいところです。