2019年5月

統計学と機械学習におけるマルチコ(多重共線性)に対する考えの相違

先日、デスマーチの末なんとか機械学習案件のリリースに漕ぎ着けました。 今回の案件に関わらないですが、要件や仕様はしっかり明文化しておくべきですね。 後から(特にリリース間近になって)言った言わないの議論になるのは双方にとってあまり気持ちのいいものではありません。 些細な仕様変更のため口頭で合意した内容でも、しっかりと資料化しておくことの重要さを再認識しました。 さて、今回はマルチコ(多重共線性)に […]

雪崩から生還〜山岳事故に巻き込まれるリスクを考える

割とショッキングな話ですが、つい先日、残雪が残る北アルプスに登山にいき、雪崩に巻き込まれました。 私たちのパーティ含め5〜7名が雪崩に巻き込まれましたが、全員の無事を確認でき大事に至ることはありませんでした。 こんな経験は人生で2度はしないだろうと思います。 今回の事故を風化させないため、ここでは雪崩(ひいては山岳事故)に巻き込まれる可能性が高まるリスクについて思うところを述べてみようと思います。 […]

『データは騙る: 改竄・捏造・不正を見抜く統計学』を読んだ感想

前から気になっていた『データは騙る』を買って読んでみました。 海外の著者の翻訳本のため、海外の研究・論文事例が多くて、私含めて日本人にとっては即座に理解しにくい箇所が多いです。 しかし、今後自分がデータ分析していくなかでの自戒であったり、第三者の分析結果を批判的にみるための良い契機となりました。 本書を読んで特に良いキーワード(自戒や他者の分析批判に活かせる事項)は以下になります。 自己選択バイア […]