『多様性の科学』を読んだ感想

Kindle版で期間限定セールの対象になっていたので読んでみました。 大雑把に本書をまとめると、組織を構成するメンバーに多様性を持たせることで、組織全体での盲点が少なくなり、問題解決の可能性が高まるということです。 一見よくある言説のように感じますが、言うは易し行うは難しで、本書ではこれを実現できなかった組織/実現できた組織のケースを挙げ、多様性がいかに重要であるかを論じていきます。 事前に兆候を […]

パラメータの初期値を指定してOptunaで最適化してみる

OptunaはPFN社が公開しているオープンソースのハイパーパラメータ自動最適化フレームワークです。 最適化したいパラメータの事前分布と目的関数を定義すれば、あとはベイズ最適化を用いて自動的にパラメータを探索してくれます。 (Optunaの一般的な使用方法はこちらの記事が詳しいです。) ただ、ある程度パラメータについてのドメイン知識があって、最適なパラメータはこのあたりだと検討がついている場合は初 […]

Googleデータポータルのツールチップで複数のフィールドを表示する方法

最近Googleデータポータルを使う機会があり、ツールチップの使い方で少し悩んだので備忘録として書いておきます。 Googleデータポータルのツールチップは、Tableauでいうツールヒントとほぼ同じなのですが、複数のフィールド(ディメンション・メジャー)をグラフ上に表示したい場合は少し工夫が必要です。 ちなみに、以下はTableauのツールヒントを使ってグラフ上に情報を表示させる例です。 表示し […]

Py-Featでお手軽に表情認識をやってみた

Mediumのこちらの記事で、Py-Featというお手軽に表情表現(Facial Expression: FEX)を解析できるツールキットの存在を知ったのでさっそく試してみました。 今回は公式チュートリアルのうちの、画像からの表情認識をやってみました。 Py-Featとは Py-Featは表情表現(Action Units、emotions、facial landmarks)を解析するための包括的 […]

『行動分析学マネジメント-人と組織を変える方法論』を読んだ感想

ここ最近、組織論に興味があります。 自分が所属している組織が急拡大を終えて過渡期に入っており、いわゆるミッション・ビジョン・バリューを改めて定義しなければならない状況にあって、「組織論」的視点が身近な関心ごとになっているためです。 (今までミッション・ビジョン・バリュー定義されていなかったのか?という指摘は至極ごもっともです。) そんな中、Amazonのレビューで評価が高く、しかも単なる自己啓発で […]

『機械学習を解釈する技術〜予測力と説明力を両立する実践テクニック』を読んだ感想

本の感想ではあるものの、久々にデータサイエンス系を投稿します。 今年に入ってから現場へのデータ活用推進やデータ整備を担当するようになったため、データサイエンス系の業務から長いこと離れていました。 とはいえ、頭の片隅ではデータサイエンス系の知識をキャッチアップできていない焦燥感みたいなものがありました。 そんな折、久々に書店に立ち寄った際に気になる本を見かけたので思わず本書をポチってしまいました。 […]

TED TalksでTranscriptクリック時の再生タイミングを合わせる方法

最近、TED Talksを使って英語学習をしています。 TEDは、各業界の最前線でグローバルに活躍する方々のプレゼンを無料で聞けて、また日本語を含めた多くの言語での字幕やTranscriptも用意されているため、英語学習者にとってはかなり有用なサービスです。 TEDは自分が大学生の頃から英語学習用の教材として有名でしたが、いよいよ本腰を入れて取り組み始めた次第です。 しかし、英語学習のためにTra […]

TableauのLOD表現をSQLで理解する

最近再びTableauを使い始めました。 Tableauを使うのは2年ぶりでしたが、操作方法の大枠は変わらないのでブランクがあっても難なく利用できています。 ※テーブルの結合周りでやや仕様が変わっていて、JOINしたと見せかけてリレーションになっていたことがありましたが…。 さて、だいぶ昔にTableauでのアドホック分析をSQLと対応づけて説明する記事を書きましたが、今回はもう一歩踏 […]

ランダムフォレストで近接グラフを可視化する方法

前回に引き続き決定木系のお話になりますが、今回は近接グラフ(proximity plot)を可視化する方法を紹介します。 近接グラフはランダムフォレスト(RandomForest)を構成する各決定木の終端ノードに属するデータに着目した、データ間の近さを可視化する手法です。 ※前回は特徴量の解釈には重要度だけでなく部分依存グラフも活用しようという記事を書きました。 近接グラフとは 近接グラフとは、学 […]

特徴量重要度だけで解釈するのはやめよう~部分依存グラフのすすめ

以前、決定木アルゴリズムの特徴量重要度(feature_importance)に関する記事を書きましたが、依然としてターゲット変数に寄与する特徴量を重要度だけで解釈するケースを良く見かけます。 データサイエンティスト同士で分析結果を共有するならば問題ないかもしれませんが、データサイエンティスト以外の方に特徴量重要度をもとにした分析結果を報告する際はあらぬ誤解を招く可能性があります。 ※データサイエ […]

112