新米探偵、データ分析に挑む(R Advent Calendar 2015)

これは,R Advent Calendar 2015の5日目の記事です.

今日は,Japan.Rとともに,立川は統計数理研究所では2015年度統計数理研究所共同研究集会「データ解析環境Rの整備と利用」が行なわれました.
この研究集会での発表の詳細については別途ご報告する可能性がありますが,徳島大学石田基広先生のオープンデータの収集や活用(可視化等)などのお話もお聞きしてきました.
そこで,本記事では先生が最近出版された「新米探偵、データ分析に挑む」の書評を書かせていただこうと思います.

書籍の概要

大学卒業後,探偵事務所に就職することになった「僕」こと田中俵太氏が商店街で起きる6つの事件に遭遇し,
統計学の基礎やR,RStudioの使用方法を身につけながら問題を解決していきます.
基本的な構成として,解決したい課題,明確化したい事項があり,そのために必要なデータ分析の手法やRの操作方法が現れてくるというストーリーになっています.
したがって,天下り的に知識が与えられて,一体どんなときにどう使うのだろうという心配を抱く可能性は非常に小さいです.

総評

おそらく統計もRも知識不要で,お気軽に読み進めることができます.

特にお勧めしたいのが,

  • 統計に興味があるけど何から始めたら良いかわからない
  • 東京大学出版会統計学入門などの統計のバイブルを手に取ったは良いが,イメージがわかなくて困っている
  • Rの初歩とされる本を手に取ったは良いが難しくて読み進められない or 出てくる関数などを何のために使うのかわからない

というような学生,社会人の方です.
統計やRの初歩レベルをクリアした方にも読み物として楽しめること請け合いです.

石田先生の読み物調の作品は,これまでにも「とある弁当屋の技師」シリーズがありました.

これらの作品と比べると,本書は

  • Rによる計算方法のウェイトが上がっている
  • モダンなRの機能を使っている(ggplot2, dplyr, RStudio等)

といったところに特色があるのかなと思います.
数々の名著を手がけられ,最新のRの動向にも目を配られている石田先生だからこそ生まれた名作と言えるでしょう.

また,Amazonの書評にもあるように,単にデータ分析を説明するだけでなく,顧客のニーズを明確化してデータや分析の要件の定義を行なっている箇所もあり,臨場感があります.
データ分析初心者の方に現場の雰囲気が伝わる書籍はなかなかないと思うので,その意味でも貴重です.

みせかけの回帰?

twitterを眺めていたら,このようなやり取りを見かけました.

この件については私も現在文献等を調査中ですが,@teramonagiさんが1ヶ月も前にブログ記事を書かれていますので,ご参照ください.

売上げを気温で回帰してみる

まとめ

従来の統計学の教科書は,初心者にはともすると無味乾燥でイメージが湧きにくいものが多かった気がしています.
私も大学の教養課程で「基礎統計」という授業を受講したものの,ほとんど興味が湧くことはありませんでした.
その当時,この本 (と現在のRの環境) があったら興味を持つことができただろうなと思いながらページをめくっていました.

データ分析に興味があるけどきっかけがつかめない,他書で挫折してしまったので易しい本から始めたい,理論だけでなくある程度手を動かせるようになりたい.そんな方々は,是非本書を手に取ってみてください.