ggplot2再入門

ドーモ、インフラチームの湯谷(@yutannihilation)です。

サイボウズ社内では活発に社内勉強会が行われています。そんな社内勉強会のひとつ、Rと統計の社内勉強会で発表したグラフ描画ツール「ggplot2」についての資料を公開します。

www.slideshare.net

(アニメーションを省略したので少し見づらいスライドもあります。ご容赦ください)

Rと統計の社内勉強会について

Rと統計の社内勉強会は、マーケティングや開発など様々な部署のデータ分析に興味がある人が集まって始まった勉強会です。なんだかんだでもうかれこれ2年ほど続いています。 毎週一回昼休みに集まって、統計に関する本を輪読したり、統計に関連する話題を持ち寄って発表したり、統計的なマサカリが飛んで来たりします。

私は統計のことがあまり分からないので、こういうRのテクニック的な発表を担当することが多いです。

ggplot2とは

いい感じのグラフが描けるRのパッケージです。

ただ、「いい感じ」にはよくあることですが、人を寄せ付けない独特さもそこには同居していて、コードの意味がよくわからないまま試行錯誤に時間を費やすことになりがちです。 そんな時は、ググって見つけたコードを切り貼りするよりも、ちょっと腰を据えて仕組みを勉強した方が早いこともあります。

ということで、私の浅い知識と、それに加えて独断とか偏見とか、さらには汗とか涙なんかもついでに結集して、この「ggplot2再入門」という資料にまとめました。 ターゲットはggplot2の初心者以上中級者未満くらいの人で、少し細かい内容にも触れてみました。

ggplot2 book

この資料をつくるときに大いに参考にしたのが、ggplot2の作者・Hadley Wickham氏が現在執筆中の「ggplot2 book」という本です。 出版はまだまだ先ですが、内容は以下のGithubレポジトリで公開されています。

Github - hadley/ggplot2-book

基本的な使い方からかなり高度な話題まで網羅されていて、ggplot2について詳しく知りたい方にはオススメです。

※ただし、現在開発中のバージョンのggplot2をベースに内容が書かれていることに注意が必要です。掲載されているコードが手元のggplot2では動かないこともあります。

おわりに

「俺/私の知ってるggplot2と違う!?」みたいなことがあれば、@yutannihilationまでご指摘ください。拙い資料ではありますが、みなさまの快適なggplot2ライフのお役に立てば幸いです。