dplyr再入門

というタイトルで、第60回R勉強会@東京で発表してきました。

スライドをつくってたら長くなりすぎたのでいくつかに分割しています。

「基本編」は、mutateやselectなどの基本的な関数と、グループ化についてまとめています。内容はIntroduction to dplyr(原文翻訳)というvignetteに書かれていることをほぼそのまま書いています。それに加えてtwo-table verbs(joinとかunionとか)も扱いたかったんですが、ちょっと手が回りませんでした。。

「Colwise編」は、複数の列に同じ処理を適用する_all()_if()_at()という関数のバリエーションについて書いています。「scoped functions」とかいう言い方もされます。

「Tidyeval編」は、次期リリース(5月中旬)で導入される、NSEを扱うための新しいフレームワークについて説明しています。まだあんまり理解しきれてはいないんですが、とりあえず基礎的な使い方についてはまとめたつもりです。 Programming with dplyr(原文)というvignetteに詳しいので、そちらも併せてご参照ください。

あと、「Database編」というのも作りたかったんですが、こっちも手が回りませんでした。Introduction to dbplyrあたりをご参照ください。