dplyr

メモ:dplyrの中で使われるDBIのメソッドをリストアップする

dplyrのバックエンドとして使えるようにするにはDBIのメソッドを実装しなくてはいけません。とはいっても全部実装しなくてもいいはずで、じゃあどれを実装すればいいのかと言うとAdding a new SQL backendを読めばいいはずなんですが、いまいちピンと来なか…

dplyrで複数の変数でgroup byしたときは、summariseでグループ化解除されるのはひとつずつ

(タイトルが何言ってるか分からない日本語ですが、メモと言うことで許してください…) dplyrのvignetteってちゃんと読んだことなかったんですが、訳してみると色々書いてあることに気付きます。

dplyrで分とか時でgroup_by()したいときはlubridate::floor_date()

たとえばこういうデータがあって、分間に何レコードあるか数えたいとします。 library(dplyr) library(lubridate) set.seed(1) x <- runif(100, max = 60) d <- data.frame(timestamp = now() + seconds(cumsum(x))) head(d) #> timestamp #> 1 2015-09-22 0…

自分用メモ:dplyrとかtidyrで要素がネストできたりできなかったり

この記事を読んでて思ったけど、そもそもdplyrとかtidyrは要素がネストするのを許したり許さなかったりするんだろう。 dplyrでgroup_byしてグループ内でテキストにpaste的な事をする。 | 分析のおはなし。

dplyr 0.4.3を使ってみる

最近、パッケージ紹介といえばからだにいいものさんの活躍っぷりがすごいので、私はもうこういうの書かなくていいかなあ...なんて思いながら羽鳥がなんかつぶやいてたのでdplyrの次期バージョンを軽く触ってみて気になるとこだけメモしときます。 dplyr is s…

メモ:dplyr::mutate()の中でstr_split()したいと思ったとき、使うのはtidyr::separate()だ

定期的に忘れるのでメモ。たぶんまた忘れるけど。 Adding multiple columns in a dplyr mutate callstackoverflow.com

Rとヨーダ記法

ヨーダ記法(Yoda conditions)ということばがあります。

メモ:dplyrの中で使うのはdiff()じゃなくてlag()

なんかこれもう常識?な感じが漂ってるので書くの恥ずかしいけど、割とよくつまづくのでメモ。 こんな感じの、累積値が記録されてるデータがあるとする。

dplyrのバックエンドにMariaDBを使う(Ubuntu 14.04)

HDDの記事を見て、sqliteじゃなくて別のDBで読み込むにはどうするんだろう?と思ったので、手元のUbuntu14.04でやってみて、ついでにdplyrでつないでみたときのメモ。

dplyrの*_join()のチートシートを作りました。

神にリツイートされてかつてないほどのRT&Fav数になった一方、日本人はほとんど反応してくれないので寂しさのあまりブログにも書きます。ほんとは前の記事(dplyr 0.4を使ってみる)に載せてた図なんですけど、やましい動機ですみません。 I created a chea…

dplyr 0.4を使ってみる

追記('15/01/04):*_join()の図を追加しました。 新年早々、dplyrの新バージョンがリリースされるらしいです。 dplyr/NEWS.md at master · hadley/dplyr · GitHub 新機能についてはHadleyさんがRPubsに書いてるので、もうブログ書かなくてもいいかなーと思…

dplyr 0.3の新機能を使ってみる

dplyr 0.3が次の金曜にCRANにくるらしいです。 Please try out dplyr 0.3 RC from https://t.co/1HYJga3pr2. So much new stuff! https://t.co/lwF3yJJJCf Will go to CRAN next Friday #rstats— Hadley Wickham (@hadleywickham) 2014, 9月 25 色々新機能が…