R dplyr

dplyrがもうCRANにsubmitされたという噂を聞いてNEWS.mdを読んでたら、こんなことが書かれていました。

select() (and the internal function select_vars()) now support column names in addition to column positions. As a result, expressions like select(mtcars, "cyl") are now allowed.

説明の意味はあんまり理解できないんですが、こんな感じです。select()とselect_()の使い分けで悩んでいた時代はもう過去ですね。

2017-05-20

メモ：カテゴリごとにデータフレーム単位で処理をしたいときはdplyr::do()とsplit() + purrr::map()のどちらが速い

追記（2017/07/26）: コメント欄で指摘いただいたのでmap_df()を使わないバージョン（f_split2()）を追加しました。これはmap_df()が遅いというより、split()した数だけ新しくtibble()をつくるのでその時間だろうなと推測しています。

ベクトルを引数に取る関数はgroup_by()でいいわけですが、データフレームを引数に取るような関数はどうしますか？

2017-05-15

メモ：WannaCryの送金データをblockchain .infoのAPIから取ってきてグラフを描きたい

R ggplot2 API

追記（2017/05/21）：

ツイートの主によるやり方解説ブログはこちら。

これを描きたい。が、元データはどこを見ればいいのかよくわからず調べた時のメモ。

The #wannacry attackers — if they can cash out before authorities find them — just topped $35K USD pic.twitter.com/UBQOrz1yJ0
— Боб Рудіс (@hrbrmstr) 2017年5月14日

2017-05-14

メモ：emojiの扱い方は分からないけどとりあえずrmarkdown::render()はできるようになった

これがrmarkdownにマージされたので、gregexpr()のエラーはとりあえずなんとかなりました。

これでやっとblogdown使える…！

2017-05-13

メモ：stringr::str_locate_all()の結果をstringr::str_sub()に渡したいときはpurrr::map2()

R purrr

例えば、適当な文字列からaで始まる単語を抜き出してみる（こんなことはstr_locate_all()を使わなくてもできるけど、まあ例ということで）

library(stringr)
library(purrr)

x <- c("asymmetry between apple and banana", "aspiration after surgery")

# \\p{Ll}はunicode property nameというやつらしい。
ptn <- "a[\\p{Ll}]+"

2017-05-11

メモ：Rでemojiを扱うにはどうすれば... part2

追記（2017/05/13）： useBytes = TRUEにした場合は、regmatches()で抜き出すのはいけるけど、regmatches<-で置換するのはエラーになる。うーん…

x <- "<img src='test.png' alt='🍉'>"
m <- gregexpr("<\\s*[Ii][Mm][Gg]\\s+[Ss][Rr][Cc]\\s*=\\s*[\"']([^\"']+)[\"']", x, useBytes = TRUE)
regmatches(x, m)
#> [[1]]
#> [1] "<img src='test.png'"
#> 

regmatches(x, m) <- toupper(regmatches(x, m))
#> Error in nchar(u) : 
#>   number of characters is not computable in "bytes" encoding, element 1

unicodeのことは分からないけど引き続きメモ。

2017-05-09

メモ：Rでemojiを扱うにはどうすれば...

こういう問題に悩まされていて、どうすればいいか調べる途中のメモ

具体的に言うとこのエラーをなんとかしたい。

# devtools::install_github("hadley/emo")
wm <- emo::ji("watermelon")
as.character(wm)
#> [1] "\xf0\u009f\u008d\u0089"
gregexpr(".", as.character(wm), perl = TRUE)
#> Error in gregexpr(".", as.character(wm), perl = TRUE) : 
#>   invalid input '拷' in 'utf8towcs'

Technically, technophobic.

メモ：dplyr 0.6.0は、select()するだけならtidyevalいらないっぽい

メモ：カテゴリごとにデータフレーム単位で処理をしたいときはdplyr::do()とsplit() + purrr::map()のどちらが速い

メモ：WannaCryの送金データをblockchain .infoのAPIから取ってきてグラフを描きたい

メモ：emojiの扱い方は分からないけどとりあえずrmarkdown::render()はできるようになった

メモ：stringr::str_locate_all()の結果をstringr::str_sub()に渡したいときはpurrr::map2()

メモ：Rでemojiを扱うにはどうすれば... part2

メモ：Rでemojiを扱うにはどうすれば...