2017-05-15

メモ：WannaCryの送金データをblockchain .infoのAPIから取ってきてグラフを描きたい

R ggplot2 API

追記（2017/05/21）：

ツイートの主によるやり方解説ブログはこちら。

これを描きたい。が、元データはどこを見ればいいのかよくわからず調べた時のメモ。

The #wannacry attackers — if they can cash out before authorities find them — just topped $35K USD pic.twitter.com/UBQOrz1yJ0
— Боб Рудіс (@hrbrmstr) 2017年5月14日

2017-05-14

メモ：emojiの扱い方は分からないけどとりあえずrmarkdown::render()はできるようになった

これがrmarkdownにマージされたので、gregexpr()のエラーはとりあえずなんとかなりました。

これでやっとblogdown使える…！

2017-05-13

メモ：stringr::str_locate_all()の結果をstringr::str_sub()に渡したいときはpurrr::map2()

R purrr

例えば、適当な文字列からaで始まる単語を抜き出してみる（こんなことはstr_locate_all()を使わなくてもできるけど、まあ例ということで）

library(stringr)
library(purrr)

x <- c("asymmetry between apple and banana", "aspiration after surgery")

# \\p{Ll}はunicode property nameというやつらしい。
ptn <- "a[\\p{Ll}]+"

2017-05-11

メモ：Rでemojiを扱うにはどうすれば... part2

追記（2017/05/13）： useBytes = TRUEにした場合は、regmatches()で抜き出すのはいけるけど、regmatches<-で置換するのはエラーになる。うーん…

x <- "<img src='test.png' alt='🍉'>"
m <- gregexpr("<\\s*[Ii][Mm][Gg]\\s+[Ss][Rr][Cc]\\s*=\\s*[\"']([^\"']+)[\"']", x, useBytes = TRUE)
regmatches(x, m)
#> [[1]]
#> [1] "<img src='test.png'"
#> 

regmatches(x, m) <- toupper(regmatches(x, m))
#> Error in nchar(u) : 
#>   number of characters is not computable in "bytes" encoding, element 1

unicodeのことは分からないけど引き続きメモ。

2017-05-09

メモ：Rでemojiを扱うにはどうすれば...

こういう問題に悩まされていて、どうすればいいか調べる途中のメモ

具体的に言うとこのエラーをなんとかしたい。

# devtools::install_github("hadley/emo")
wm <- emo::ji("watermelon")
as.character(wm)
#> [1] "\xf0\u009f\u008d\u0089"
gregexpr(".", as.character(wm), perl = TRUE)
#> Error in gregexpr(".", as.character(wm), perl = TRUE) : 
#>   invalid input '拷' in 'utf8towcs'