メモ:WannaCryの送金データをblockchain .infoのAPIから取ってきてグラフを描きたい

追記(2017/05/21):

ツイートの主によるやり方解説ブログはこちら。


これを描きたい。が、元データはどこを見ればいいのかよくわからず調べた時のメモ。

続きを読む

メモ:stringr::str_locate_all()の結果をstringr::str_sub()に渡したいときはpurrr::map2()

例えば、適当な文字列からaで始まる単語を抜き出してみる(こんなことはstr_locate_all()を使わなくてもできるけど、まあ例ということで)

library(stringr)
library(purrr)

x <- c("asymmetry between apple and banana", "aspiration after surgery")

# \\p{Ll}はunicode property nameというやつらしい。
ptn <- "a[\\p{Ll}]+"
続きを読む

メモ:Rでemojiを扱うにはどうすれば... part2

追記(2017/05/13): useBytes = TRUEにした場合は、regmatches()で抜き出すのはいけるけど、regmatches<-で置換するのはエラーになる。うーん…

x <- "<img src='test.png' alt='🍉'>"
m <- gregexpr("<\\s*[Ii][Mm][Gg]\\s+[Ss][Rr][Cc]\\s*=\\s*[\"']([^\"']+)[\"']", x, useBytes = TRUE)
regmatches(x, m)
#> [[1]]
#> [1] "<img src='test.png'"
#> 

regmatches(x, m) <- toupper(regmatches(x, m))
#> Error in nchar(u) : 
#>   number of characters is not computable in "bytes" encoding, element 1

unicodeのことは分からないけど引き続きメモ。

続きを読む

メモ:Rでemojiを扱うにはどうすれば...

こういう問題に悩まされていて、どうすればいいか調べる途中のメモ

具体的に言うとこのエラーをなんとかしたい。

# devtools::install_github("hadley/emo")
wm <- emo::ji("watermelon")
as.character(wm)
#> [1] "\xf0\u009f\u008d\u0089"
gregexpr(".", as.character(wm), perl = TRUE)
#> Error in gregexpr(".", as.character(wm), perl = TRUE) : 
#>   invalid input '拷' in 'utf8towcs'
続きを読む

メモ:R 3.4.0でfile.info()がNAを返すやつ

Windowsだけで起こるこのバグのせいでinstall.packages()が失敗するという話があって気になって調べていた。

17261 – file.info returns filetime for directories https://bugs.r-project.org/bugzilla3/show_bug.cgi?id=17261

続きを読む