2017-01-01から1年間の記事一覧

メモ:国土数値情報のウェブページから各データの説明のURLをrvestとstringrで抜き出す

国土数値情報APIはzipファイルのURLを返してくれるんですけど、それがどういうデータかは教えてくれません。 library(dplyr, warn.conflicts = FALSE) library(kokudosuuchi) #> このサービスは、「国土交通省 国土数値情報(カテゴリ名)」をもとに加工者が…

メモ:sfにdplyrの関数を使いたいときはlibrary()とかでsf用のメソッドを読み込んでおく必要がある

国土数値情報のGISデータをsfで処理するときのメモ。

RのテストにCircleCIを使う

RでCIというと、ほとんどはTravis CIが使われます。なんといっても、 devtools::use_travis() とするだけで準備が整うというお膳立てっぷりです。 でも、Travis CIの弱点はCIに使われるイメージが古いことです。最近ようやくデフォルトイメージがUbuntu 14.0…

メモ:Rcppでマルチバイト文字を表示するときはRf_translateChar()でデフォルトの文字コードに変換してから

メッセージを表示するにはRcpp::Rcoutを使えばいい。与えた文字列をそのままダンプするような関数はこんな感じ。

メモ:evaluate::evaluate()の結果から警告メッセージを自分で組み立てる

R

knitするときの警告の出方は、通常のコンソールでの操作と異なります。

httr 1.3.0がリリースされました

httr 1.3.0がリリースされました。色んな不具合が直っています。

メモ:%<-%、%>>%

R

最近ちょっと気になる演算子。使い方をちょっと調べたのでメモ。

Rでドメインを買うためにGoDaddy APIを使う

R API

というタイトルですが、まだ買ってません。途中で挫折しました。 やったところまでのメモ。

purrr 0.2.3を使ってみる

なんか意外と変更点多いなと思ったのでリリースノートを眺めてみます。

GitHub検索APIでGitHub上のRパッケージを見つけるには?

R API

Gepuro Task Viewsがあるでしょ、というツッコミが入りそうですが、意外とAPIでできたりしないかな?と思ったのでやってみた時のメモです。 結果とかコードはここに散らばっています(未整理):

メモ:世界で最もミニマルなRパッケージをつくる

R

まったく訳に立たない知識。 RのパッケージにはDESCRIPTIONとかNAMESPACEとかRファイルとかいろいろありますが、パッケージとしての体を成す限界はどこなのでしょうか。やってみた感じ、どうやらDESCRIPTIONとNAMESPACEさえあればいいようです。 つくってみ…

メモ:stringrでGitHubの検索APIが受け付けるぎりぎりの長さにクエリを切り詰める

レコード店でマイナーなCDをディグるときのように、GitHubの検索APIでマイナーなファイルを探したい。そんな日もあるでしょう。

kazutan.Rでdplyrのselectとmutateのセマンティクスの違いについてLTしてきました

「Rを用いたデータハンドリングと可視化」ハンズオン&LT(a.k.a. kazutan.R)でLTしてきました。 speakerdeck.com

Symantec系列CAの証明書がエラーになったりするのは少なくとも「2017年8月8日」からではないっぽい?

追記(2017/7/26): Twitterでご指摘いただきましたが、7/19に流れたのはSymantec側からの提案なのでスケジュールが後ろ倒しになるかどうかはわかりません。すみません、あれを流しているのはGoogleの人だとばかり思いこんでいましたが、Symantecの人でした…

httrのOAuth1.0のバグが直ったのでrtweetもガンガン使っていきましょう

httrがメンテされてないっぽい、という絶望をちょっと前に吐露しましたが、 なんと、httr2はまだ先ということでhttrのメンテが再開されました!

Tokyo.RでggjoyについてLTしてきました。

最近はやりのjoyplotを描くパッケージggjoyについてLTしてきました。

海外R界のはてなブログことRbindにblogdownでブログをつくる

「R界のWordpress.com/Medium」的なものを目指すRbindというプロジェクトがあります。knitrの開発者として有名なYihui Xieさんがプロジェクトを引っ張っています。解説はkazutanさんの記事が参考になります。 RbindにはすでにYihui、Romain François(Rcppが…

CRANにないパッケージに依存しているCRANパッケージ

R

たぶんWindowsだけだと思うんですけど、最近パッケージをインストールしようとするとこんな警告出ませんか? Warning: unable to access index for repository http://www.stats.ox.ac.uk/pub/RWin/src/contrib: cannot open URL 'http://www.stats.ox.ac.uk…

メモ:dplyrのrow_number()の実装を追う

このissueを解決してなんかコントリビュート感を出したい。が、C++力なさすぎて実装をまったく追えないのでメモ。

「Rによる自動データ収集: Webスクレイピングとテキストマイニングの実践ガイド」(共立出版 2017)を読んだ。

著者陣からご厚意によりオシャレ!デカイ!アツイ!と話題の「Rによる自動データ収集: Webスクレイピングとテキストマイニングの実践ガイド」を頂きました。ありがとうございます!!! Rによる自動データ収集: Webスクレイピングとテキストマイニングの実践…

PowershellとImagemagickで複数の画像ファイルを一括変換する

まずはImagemagickをインストールします。 www.imagemagick.org

Rのパッケージをつくるとき、NAMESPACEにimportFromを書くか::を使うのかどっちがいいかという回りくどい話

R

個人的な見解を書いておきます。

Rでインボリュート曲線を波打たせて人の顔っぽいのを描く

タイトルどう書けばいいのかわからなかったんですが、要はこれをRでやりたいという話です。途中までやったのでメモ。 Mathematicaを使って,シュレーディンガーの顔をこのようなアニメーションにされたユーザの方がいらっしゃいます。コードも掲載されていま…

メモ:ggplot2で端っこの方にラベルを付けたいときはInfにしてhjust/vjustで調整する

こんな感じ。もっとうまい方法がある気もしつつ。 library(tidyverse) set.seed(19) d <- tibble( value = rgamma(10000, shape = 1) ) q <- quantile(d$value, probs = 0:4*0.25) l <- tibble(label = names(q), value = unname(q)) ggplot() + geom_densit…

dplyr 0.7.0を使ってみる

注:これは2017/04/15に公開した「dplyr 0.6.0-rcを使ってみる」という記事を加筆修正したものです。

ggplot2で一部の系列だけハイライトするのに便利なパッケージをつくりたい

ggplot2を使っていると、こんな感じのもじゃもじゃしたデータに出会うことがあります。データの系列が多すぎるともう色が見分けられなくてあんまり意味をなしません。 library(tidyverse) set.seed(1) d <- tibble( idx = 1:10000, value = runif(idx, -1, 1…

2017/05/19にLet's Encryptで起こっていた障害についてのメモ

5/19にLet’s Encryptで障害が起こっていました。その原因と、付随して起こっていたらしいOCSP Stapling絡みのゴタゴタについてのメモ。

メモ:dplyr 0.6.0は、select()するだけならtidyevalいらないっぽい

dplyrがもうCRANにsubmitされたという噂を聞いてNEWS.mdを読んでたら、こんなことが書かれていました。 select() (and the internal function select_vars()) now support column names in addition to column positions. As a result, expressions like sel…

メモ:カテゴリごとにデータフレーム単位で処理をしたいときはdplyr::do()とsplit() + purrr::map()のどちらが速い

追記(2017/07/26): コメント欄で指摘いただいたのでmap_df()を使わないバージョン(f_split2())を追加しました。これはmap_df()が遅いというより、split()した数だけ新しくtibble()をつくるのでその時間だろうなと推測しています。 ベクトルを引数に取る…

メモ:WannaCryの送金データをblockchain .infoのAPIから取ってきてグラフを描きたい

追記(2017/05/21): ツイートの主によるやり方解説ブログはこちら。 これを描きたい。が、元データはどこを見ればいいのかよくわからず調べた時のメモ。 The #wannacry attackers — if they can cash out before authorities find them — just topped $35K…