2020-01-25

メモ：Manjaro Linux 18.1.0でR CMD checkをするために必要なTeX環境

Manjaro Linux R TeX

なんかいろいろつまづいたのでメモ。結論としてはたぶんこう。

sudo pacman -Syu texlive-core texlive-fontsextra qpdf aspell-en

2020-01-16

メモ：active bindingは上書きしようとしても発動する

tidyeval R

まあそらそうやろ、という感じですが。忘れそうなのでメモ。

2020-01-10

メモ： GitHub Actionsでpkgdownサイトをビルドする

R GitHub Actions

これを使いたい。

2020-01-08

Apache ArrowのRパッケージでfactorを含んだデータもParquetファイルに読み書きできるようになりました

R Apache Arrow

1ヶ月前に、「Apache ArrowでParquetを読み書きするときfactorを扱う方法がよくわからない」みたいなことをゴニョゴニョ書きましたが、

直りました。

2020-01-07

ggplot2 v3.3.0を使ってみた

ggplot2 R

ggplot2 v3.3.0のリリースが近々予定されています。新機能がいろいろあるのでかいつまんで紹介します。

詳しくはNEWS.mdをご参照ください。

2019-12-23

世の中には2つの種類の引数がある、必須の引数と必須ではない引数だ。

R tidyverse

何を当たり前なことを、と思うでしょうか。しかし、Rにおいてこれはそんなに簡単なことではありません。

Tidyverse design guideは、第|||部まるまる、8章分を割いて関数のデフォルト値がどうあるべきかについて議論しています。それは、関数のデフォルト値が重要であるとともに、静的型付け言語ではないRではどうがんばっても限界があるところだからです。

とはいえ、原則は10章のタイトルになっている次のひとことだけです。これだけ覚えておけば間違いありません。

2019-12-17

そろそろRユーザーもApache ArrowでParquetを使ってみませんか？

Apache Arrow R

先日、Apache Arrow東京ミートアップ2019で「RとApache Arrow」というタイトルで発表してきました。あと、Japan.RでもApache ArrowについてLTしました。

話したこととしては、

arrowパッケージを使うとParquetファイル（後述）の読み書きができる
sparklyrパッケージが内部でApache Arrowを使うようになって、R↔Spark間のデータのやり取りが高速になった
Arrow Flightがもっと一般的になれば、JDBCやODBCを使わなくてもデータベースからデータを取ってこれるようになる

という感じで、個人的にいま強調したいのは1.です。とりあえずParquetファイルの読み書きというのがRユーザーにとって一番わかりやすいメリットなので、そこをきっかけにみんなApache Arrowにズブズブになって、もっと世の中のシステムがApache Arrowに対応しだしたときにスムーズにデータを交換したり共有したりできればよさそう、と思っています。

図にして表すとこんな感じです：