dplyr 0.8.0を使ってみた(group_by()のbreaking changes編)

dplyr 0.8.0がもうすぐ(来年1月上旬?)リリースされます。

この公式記事を読んでおけばいいかと思ったんですが、今回は、group_by()に大きな変更がいくつもあります。 まじで大きな変更なので、「もう俺たちが知っているgroup_by()じゃない」くらいのつもりで臨みましょう。 便利な新機能もあるんですが、それは日を改める*1ことにして、 breaking changeに絞って書きます。

*1:つまり・・・・我々がその気になればこの記事を書くのは10年20年後ということも可能だろう・・・ということ・・・・!

続きを読む

Apache Arrow東京ミートアップ2018で「RとApache Arrow」について話してきました

ほんとに私でいいんだろうか...という気持ちでしたが、Apache Arrow東京ミートアップ2018でRとApache Arrowの現状と未来の妄想について話してきました。 色んな分野の話を聞けてとても勉強になりました。

たぶんこのブログを読むのはR界隈の人だと思うので、興味を持ってもらえそうなトピックだけかいつまんで。 r-wakalangに#arrowチャンネルをつくったので、R界隈のApache Arrowの情報交換とかはそこでやっていきましょうー。

続きを読む

hashicorp/hcl2でHCLファイルをパースする

Goを書いてると、設定ファイルにはHCL使ってみるか、という気分になったりすることがある。 普通に考えるとgithub.com/hashicorp/hclが正解なわけだけど、

を見つけてしまったので使い方のメモ。まだまだexperimentalとはいえ、Terraformに使われてたりするし、まあそんな派手に変更はないのでは?と思っている。

続きを読む

Tokyo.Rでtidyevalが必要な理由について発表してきました

第74回R勉強会@東京で、「Yet Another Introduction to tidyeval」というタイトルで発表してきました。

申し込み時は「tidyeval入門以前」というタイトルにしてたんですけど、別にこれを知らなくてもtidyevalにはするっと入門できます。ビビらせてしまってすみません。。 これは、みんなが知りたいであろうtidyevalの使い方とかではなく、そもそもなぜこんなtidyevalなんていう独自世界をつくろうと思ったの?というのを推理していくというマニアックな発表です。 たぶん誰も求めてないだろうな、と思いつつ、応用セッションあいてるしまあいっか、というつい出来心でやってしまいました。

そんなわけで、「tidyeval入門」は誰かよろしく!

メモ:rlangのquo_name()、quo_text()、quo_label()、as_string()あたりの使い分け

TL;DR

  • quo_name(): 名前のついていない引数に名前をつけるときに使う(例: data.frame(a)とやるとaが列名になる、みたいなこと)
  • quo_label(): quosureや表現式を短めの文字列に変換するときに使う
  • quo_text(): quosureや表現式を省略なしの文字列に変換するときに使う
  • as_string(): シンボルを文字列に変換するときに使う
続きを読む

readrパッケージがWindows上だと日本語のパスを読めない問題の現状

追記(2018/11/23): この問題を修正したバージョンのreadrがCRANでリリースされました!

↓の「それでも直らない問題」は直らないんですけど、とりあえず日本語のパスは読めるようになったはずです。よかった...


今のCRAN版のreadrには、WindowsでR 3.5.0以上だと日本語を含むパスのファイルを読み取れないというバグがあります。 これはGitHub上ではとっくに直したんですが、諸般の事情でリリースされていません。また、解決しそうにない問題もあります。

そのあたりの事情をちょっと説明します。細かいことはいいから解決方法を教えてくれ!という人は「どうすればいいのか」だけ読んでください。

続きを読む