R
こういうデータが手元にあるとします。
magrittr 2.0のブログ記事で仄めかされていたように、base Rに(というかRの文法レベルで)ネイティブのパイプ演算子|>が入るようです。 それがとうとう開発版のRに実装された、というツイートでTLがざわついていたので触ってみました。 #RStats community, …
parse_date_time()でexact=TRUEを指定したときとしないときの挙動で悩んだのでメモ。 追記(2020/11/3): macはまた違う挙動らしいです(参考)
昨日、Tokyo.Rでrayshader入門というタイトルでLTしてきました。 これはその中のスライドの1枚ですが、つくりながら「ラスタデータ系のパッケージなんでこんないっぱいあるの??」と思ったので、ざっくり調べたことと感想をメモっておきます。
across() の紹介はググればすでに記事がいくつもあるので私が書くことはあまりないんですが、知られてなさそうな点をかいつまんで紹介します。
昔こんな記事を書いたんですが、なんと rowwise() は dplyr 1.0.0 で不死身になって還ってきました(予想が外れてすみません...)。そのあたりを解説します。 例によって英語が苦でない人は公式ブログをどうぞ。
少し前、 ggplot2 の開発版に Claus Wilke が半年くらい開発していた pull request がマージされ、sf 以外のオブジェクトを簡単に扱えるようになりました。 Spatial plotting just improved a lot in the development version of ggplot2. In a nutshell, yo…
dplyr 1.0.0 がリリースされてもう1ヶ月。日本語でもちらほら紹介のブログ記事やスライドが出てきています。 が、意外と summarise() の挙動変更に触れたやつないなと思って、軽く紹介します。 ちなみに、この記事で取り上げた quantile() の活用例は公式ブ…
The Economist誌がインスタにグラフを投稿する時に気をつけていること、という記事がちょっとバズってたので、 This made me think about how I can post charts to Instagram from RStudio... https://t.co/vXM7TYWfr5— Hiroaki Yutani (@yutannihilat_en) …
conflrで、「すでに同名のページがあったときだけ、上書きしていいかを確認するダイアログを出す」ということをしたかった。 軽く調べた感じ、actionButton()のinputIdを動的に与えるのが簡単そうだった。 以下の例だと、confirm と ok という2つのイベント…
なんかいろいろつまづいたのでメモ。結論としてはたぶんこう。 sudo pacman -Syu texlive-core texlive-fontsextra qpdf aspell-en
まあそらそうやろ、という感じですが。忘れそうなのでメモ。
これを使いたい。
1ヶ月前に、「Apache ArrowでParquetを読み書きするときfactorを扱う方法がよくわからない」みたいなことをゴニョゴニョ書きましたが、 直りました。
ggplot2 v3.3.0のリリースが近々予定されています。新機能がいろいろあるのでかいつまんで紹介します。 詳しくはNEWS.mdをご参照ください。
何を当たり前なことを、と思うでしょうか。しかし、Rにおいてこれはそんなに簡単なことではありません。 Tidyverse design guideは、第|||部まるまる、8章分を割いて関数のデフォルト値がどうあるべきかについて議論しています。 それは、関数のデフォルト値…
先日、Apache Arrow東京ミートアップ2019で「RとApache Arrow」というタイトルで発表してきました。あと、Japan.RでもApache ArrowについてLTしました。 話したこととしては、 arrowパッケージを使うとParquetファイル(後述)の読み書きができる sparklyrパ…
fgdrパッケージがCRANに登録されたというツイートを見かけて、そういえば試してないなと思って。 国土地理院 @GSI_chiriin が提供する「基盤地図情報」をRで扱うパッケージがCRANに登録されましたコンバートソフトによる変換を使わずに直接読み込めます! ht…
protoliteパッケージがmapbox vector tileを読めるようになったらしい、というツイートを見ました。 New version for #rstats protolite: Highly Optimized Protocol Buffer Serializers https://t.co/qEoFHkyUV9. This version adds support for reading mv…
ggplot2 3.2.0がリリースされてはや1カ月ちょっと。おそらくみんなが気付いていないマイナーな変更の一つに、 facet_wrap() and facet_grid() now automatically remove NULL from facet specs, and accept empty specs (@yutannihilation, #3070, #2986). (…
第79回Tokyo.Rでtidyrの次期リリースの目玉機能、pivot_wider()/pivot_longer()について発表してきました。
tidyr v1.0.0がそろそろリリースされそうな雰囲気を感じるのでそろそろ重い腰を上げて使ってみます。 ちなみにこのv1.0.0というバージョンは、stableになったという意味ではなくて、新機能てんこ盛りなのでメジャーバージョン上げとくか、というノリなんだと…
追記(2019/04/26): DataCampのCEOが辞任しました。が、これで終わりではなさそう... DataCampは、データサイエンスに特化したオンライン学習サイトだ。特にR界隈では、有名人が講師陣に名を連ねていて人気がある。 そこでコースを持っているNoam Ross氏が…
CARとかCDRとかいうのはLISP由来のなにからしい。 この図を見てわかった気持ちになった。
っていう報告は会社のブログの方に書く予定なんですけど、まあ個人ブログにもメモ程度に書いとくか、ということで。 RStudio社が主催するRとRStudioに関するカンファレンスrstudio::confで以下のポスターを発表してきました。 (レポジトリ:GitHub - yutann…
困惑しそうな変更点の話は書いたので、次はテンション上がりそうな新機能の話を書きたいと思います。
更新(2019/02/19): いろいろ議論があって、group_by()のデフォルトの挙動はこれまでと同じ(empty groupはつくらない)ようになりました。 group_by()するときに.drop = FALSEとした場合だけ、empty groupがつくられます。 dplyr 0.8.0がもうすぐ(来年1…
ほんとに私でいいんだろうか...という気持ちでしたが、Apache Arrow東京ミートアップ2018でRとApache Arrowの現状と未来の妄想について話してきました。 色んな分野の話を聞けてとても勉強になりました。 たぶんこのブログを読むのはR界隈の人だと思うので、…
第74回R勉強会@東京で、「Yet Another Introduction to tidyeval」というタイトルで発表してきました。 申し込み時は「tidyeval入門以前」というタイトルにしてたんですけど、別にこれを知らなくてもtidyevalにはするっと入門できます。ビビらせてしまってす…
TL;DR quo_name(): 名前のついていない引数に名前をつけるときに使う(例: data.frame(a)とやるとaが列名になる、みたいなこと) quo_label(): quosureや表現式を短めの文字列に変換するときに使う quo_text(): quosureや表現式を省略なしの文字列に変換す…