R

『RユーザのためのRStudio[実践]入門』の改訂2版が出ます。

『RユーザのためのRStudio[実践]入門』(通称「宇宙本」)の改訂版が出ます。 私は引き続きdplyr/tidyrの章と、追加された付録の片方(lubridateについて)を担当しています。 カバーも装い新たになったので、愛称は#宇宙船本になりました(まあ好きに呼んで…

R 4.1で入るnative pipe(|>)の現状確認

いよいよR 4.1のリリースが迫っています。native pipeって何?という方は、以前書いたこの概要をご参照ください。後述するように「第一引数以外に渡したいときは関数でラップする」のところは多少進展がありましたが、基本的な部分は同じです。

Rの32bit版WindowsのサポートはR 4.1.xまで

R

R 4.1が来月リリースされますが、リリースノートの1番上にこんなことが書かれています。 32bit版Windowsのサポートは4.1系で終了、つまり、マイナーバージョンは年に1度のペースで上がるので4.2がリリースされる次の春までで終わります。 FUTURE DIRECTIONS …

RStudio初心者がまず覚えるべきたったひとつのキーボードショートカット

まじで初心者にはこれを押していくべきではないかと思ってるんですが、意外と知名度低そうな気がしたので釣りっぽいタイトルにしてみました。すみません。 それはなにかというと、

メモ:R 4.0.4で日本語の文字列がうまく表示されない問題について

R

(免責事項: WindowsやmacOSで動作確認するのがめんどくさくてうろ覚えで書いています。間違ってたらご指摘ください) 裏Rjpwikiで言及されていて知った人も多そうですが、R 4.0.4は日本語を含むマルチバイト文字の表示にバグがあります。 具体的には、次の…

メモ:dplyr・ggplot2 で {{ }} を使う

追記(2021/03/26): 開発版では「facet_*() の場合」も動くようになりました。 こういうデータが手元にあるとします。

R 4.1で入ると噂の|>が開発版のRに入ったので触ってみた。

R

magrittr 2.0のブログ記事で仄めかされていたように、base Rに(というかRの文法レベルで)ネイティブのパイプ演算子|>が入るようです。 それがとうとう開発版のRに実装された、というツイートでTLがざわついていたので触ってみました。 #RStats community, …

メモ:lubridateでAM/PMを含む時刻をパースする時は%pじゃなくて%Opが正しそう

parse_date_time()でexact=TRUEを指定したときとしないときの挙動で悩んだのでメモ。 追記(2020/11/3): macはまた違う挙動らしいです(参考)

RでGIS系のラスタデータを扱うのにraster、stars、terraのどれを使えばいいの?問題についてのメモ

昨日、Tokyo.Rでrayshader入門というタイトルでLTしてきました。 これはその中のスライドの1枚ですが、つくりながら「ラスタデータ系のパッケージなんでこんないっぱいあるの??」と思ったので、ざっくり調べたことと感想をメモっておきます。

dplyr 1.0.0を使ってみる: across(), rename_with()

across() の紹介はググればすでに記事がいくつもあるので私が書くことはあまりないんですが、知られてなさそうな点をかいつまんで紹介します。

dplyr 1.0.0を使ってみる: rowwise()

昔こんな記事を書いたんですが、なんと rowwise() は dplyr 1.0.0 で不死身になって還ってきました(予想が外れてすみません...)。そのあたりを解説します。 例によって英語が苦でない人は公式ブログをどうぞ。

ggplot2 で地図を描くとき sf 以外のオブジェクトも簡単に扱えるようになったので試してください

少し前、 ggplot2 の開発版に Claus Wilke が半年くらい開発していた pull request がマージされ、sf 以外のオブジェクトを簡単に扱えるようになりました。 Spatial plotting just improved a lot in the development version of ggplot2. In a nutshell, yo…

dplyr 1.0.0 を使ってみる: summarise()

dplyr 1.0.0 がリリースされてもう1ヶ月。日本語でもちらほら紹介のブログ記事やスライドが出てきています。 が、意外と summarise() の挙動変更に触れたやつないなと思って、軽く紹介します。 ちなみに、この記事で取り上げた quantile() の活用例は公式ブ…

chromoteパッケージでRからInstagramにggplot2を投稿する

The Economist誌がインスタにグラフを投稿する時に気をつけていること、という記事がちょっとバズってたので、 This made me think about how I can post charts to Instagram from RStudio... https://t.co/vXM7TYWfr5— Hiroaki Yutani (@yutannihilat_en) …

メモ:Shinyで条件に応じてactionButtonのactionを変える

conflrで、「すでに同名のページがあったときだけ、上書きしていいかを確認するダイアログを出す」ということをしたかった。 軽く調べた感じ、actionButton()のinputIdを動的に与えるのが簡単そうだった。 以下の例だと、confirm と ok という2つのイベント…

メモ:Manjaro Linux 18.1.0でR CMD checkをするために必要なTeX環境

なんかいろいろつまづいたのでメモ。結論としてはたぶんこう。 sudo pacman -Syu texlive-core texlive-fontsextra qpdf aspell-en

メモ:active bindingは上書きしようとしても発動する

まあそらそうやろ、という感じですが。忘れそうなのでメモ。

メモ: GitHub Actionsでpkgdownサイトをビルドする

これを使いたい。

Apache ArrowのRパッケージでfactorを含んだデータもParquetファイルに読み書きできるようになりました

1ヶ月前に、「Apache ArrowでParquetを読み書きするときfactorを扱う方法がよくわからない」みたいなことをゴニョゴニョ書きましたが、 直りました。

ggplot2 v3.3.0を使ってみた

ggplot2 v3.3.0のリリースが近々予定されています。新機能がいろいろあるのでかいつまんで紹介します。 詳しくはNEWS.mdをご参照ください。

世の中には2つの種類の引数がある、必須の引数と必須ではない引数だ。

何を当たり前なことを、と思うでしょうか。しかし、Rにおいてこれはそんなに簡単なことではありません。 Tidyverse design guideは、第|||部まるまる、8章分を割いて関数のデフォルト値がどうあるべきかについて議論しています。 それは、関数のデフォルト値…

そろそろRユーザーもApache ArrowでParquetを使ってみませんか?

先日、Apache Arrow東京ミートアップ2019で「RとApache Arrow」というタイトルで発表してきました。あと、Japan.RでもApache ArrowについてLTしました。 話したこととしては、 arrowパッケージを使うとParquetファイル(後述)の読み書きができる sparklyrパ…

メモ:fgdrパッケージで基盤地図情報のDEMデータをstarsとして読み込みrayshaderする

fgdrパッケージがCRANに登録されたというツイートを見かけて、そういえば試してないなと思って。 国土地理院 @GSI_chiriin が提供する「基盤地図情報」をRで扱うパッケージがCRANに登録されましたコンバートソフトによる変換を使わずに直接読み込めます! ht…

メモ:地理院地図ベクトルタイルをgeom_sf()でプロット

R GIS sf

protoliteパッケージがmapbox vector tileを読めるようになったらしい、というツイートを見ました。 New version for #rstats protolite: Highly Optimized Protocol Buffer Serializers https://t.co/qEoFHkyUV9. This version adds support for reading mv…

ggplot2 3.2.0からfacet_grid()、facet_wrap()がNULLを受け付けるようになった

ggplot2 3.2.0がリリースされてはや1カ月ちょっと。おそらくみんなが気付いていないマイナーな変更の一つに、 facet_wrap() and facet_grid() now automatically remove NULL from facet specs, and accept empty specs (@yutannihilation, #3070, #2986). (…

Tokyo.Rでtidyr::pivot_longer()、tidyr::pivot_wider()について発表してきました

第79回Tokyo.Rでtidyrの次期リリースの目玉機能、pivot_wider()/pivot_longer()について発表してきました。

tidyr v1.0.0?を使ってみた。

tidyr v1.0.0がそろそろリリースされそうな雰囲気を感じるのでそろそろ重い腰を上げて使ってみます。 ちなみにこのv1.0.0というバージョンは、stableになったという意味ではなくて、新機能てんこ盛りなのでメジャーバージョン上げとくか、というノリなんだと…

DataCampの講師が「私のコースを受講しないでくれ」と言っている。

追記(2019/04/26): DataCampのCEOが辞任しました。が、これで終わりではなさそう... DataCampは、データサイエンスに特化したオンライン学習サイトだ。特にR界隈では、有名人が講師陣に名を連ねていて人気がある。 そこでコースを持っているNoam Ross氏が…

メモ:RのCAR、CDR、CADR、CDAR、CDDR...

R

CARとかCDRとかいうのはLISP由来のなにからしい。 この図を見てわかった気持ちになった。

rstudio::conf 2019でgghighlightについてポスター発表をしてきました

っていう報告は会社のブログの方に書く予定なんですけど、まあ個人ブログにもメモ程度に書いとくか、ということで。 RStudio社が主催するRとRStudioに関するカンファレンスrstudio::confで以下のポスターを発表してきました。 (レポジトリ:GitHub - yutann…