Apache Arrowの現状確認(2018年7月)

追記(2018/07/18): すみません、Twitter上でいろいろ間違えている部分をご指摘いただきました(ありがとうございました)。 コピーしなくても計算はできる ただし結果をメモリ上に上書きすることはできない GandivaはArrowにマージされのを目指している …

メモ:Rの関数の引数

R

よく分からない質問が来たのでメモ。 f <- function(x ..., y=NA, z=0)が良さげですよ。参照: https://t.co/ERf8JBCo5U#yutaniR https://t.co/wcU0bruxUY— Shinichi Takayanagi (@_stakaya) 2018年7月12日

ggplot2 3.0.0を使ってみた

(この記事は「ggplot2 2.3.0(RC版)を使ってみた」として2018/05/27に公開していたものです。バージョン3.0.0としてリリースされたのでタイトルを変えました) ggplot2 3.0.0がリリースされました。例によってこのニュースを追ってみます: 公式のアナウン…

メモ:ggplot2::geom_sf()が遅い場合

ここでいう遅い、というのは、 plot()と比べて geom_point()、geom_line()、geom_polyon()と比べて という意味。

メモ:ggplot2::geom_sf()の背景にOpenStreetMapの地図画像を使いたいときはggspatial::annotation_map_tile()

ggspatialがsf対応したらしい。このパッケージはところどころイケてない感もあるけど*1、まあでも自分でパッケージつくるよりは楽そうなので、まあ使うかーという感じ *1:とりあえず、ライセンス表示つけてほしい...

RユーザのためのRStudio[実践]入門 という本が出ます。

というタイトルでみんな揃えているようなので、合わせてみました。↓この本(通称「宇宙本」)です。 もう紹介ポイントはだいぶ出尽くしている感じはするので、詳しい内容よりもエモみ重点で書きます。

メモ:ggplot2::geom_sf()でポリゴンの境界に点線を引きたいときはsf::st_union()とsf::st_line_merge()

geom_sf()と戯れていて、ちょっと点線でも引いてみるか、と思ってやってみると、なにこれ??という感じの汚い線の図になりました。 library(ggplot2) library(sf) #> Linking to GEOS 3.6.1, GDAL 2.2.3, proj.4 4.9.3 nc <- sf::st_read(system.file("shap…

メモ:MinGWからEmacs+ESSでRのコードを書くときに設定する環境変数

MinGWでビルドしたEmacsを使ってるんですが、依存ライブラリとかの関係でmsys64.exeから立ち上げる必要があります。

gghighlightがあらゆるGeomをハイライトできるようになりました(たぶん)

gghighlightパッケージは、データ系列が多すぎるとき、いい感じに一部をハイライトしてくれるパッケージでした。 もうすぐリリース予定のggplot2 2.3.0の新機能を使ってパワーアップ中です。 詳しい解説はおいおい書くとして、簡単に紹介だけします。

ggplot2::geom_sf()を使ってみる

ggplot2 2.3.0全体の変更点については以下に書きましたが、その中でも目玉の一つgeom_sf()について軽く紹介します。

メモ:ggplot2でGeomの直接の子クラスはいくつあるかを調べる

たとえば、GeomBarはGeomRectの子クラスです。 class(GeomBar) #> [1] "GeomBar" "GeomRect" "Geom" "ggproto" "gg"

メモ:リストの要素を消したいときはx[i] <- NULL、NULLを代入したいときはx[i] <- list(NULL)

R

ってFAQに書いてあるのを毎回忘れるのでメモ。 In R, if x is a list, then x[i] <- NULL and x[[i]] <- NULL remove the specified elements from x. The first of these is incompatible with S, where it is a no-op. (Note that you can set elements to…

メモ:環境をコピーしたいときはrlang::env_clone()

R

環境、というかggplot2のレイヤーをコピーすることを考えます。 まず、1つレイヤーをつくります。 library(ggplot2) d <- data.frame( x = 1:4, y = 1:4 ) l1 <- geom_point(d = d, aes(x, y))

メモ:行列を列ごと・行ごとのベクトルのリストに変換したいときはsplit()にcol()/row()

R

combn()は行列を返すけど、ベクトルのリストを返してほしいんだよなー、と思っていろいろ調べてた時のメモ。 col()/row()でそれぞれ列と行のインデックスが取れるので、これをsplit()に渡せば分割できる。簡単ですね。

「再現可能性のすゝめ―RStudioによるデータ解析とレポート作成― 」(高橋康介 著)を読んだ。

著者の方のご厚意でこの話題の本を頂きました。 今知るべき再現可能性についての知識がコンパクトにまとめられている良書です。

ドーモ、dplyr=サン、春の新作*lyrパッケージ「njslyr」です◆

という、ニンジャが出てきて殺すパッケージづくりを通してDBI・dbplyrのバックエンドについて手取り足取り解説する記事を書きたかったんですが、残念ながら今日という日に間に合いませんでした。 去年の二番煎じではありますが、ひとまずパッケージはつくっ…

メモ:MinGWでEmacsをビルドする

WSLでよくない?という話なんですが、よくよく考えるとRを使うには依存ライブラリとかいろいろ入れないとだめでめんどくさいなあと。ということでやってみた時のメモ。

メモ:WSLでEmacs+ESSを使う(ESS導入まで)

前回の続き。

メモ:WSLでEmacs+ESSを使う準備

Emacs歴実質3日目くらいです。↓を読みながら勉強中。変なとこあればやさしく突っ込んでもらえれば... [改訂新版]Emacs実践入門―思考を直感的にコード化し、開発を加速する (WEB+DB PRESS plus)作者: 大竹智也出版社/メーカー: 技術評論社発売日: 2017/09/22…

メモ:S3のメソッドディスパッチ用に.__S3MethodsTable__.という環境があるっぽい

R

r-wakalangで、 よくわからないんですけど、S3のメソッドディスパッチの対象になるのは、 S3method() で明示的にメソッドとして登録されたもの サーチパス上にある 関数名.クラス() というフォーマットの名前の関数 で、前者は上書きできない、あるいは先に…

メモ:RのREPLのコードを追ってみる

R

AtsushiさんのQiita記事を読んでちょっと興味が湧いたので調べたことをメモ。

メモ:lubridateパッケージで区間を指定したいときはperiod、ざっくり時刻計算したいときはduration

任意の時刻型について、floor_date()で区切った区間のちょうど真ん中を返す関数を作りたい。こんな感じの。 library(lubridate) mannaka <- function(x, binwidth_hour) { floor_date(x, hours(binwidth_hour)) + hours(binwidth_hour)/2 }

ls()についてのもうちょっと回りくどい説明

R

これのもうちょっと回りくどい版の記事を書きます。

stringr::str_replace()には置換文字列だけではなく関数も指定できる

stringrパッケージのstr_replace()/str_replace_all()は、バージョン1.2.0からreplacement引数に関数を取ることができます。 これを使うと、「指定した正規表現にマッチした部分だけ大文字にする」みたいなことが簡単にできます。

ネットワークセキュリティ関連で追っているTwitterアカウント・ブログ

を聞かれる機会があったので、主なものをメモっておきます。

インフラエンジニア5年目くらいまでで読んでよかった本・ドキュメント

たぶんこれは、もうちょっと読んでもらおうと思ったら「未経験からインフラエンジニア3年目、読んでよかった本」みたいなタイトルであるべきで、しかし致命的なことに俺はそういうフレッシュなことを書くにはちょっと年を取りすぎてしまってるんですよね(た…

OECDパッケージを使ってRで日本の労働生産性のグラフを描く

R API

なんかこれ↓が話題のようなので、とりあえず元データをふわっと探してみました。 日本経済研究センター JCER

rtweetパッケージでTwitter APIからデータを取るのが超お手軽になってた

Twitter APIからデータを取得するにはrtweetパッケージを使おう、という話は前に書きましたが、Twitter APIを使うにはトークン取得のために各自でTwitterアプリを登録する必要があり、やや面倒でした。 例えば2017年9月のこの記事ではその登録の仕方を詳しく…

メモ:Windows Subsystem for LinuxのUbuntu 16.04でVimをビルドする

この記事をもうちょい見返してみる。

usethis::use_dev_version()が、おれの道を教えてくれる。(あるいは、CRANにリリースした後にやるべきこと)

よくきたな。おれはyutannihilationだ。 この記事を読んでいるということは、おまえはパルプRパケージ作者であり、すでに闇と向き合いCRANデビューを果たしていることだろう。