備忘ログ

チラシの裏的備忘録&メモ

第111回R勉強会@東京(#TokyoR)に参加(聴講)した

第111回R勉強会@東京(#TokyoR)に参加(初心者セッション・応用セッション・LT聴講した)した。

 

tokyor.connpass.com

 

初参加だったが、全体的な感想としては、「Rのことを日本語で喋っているのを聞くのは楽しいな」と思った。とても楽しい会だった。運営の方々のご尽力に感謝。

またオンライン開催なのは、現地参加が難しい状況ではとても嬉しい。

 

それぞれセッションの感想を思い出しながら雑記していく。

 

初心者セッション

初心者セッションは@y__mattu氏のR入門〜データハンドリング基礎と、@kilometer00氏の分散分析の基礎だった。

想定される初心者(対象)はRを初めて触るけどちょっと難しいなと感じている層(みたいなことを冒頭喋っていた気がする)のよう。

明確に話しはされていなかったと思うが、おそらく、想定対象者層としては大学等で全体講義としてRに触れる機会があったが、各講座(ゼミ)で実際にRでなにか統計処理しようと思った時に「はて、困ったな」というくらいのレベルなのかなと思った。

どういう情報をどういう粒度で限られた時間内で伝えるのか、そういうところは難しそうだなと思った。また、膨大な情報を伝える時に対面式じゃないので、聴講者の反応がわからないのでどこを重点的に説明したら良いのか、ここは少し説明を省いても良いのかが難しそうだと思った。

 

応用セッション

@paithiov909氏のRを使って短歌の「詩的度」を測るは、興味深いアプローチだなと思った。極めて質的なものを測るというところ、それをRを使って行っているのは面白いと感じた。

あと、日本語の文節区切りを{stringi}パッケージの関数で実行するというものが途中で紹介されており、{stringi}すごすぎじゃないか?と思った。tokenizer積んでるんだろうか?{stringi}パッケージは文字列処理でできることがかなり多くみんな使いこなせてるの、すごいなといつもびっくりする。

ところで全然関係ないが、{stringi}パッケージのアップデートが降ってくる時に、ソースからコンパイルするとかなり時間がかかるのは自環境が貧弱だからだろうか?

 

@Atsushi776氏のNeovimでR言語をやってこうとしてる話はRのエディタをNeovimとしてやっていこういう話だった。いろいろなエディタを試して旅をしている人を見るとすごいなと思うし、そういう人の話を聞いたり記事を読むのは楽しい。「なんたってかっこいい。」たしかに……。

自分はRを書くときにはRStudioを使っているが、「ここがもう少し◯◯だったら」と思うこともままあるが、つるしの状態でかなりRに最適化されているRStudioは離れがたい。ユーザー数も多く、自分がハマったことは大抵誰かもハマっていて調べると解決策が出てきたりする確率が高いのもいいと思ってる。

そんなこと思ったら、昔、Linuxディストリビューションの旅をしていた時に、いろいろなディストリビューションを試した結果、最終的につるしの状態でいい感じで比較的ユーザー数も多いUbuntuに落ち着いていたことを思い出した(環境壊して再インストールをしばしばしていたというのもある)。Gentooとか使えればかっこいいなと思うが、使い続けることやら考えたら自分はなんとなくメジャーどころに落ち着いてしまうんだなぁ、と自分を振り返った。

 

@yutakanzawa氏のggplot2のアノテーション技法はggplot2にどうアノテーションをつけるか、注意点などの話だった。アノテーションのつけすぎに注意という話があった。たしかにアノテーション・修飾に凝り始めると細かいところの調整に時間を取られ、グラフそのものはできているのに本質的じゃない作業に没頭しがちだと思った。一旦出力してプレゼンテーションソフトでアノテーション付けたらいいんじゃないかという話もあった。

確かに、どこまでグラフをggplot2やR内でこだわるのかと言うのは作業量を変える問題になると思う。

ただ個人的には時間が許す限りにおいては、できる範囲でggplot2内で完結したくて、そのひとつはggplot2で作成したグラフを出力したものにあとからプレゼンテーションソフトなどでいろいろつけると少し解像度が違ったりして若干違和感を感じることがあることが理由としてはある。もう一つの理由としては、後で同じようなグラフを書く時に、アノテーション系も同じように出力するためにはggplot2で完結していないと後で同じ様なグラフを作る時に、コードを再利用しても最後のところで手作業が発生するのが少し嫌だなと思うから。

 

LT

@KunisatoY氏のpsyinfrでらくらく研究室運営は、RとGitHubをつかって研究フローの研究室内でのお約束をみんな同じようにできるようにしようという取り組みだった。良い取り組みだなと思ったけど、実運用的には前年度はよかったが今年度はいまいちだったみたいな話だった。

複数人のフローの標準化って難しいよねって思った。

 

@florets1氏の請求と支払を照合する技術は2つのデータフレームに別れた請求と支払いのデータを{dplyr}パッケージのjoin_*()関数でガッチャンコする話だった。join_*()関数便利だよね、と思った。

 

@u_ribo氏のmandaRa: R言語の悟りのための修行の道場は新しいRの日本語の情報をまとめたウェブページを作ろうという話だった。r-wakalangは登録しているユーザーしか中の情報にアクセスできない上に、一定期間で情報が消えてしまう問題をかかえており、RjpWikiもやや情報として古い傾向にあるので新しいRの情報をまとめたウェブページを作ろうという話のよう。

確かに散逸しがちな情報が一箇所にまとまっているとアクセスしやすいかと思う。また、インターネット上でオープンに情報が見られる状態というのはいいと思う。検索エンジンで日本語で検索してわかることが増えるのはいいことだと思う。ヘルプドキュメントや公式ドキュメント、Stack Overflowを見ればいいとかあるが、やはり日本語で情報が読めるというのは大事だと思う。ただ、wiki的にみんなで情報集めて(記事書いて)作っていいきましょうというといふうだけどもどういう粒度のどういう情報を集めていくのかなーと思った。とてもいい試みで応援したいが、特に手持ちもない、というか詳しい人が記事を書いているスタイル?なので特に書けそうなこともないしとりあえず見守っていこうかと思った。

 

@bob3bob3氏の『データ可視化学入門』をPythonからRに翻訳した話は、Pythonでのグラフ作成コードをRに翻訳したとう話で、AIに翻訳を協力してもらったというところが、現代の潮流に乗ってるなと思った。また、AIの出したコードを確認して、Rっぽさを入れていく作業があったというのは興味深かった。

 

その他

オンライン懇親会がどういう感じなのかわからなくて、特に喋れることもないしなー懇親会怖っとなって懇親会には参加しなかった。

 

あの記事を書いている人の声ってこんな感じなんだ、というか、当たり前だけど実在する人間なんだなという、謎の感想を抱いた。

周りにRについて話をする人がいないので、Rについて話をしている人の話を聞くだけで楽しかった。

 

事情があってスマホからの参加で、スマホのZoomを使いこなせなかったのもあるが、自分が悪いのだがチャットに貼られた資料や最後のアンケートのURLを拾えなかった。

この大SNS時代にX(旧Twitter)をやっていないので、X検索も少し手間取るので、資料をCompassから参照できるようにしてくれるか、URL等をCompass上に記載してくれると嬉しさ倍増だと思った。