備忘ログ

チラシの裏的備忘録&メモ

2020-01-01から1年間の記事一覧

Rで三桁ごとにコンマが打たれている1,000,000みたいな数字を1000000に変換したい

R

qiita.com この記事をみてふーんって思って、いろいろ考えてみたっていうやつ。 このコードの気になる点を上げると 1,000,000の場合、「1」と「000」と「000」がそれぞれ別の引数として取り扱われている。 そのため、複数データの入力受け付けない。 複数の…

Rで文字列を形態素解析した上で漢数字をアラビア数字に変換する

RでMeCabを使って形態素解析して、MeCabの判定で品詞細分類で数と判定された数を表す漢数字ならアラビア数字に変換し、固有名詞等に判定された漢数字を含む単語はそのまま変換されないで保持するというもの。 {zipangu}の開発版に取り込まれたkansuji2arabic…

zipanguの新しいkansuji2arabic_num()とkansuji2arabic_str()の使い方

{zipangu}の開発版に、漢数字をアラビア数字に変換する新しい関数kansuji2arabic_num()とkansuji2arabic_str()がMergeされたよ!やったね!! github.com ということで使い方(できることできないこと)をまとめてみるよ。 開発版は remotes::install_github…

Rで漢数字からアラビア数字への変換-最終章その1-

前回総集編と言った気がしたが、あれは嘘だった。 相変わらずの{zipangu}ネタ。 漢数字からアラビア数字への変換について、くどくど書いてきたが、こんどこそ最終章のつもり(章って!?ってはなしもある)。意図的に小出しにしているわけじゃなく、思いつい…

Rで文字列中の漢数字を計算してアラビア数字に変換する

追記:途中で総集編とか書いているが、まだ続く。 indenkun.hatenablog.com 追記終わり Rには{zipangu}という日本語まわりの便利パッケージがあり、漢数字をアラビア数字に変換するkansuji2arabicと文字列中の漢数字をアラビア数字に置き換えるkansuji2arabi…

Rの文字列で正規表現での意外な挙動

この間関数を作っているときに、文字列をstringrでいじっているときに、正規表現で文字列をマッチングしたときに自分が想定していたのと異なる挙動をしたのでメモしておく。 indenkun.hatenablog.com 問題となる処理 {stringr}でstr_detctしたときに問題の処…

Rで文字列中のアラビア数字を漢数字に変換する関数をつくった

タイトルのまま、Rで文字列中のアラビア数字を漢数字に変換する関数をつくった。逐字的に変換する関数(例えば64なら六四となる)と、アラビア数字を計算して漢数字に変換する関数(例えば64なら六十四となる)を備えている。 パッケージ化してGithubに公開…

Rでアラビア数字から漢数字に変換する方法を考えてみたその2

追記:いろいろ関数の機能追加したものをパケージ化してGithubに上げた indenkun.hatenablog.com 以前つくった、アラビア数字(算用数字)を漢数字変換する関数を少し改良した。 indenkun.hatenablog.com 具体的には、逐字的にアラビア数字を漢数字に置き換…

Rのバージョンとコードネームまとめ

自分用まとめ Rのバージョンとコードネーム(ニックネーム)とリリース日 Version Code Name Release Date The R-announce Archives(Mailing List Archives) 2.14.0 Great Pumpkin 2011-10-31 https://stat.ethz.ch/pipermail/r-announce/2011/000544.html 2…

Rでアラビア数字から漢数字に変換する方法を考えてみたその1

追記・いろいろ機能追加したアラビア数字から漢数字に変換する関数をパッケージ化してGithubに上げた indenkun.hatenablog.com Rで{zipnagu}というパッケージのkansuji2arabicという関数を使うとアラビア数字が漢数字になる。 そこで逆に、アラビア数字を漢…

Rのzipangu::kansuji2arabicで期待した結果を返さない場合の個人的暫定解決策その2

前にzipangu::kansuji2arabic_allで漢数字をアラビア数字に変換したときに期待する答えを返さないことがあることを書いた。 indenkun.hatenablog.com この記事でもとの関数をいじって10万未満で期待する答えを得られるようになった(zipangu::kansuji2arabic_…

dplyrのmutateってちょっと遅い?

{dplyr}が1.0.0になってacrossが追加されて、*_atや*_all、*_eachがじゃなくてもacrossでやる風潮(?)になって、(もう1.0.2だけど今更)便利だなぁと{dplyr}で遊んでいたら(前々から思っていたけど)*_eachが実は体感できるレベルで一瞬待たされることに…

R 3.6.3からR 4.0.2周りで変更になった因子の扱いについての気づき(ハマった)

mikuhatsune.hatenadiary.com この記事をみて、面白いなぁと思ってやってみたらうまくいったり行かなかったりした(要するにはまった)のでメモ。本旨はR 3.6.3からR 4.0.2周りで変更になった因子の扱いについての気づき。ブックマークしてコメントにメモし…

Rのggplot2でグラフを描いたときに有意差の記号、*とかそういうのをグラフ上に書こうとしたときの方法について

Rのggplot2でグラフを描いたときに有意差の記号、*とかそういうのをグラフ上に書こうとしたときの方法について、私的まとめ。 いつもすぐに忘れてググってる。 グラフにannotation描く動機がなければ興味のない話になっている。自分はこうやってるよというの…

Qittaの「あなたの平均値の計算、本当にできていますか?」をみて-Rでの整数の上限は上限が2147483647、下限が-2147483647で64bitの世界は見れなかった話-

qiita.com Qittaのこの記事をみてRでは……という話をしたいだけ。 やってみたら「やったか……!?」と思ったけど、噴煙の中を覗いてみたら「な、なんだと!?」みたいな感じでできていなかったという感じ。 Rの整数型について調べてわかったことと、桁数の扱いがわ…

Rubyの旧暦範囲の和暦西暦変換ライブラリをみて思ったこと

旧暦範囲の和暦西暦変換をRでちゃんとやりたいと思っていたけどいい感じのパッケージがなくて、どうしようかなぁと思っていた。 旧暦の計算もめんどくさいし旧暦データを入れてそれを参照して、ザクザク処理するのがベターか? しかしどんどんデータがでかく…

Rのzipangu::kansuji2arabicで期待した結果を返さない場合の個人的暫定解決策(追記あり)

R上で漢数字をアラビア数字に置き換えたいときにはzipanguパッケージのzipangu::kansuji2arabicを使うのが早いが、条件によっては期待する結果を返さないので少し考えてみた。 追記:千百十一を1001に変換してしまうバグがあったので修正し、10万以上も対応…

Rで星占いの星座を求める+西暦から十二支を求めるパッケージを作った

タイトルの通り。 github.com 使い方はREADMEに書いてる。 使いみちはあんまりないが、なんでこんなパッケージを作ったかというと、GitHub上にGitHub - CherieYu/BirthdayAnalyzer: An R project of birthday analyzerというRのパッケージがあって、生年月日…

Rでポンド・ヤードをキログラム・メートルに華氏温度を摂氏温度に相互変換するパッケージを作った

R

タイトルの通り。 Rでポンド(オンス、グレーン)からキログラム、ヤード(インチ、フィート、チェーン)からメートル、華氏温度から摂氏温度に変換(その逆もできる)する関数群のパッケージを作った。 パッケージはgithubに公開している。 github.com 使い…

ggplotでグラフの軸を回転させる方法+鉛直線・水平線を書くときの注意

Rのggplotでグラフの軸を回転させる方法(y軸が水平、x軸が垂直になるようにちょうど90°回転するように、横にする)と、回転させたときにそのグラフに鉛直線(縦線)や水平線(横線)を書くときの注意について。 indenkun.hatenablog.com この記事でRのggplo…

国立大学病院の看護師給与を令和元年度公表資料(平成30年度データ)からみてみる

毎年、文部科学省のウェブページで「独立行政法人、国立大学法人等及び特殊法人の役員の報酬等及び職員の給与の水準」として公開されている。 そこで、附属病院をもつ国立大学法人の病院看護職員、つまり国立大学病院の看護師給与を令和元年度公表資料(つま…

Rのpsychのfaの引数のrotateが"Promax"と"promax"で結果が違うって知ってた?

Rのpsychパッケージのfa関数の引数のrotateで"Promax"と"promax"で結果が違うって知ってた? 自分は今まで知らなかった。 "Promax"のほうはpromax斜行回転して解をもとめる、"promax"のほうはカイザーの正規化しながらpromax斜行回転して解をもとめていると…

列名にNAや同一列名が含まれているとどうなるのか

R

indenkun.hatenablog.com indenkun.hatenablog.com これとこれのおまけ。 Rでのデータフレームの扱いについての話。 列名にNAが含まれていたり、同じ列名を含むデータフレームだとdplyrだと上手く扱えない(というか作れない)。 baseだと作れてしまうが、そ…

Rでdplyrをつかって任意の列の列名を変更する方法

dplyrで列名を変更する dplyr::selectでできらぁ dplyr::renameでできらぁ おまけ dplyrで列名を変更する Rでdplyrパッケージで用意されているdplyr::selectやdplyr::renameをつかってデータフレームの任意の列の列名を書き換えてみる。 ときどき忘れちゃう…

Rで1列(任意の列)(1行)だけ列名(行名)を変える方法

R

Rで1列(任意の列)(1行)だけ列名(行名)を変更する方法 データフレーム 上手く行かない例 できらぁ おまけ Rで1列(任意の列)(1行)だけ列名(行名)を変更する方法 Rでデータフレーム(data.frame)の1列(1行)だけ列名(行名)を変更する方法をとき…

RStudioで1.3.959がリリースされて、Google Drive上で作業しているときのトラブルがひとつオプションで解決された

RStudio1.3.959がリリースされた。 リリースノートhttps://rstudio.com/products/rstudio/release-notes/を見ていると Auto Save Changes automatically (and optionally) saved to disk after a few seconds or when editor loses focus (#5263) Option to …

Rでカイ二乗検定をやるときはクロス集計表じゃなくてもいい話

R

Rでカイ二乗検定(χ二乗検定)をやるときにクロス集計表を作って、それを検定対象として引数に入れるということがさまざまな解説サイトで行われている。 ときにはクロス集計表をmatrixでベタ打ちしている場合もある。 しかし、クロス集計表って手元で持って…

RStudioのBuild > Build Binary Packageは.Rbuildingnoreを無視する?

タイトルの通り。 仕様を見たわけじゃなく、挙動からの推定。 indenkun.hatenablog.com について調べていたときに、.Rbuildignoreに怪しげなファイルをビルド時に無視するように書いても、Build > Build Binary Packageでは指定したファイルを無視しないでバ…

tubeplayRをインストールする方法(devtools::install_github("kazutan/tubeplayR")で上手く行かない場合)

(追記)issuesを書いたらあっという間に対応されtubeplayR0.1.4に更新されてdevtools::install_github("kazutan/tubeplayR")でインストールできるようになった。以下はtubeplayR0.1.3のときの対応の記録。 GitHub - kazutan/tubeplayR: play youtube by Rか…

R4.0.0が正式リリースされていた

R4.0.0がリリースされていた。 Rtoolsも40に上がっていて、Rtools35と共存可能とのことで使ってみてだめでも今の環境を残したまま試せるのはありがたい。 Using Rtools40 on Windows 今回のRtools40はインストール時に自分でPATHを通してくれないので、イン…