2020-01-01から1年間の記事一覧
Rで今はまっている問題について上手く行かないというメモで、解決には至っていない。 RCurlのコンパイルが通らない RCurlのアップデートがあって、コンパイルが必要ですよいわれたのでOKとするとコンパルし始めるのだけれども、 install.packages("RCurl") T…
RStudioでアップデートを確認したら、1.2.5042のバージョンアップがあった。 開発版が1.3.9xxだし、デイリービルドが1.4.xxxなので、安定版がついに1.3.xxxにアップデートされたのかと思ったけど違った。 リリースノートを見ると4月13日にリリースされていて…
baseパケージの用意されている関数をR内で(条件付きで動作する範囲で)再現する試み。 自分の勉強用。 Rのt分布に関する組み込み関数を使ってt分布の確率密度関数を描出するとすると、 curve(dt(x,10),xlim = c(-4,4)) fig.1 となる。 dt()の本体はcで書か…
Rのmatch.arg()について挙動については 統計言語 R 探訪 match.arg() 編 - ほくそ笑む がすごくよくまとまっているので、これを読むべき。 今回は上のブログ記事でまとめられている挙動とは違う挙動が気になった件について。 基本的な挙動なのかもしれないけ…
(追記) オッズ比と95%信頼区間を{broom}パッケージのtidy()使って計算する方法を書いた(あまり大差ない)。 indenkun.hatenablog.com (追記終了) Rでロジスティック回帰分析をしてオッズ比を出して、そのオッズ比をggplot2でフォレストプロット風のプ…
{callr}のバージョンが3.4.2から3.4.3にアップデートされたとのことで、特にアップデートしてやりたいことがあるわけじゃないけどマイナーバージョンアップなのでサクッとアップデートしようと思ったらサクッと行けなかったので対処法のメモ。 多分今回は{ca…
Rで出力した結果をオブジェクトに保存し忘れて悲しい気持ちになることがあります(!?)が、Rは最後に出力した結果を.Last.Valueという隠しオブジェクトにしまっておいてくれます。 正確には Description The value of the internal evaluation of a top-lev…
Rでデータフレームの行の和をどの列かを選んで出す方法のメモ 全部の列の和を各行で計算する方法や、1~10列目と続いている場合にどうやって処理したらいいかはすぐに調べたらでてくるけど、どの列かを選んで計算する方法はいくつかのページの情報をまとめな…
検証方法 ランダム発生させたサンプルデータを用いてシミュレーションする 力技で全サンプリング方法についてp値を計算して確認する 順列バージョン 組み合わせバージョン 同じ母集団から2群をランダムにサンプリングしても、100回に1回くらいは同じ母集団な…
indenkun.hatenablog.com の続き(おまけ)。 Rでウィルコクソンの順位和検定を行うときに、Rに標準でインストールされるstatsのwilcox.test()を使いますが、タイがあると正確な計算ができないことからexactRankTestsのwilcox.exact()を使用したほうがいいと…
Rでウィルコクソンの順位和検定・符号順位和検定を行うときには、Rにはじめからインストールされているstatsのwilcox.test()を使うことが多いと思いますが、 例えば wilcox.test(sample(1:9,10,replace = T),sample(1:9,10,replace = T)) Wilcoxon rank sum …
indenkun.hatenablog.com の続きの蛇足。 これまでの簡単なまとめ Rのlmで求める式でのR21とR27の差について Kvalsethの式で計算したR2の差 Kvalsethとlmの式でのRの差 結局何を言いたいのか これまでの簡単なまとめ Kvalseth T. O. (1985): Cautionary Note…
WindowsのRStudio Desktopの設定ファイルの場所 C:\Users\”USERNAME”\AppData\Local\RStudio-Desktop 隠しフォルダになっている。 以前、RStudioの設定をいじりまくっていたらなんとも挙動がおかしくなってもとに戻そうと思ってアンインストールして再インス…
(追記)R4.0.0からのRtools40ではPATHの設定が変わった indenkun.hatenablog.com RStudioでライブラリをインストールやアップデートするときにまだバイナリーができてないために、ソースからビルドするときがあります。 このときに必要になるのがRtoolsなの…
indenkun.hatenablog.com の続き Rのlmのsummary.lmの決定係数についてながながと調べてきて、切片なしで計算式が異なること、その理由が決定係数が負の値をとり得るからというところまで今までの流れ。 しかし、summary.lmのソースコードを読むと実数範囲で…
indenkun.hatenablog.com の続き lmの決定係数が切片を明示的になしとしている場合で、そうでない場合とで異なる理由について、R FAQが答えてくれていた。 CRANのFAQなのでこれが公式回答でいいんだと思う。 7.41 Why does summary() report strange results…
決定係数の話の続き。 indenkun.hatenablog.com tss: Total sum of squares: 全平方和 rss: residual sum of squares: 残差平方和 mss: model sum of squaress: 回帰平方和(一部修正)
RとExcelのグラフで同じ回帰式でも決定係数が異なるが、自分はてっきりExcel側のバグかと思っていたので、正直気にしていなかったが、決定係数 R2の違い: Excel, OpenOffice, LibreOffice および統計解析ソフト R を用いてによるとソフトウェアごとのの定義…
まずはRのlmで線形回帰分析 Rのlmで切片のみの回帰直線(?)を描く方法 Rのlmで切片なしの回帰直線(?)を描く方法 基本的には自分用のメモ。 それは回帰直線なのかということはひとまずおいておいて。 使い道としてはいろいろあるけど、この項の主旨と異…
Rによる医療統計学 原書2版 - 丸善出版の私的メモ。 原著はIntroductory Statistics with R | Peter Dalgaard | Springer。 indenkun.hatenablog.com の続き。 意図が把握できなかった記載などについて、 PP166 「(cens <- (exit == 65)を使っているかもしれ…
Rによる医療統計学 原書2版 - 丸善出版初版第1刷の私的正誤表と雑感(つまり自分用メモ)。 原著はIntroductory Statistics with R | Peter Dalgaard | Springer。原著記載を併記している関係で、2行3列ごとのブロックになっているので見にくい。 あと表が横…
エラー Windows環境下でRStudioでRマークダウン(*.Rmd)やRスクリプト(.R)ファイルを書いているとfig.1のような文字化けエラーが書いてるあいだ頻発した。 fig.1 RStudio文字化けエラー 解決策 作業フォルダがGoogleドライブと同期していたのを停止した。…