とある技術者の徒然草

生産技術者の適当な日記(統計言語Rに関するメモがメイン)

2020-02-01から1ヶ月間の記事一覧

【R言語】Borutaによるランダムフォレストの変数重要度をggplotの箱ひげ図でグラフ化する

Borutaによるランダムフォレストの変数重要度をggplotの箱ひげ図でグラフ化する デフォルトのグラフよりきれいなグラフが描けるggplotで 変数重要度を可視化する。 library(Boruta) library(rFerns) library(tidyverse) library(plotly) #mlbenchのSonarで試…

【R言語】ファイル名を一括して読みこみ、ファイル名の一部列として残す

ファイル名を一括して読みこみ、ファイル名の一部列として残す フォルダに保管されている大量のファイルを一括して読みこむときに、 ファイル名の一部(例えば3-4桁の機械番号)を列として残したい時のコードです。 # Tでファイル名にディレクトリ追加 List …

【R言語】特定の型の列を選択

【R言語】特定の型の列を選択 仕事用のメモです library(tidyverse) dftest <- starwars #数値型の列を選択 numericVars <- which(sapply(dftest, is.numeric)) numericVarNames <- names(numericVars) #文字型の列を選択 numericVars2 <- which(sapply(dfte…

【R言語】Borutaによる変数選択(ランダムフォレスト)

Borutaによる変数選択 データセットの中からある指標に基づいて、 重要変数を選択するアルゴリズムがいくつかある。 私が使っているRのソフトに Exploratory Desktop というソフトが大変便利で個人的に使用しています。 ExploratoryにはBorutaという変数選択…

【R言語】forで回して、do.call("grid.arrange")で複数グラフを表示、その後画像を保存。

forで回して、do.call("grid.arrange")で複数グラフを表示、その後画像を保存。 複数グラフの保存は以前と同じように リストにggplotオブジェクトをぶち込む。 do.callをそのまま変数に入れてggsaveで保存。 plots <- list() #リストを用意する i <- 1 df_ir…

【R言語】エクセルデータ読み込み時のカラム型の指定

エクセルデータ読み込み時のカラム型の指定 エクセルデータ読み込み時に型を指定するときのテクニック repを繰り返せば楽だが、 列数が変わった時に対応できるような指定方法はないか? データ:「マクロ経済学新版(有斐閣)」齋藤,岩本,太田,柴田 著(2016…