2019-08-01から1ヶ月間の記事一覧
データ整形に関する関数のメモ 仕事で使用した関数のメモです。 ・NAが一定割合以下の列を抽出 tmp <- df %>% summarise_all( . %>% is.na() %>% sum) %>% #列ごとのNAの総数を集計する gather() %>% #縦持ちに変換 filter( value < nrow(df) *.3 ) #NAが30%…
決定木分析結果の可視化パッケージ【ggparty】 Rの決定木のグラフはどうしても貧弱なのが欠点でした。 その欠点を覆すべく、ggplotを使った自由度の高いパッケージggparty ができたみたいです。 詳細はこちら。 github.com library(rpart) library(partykit)…
コルモゴロフ-スミルノフ検定を実施し、生存、死亡の差がある分布を探す kaggleのブログで見つけたコルモゴロフ-スミルノフ検定の使用例を勉強するためにメモしておきます。 良品・不良品間でどの変数が分布に差があるか検討するときに使えそう。 #コルモゴ…
データハンドリン関係のコマンド比較まとめページ pythonの勉強を進めるうちにRのコマンドと混同しそうになってきた。 いつでも振り返りができるように、 コマンドを比較しているページをまとめておく。 PythonとRのコマンド比較表 qiita.com dplyr使いのた…