とある技術者の徒然草

生産技術者の適当な日記(統計言語Rに関するメモがメイン)

2019-03-01から1ヶ月間の記事一覧

【R言語】相関係数の上位のカラムのみを抜き出して散布図行列

相関係数の高いカラムのみを抜き出して相関行列を作成する #####Boston housing rm(list = ls()) library(tidyverse) library(data.table) library(scales) library(VIM) library(corrr) library(corrplot) library(scales) path <- "C:/Users/************/…

【R言語】主成分分析・コレスポンデンス分析結果をshinyで可視化 「FactoMineR」「explor」パッケージ

コレスポンデンス分析結果をshinyで可視化 「FactoMineR」「explor」パッケージ コレスポンデンス分析の結果をインタラクティブに可視化するパッケージを 見つけたのでメモします。 正直かなり使える。 library(tidyverse) data(Titanic) df_titanic <- as_d…

【R言語】データフレームから数値属性の列・カラム名を抜き出す

データフレームから数値属性の列のみ抜き出す sapplyとis.numericを組み合わせて、 数値属性の列を抜き出すコードをメモする。 #データフレーム df_Bostonから数値の列だけ抜き出す df_Boston_num <- df_Boston %>% select_if(is.numeric) #名前を抜き出す n…

【R言語】caretでの独自評価指標(マシューズ相関係数MCCとF1)を利用した学習モデルの構築

caretによる機械学習モデルの評価にマシューズ係数を採用する マシューズ相関係数とは機械学習の2値分類問題で、 正と負の割合が不均衡の場合に用いられる評価指標である。 製造業における不良解析でも工程中のデータは通常不均衡データであり、 この指標を…

【R言語】xgboostで分類

xgboostで分類 下のサイトを参考にしながらxgboostのパラメーターチューニングに取り組んだ。 備忘録として残しておく。 www.marketechlabo.com logics-of-blue.com 使用したデータセットはコレ Default of Credit Card Clients Dataset | Kaggle library(ti…

【R】kaggleにはじめて挑戦 Home CreditコンペでLightGBM

kaggle初挑戦。とりあえずSubmitしてみた。 機械学習エンジニアの世界ではkaggleというデータコンペティションが流行している。 企業がkaggleにデータ分析に関する課題を提供し、 参加者が主に予測精度などを競うサイトである。 こういうのを見るとアメリカ…