2019-03-01から1ヶ月間の記事一覧
相関係数の高いカラムのみを抜き出して相関行列を作成する #####Boston housing rm(list = ls()) library(tidyverse) library(data.table) library(scales) library(VIM) library(corrr) library(corrplot) library(scales) path <- "C:/Users/************/…
コレスポンデンス分析結果をshinyで可視化 「FactoMineR」「explor」パッケージ コレスポンデンス分析の結果をインタラクティブに可視化するパッケージを 見つけたのでメモします。 正直かなり使える。 library(tidyverse) data(Titanic) df_titanic <- as_d…
データフレームから数値属性の列のみ抜き出す sapplyとis.numericを組み合わせて、 数値属性の列を抜き出すコードをメモする。 #データフレーム df_Bostonから数値の列だけ抜き出す df_Boston_num <- df_Boston %>% select_if(is.numeric) #名前を抜き出す n…
caretによる機械学習モデルの評価にマシューズ係数を採用する マシューズ相関係数とは機械学習の2値分類問題で、 正と負の割合が不均衡の場合に用いられる評価指標である。 製造業における不良解析でも工程中のデータは通常不均衡データであり、 この指標を…
xgboostで分類 下のサイトを参考にしながらxgboostのパラメーターチューニングに取り組んだ。 備忘録として残しておく。 www.marketechlabo.com logics-of-blue.com 使用したデータセットはコレ Default of Credit Card Clients Dataset | Kaggle library(ti…
kaggle初挑戦。とりあえずSubmitしてみた。 機械学習エンジニアの世界ではkaggleというデータコンペティションが流行している。 企業がkaggleにデータ分析に関する課題を提供し、 参加者が主に予測精度などを競うサイトである。 こういうのを見るとアメリカ…