とある技術者の徒然草

生産技術者の適当な日記(統計言語Rに関するメモがメイン)

【R言語】機械学習モデルの変数重要度

変数重要度の有効利用

製造業においてデータ分析の目的は予測よりも要因解析であることのほうが多い。
ブログを見ていると機械学習モデルの変数重要度について解説している
素晴らしサイトを見つけた。

dropout009.hatenablog.com

Permutation importanceとは

もしある変数が重要な変数ならシャッフルによって
モデルは的はずれな予測をするようなる 。
逆に重要でないなら特に影響は出ないはず
というシンプルでわかりやすい考えである。

パッケージvipを使って簡単に計算できるようなので、
今度コードを写経させてもらおう。
こういう素晴らしいサイトが日本でもどんどん増えてほしいです。

2020年2月22日追記

R言語】ランダムフォレストrangerパッケージ 変数の重要度を可視化



単純にランダムフォレストでモデルを構築し、
その変数重要度を可視化するコードはこちらです。

monodukuri.hatenadiary.com

R言語】Borutaによる変数選択(ランダムフォレスト)

Borutaを使用した変数選択はこちら

monodukuri.hatenadiary.com

monodukuri.hatenadiary.com