【R言語】機械学習モデルの変数重要度
変数重要度の有効利用
製造業においてデータ分析の目的は予測よりも要因解析であることのほうが多い。
ブログを見ていると機械学習モデルの変数重要度について解説している
素晴らしサイトを見つけた。
Permutation importanceとは
もしある変数が重要な変数ならシャッフルによって
モデルは的はずれな予測をするようなる 。
逆に重要でないなら特に影響は出ないはず
というシンプルでわかりやすい考えである。
パッケージvipを使って簡単に計算できるようなので、
今度コードを写経させてもらおう。
こういう素晴らしいサイトが日本でもどんどん増えてほしいです。
2020年2月22日追記
【R言語】ランダムフォレストrangerパッケージ 変数の重要度を可視化
単純にランダムフォレストでモデルを構築し、
その変数重要度を可視化するコードはこちらです。
【R言語】Borutaによる変数選択(ランダムフォレスト)
Borutaを使用した変数選択はこちら