【G検定学習】機械学習の具体的手法その2

スポンサーリンク
スポンサーリンク
スポンサーリンク
スポンサーリンク

ロジスティック回帰

線形回帰は回帰問題に用いる手法でしたが、その分類問題版。名前に回帰とついているが、分類問題で用いる。ロジスティック回帰では、シグモイド関数という関数をモデルの出力に使う。

シグモイド関数

任意の値を0から1の間に写像するシグモイド関数で、与えられたデータが正例(+1)になるか、負例(0)になるかの確率がでる。出力値が0.5以上ならば、正例。0.5未満ならば負例と設定しておくことで、データを2種類に分類できるようになる。この場合、閾値は0.5となるが、迷惑メールの識別にこの関数を用いる場合などは、閾値を高めに設定するのが一般的である。

ソフトマックス関数

分類問題で2種類以上の分類を行いたい場合は、シグモイド関数の代わりにソフトマックス関数を用いることとなる。

ランダムフォレスト

ランダムフォレストは、決定木を用いる手法。

特徴量をランダムに選び、パターンを1つに絞っていき、最終結果を予測する。

それぞれの決定木に対してランダムに一部のデータを取り出して学習に用いることをブートストラップサンプリングという。

複数の決定木から、ランダムフォレストでは、それぞれの結果を用いて多数決をとることによって、モデルの最終的な出力を決定します。

アンサンブル学習

キーワード
  • ブートストラップサンプリング
  • アンサンブル学習
  • バギング
  • 決定木

コメント

タイトルとURLをコピーしました