【G検定学習】人工知能の歴史について
しばらく多忙のため、更新が止まっていたブログですが、来月行われるG検定を受けてみようと思い、学習記録用にブログを再開し...
【G検定学習】機械学習の基礎
前回に引き続き、G検定の出題範囲である、機械学習の基礎についてまとめてみた。教師あり学習教...
【G検定学習】機械学習の具体的手法その1
引き続き、機械学習のまとめ線形回帰回帰の代表的な手法として挙げられるのは、線形回帰です。...
ロジスティック回帰
線形回帰は回帰問題に用いる手法でしたが、その分類問題版。名前に回帰とついているが、分類問題で用いる。ロジスティック回帰では、シグモイド関数という関数をモデルの出力に使う。
シグモイド関数
任意の値を0から1の間に写像するシグモイド関数で、与えられたデータが正例(+1)になるか、負例(0)になるかの確率がでる。出力値が0.5以上ならば、正例。0.5未満ならば負例と設定しておくことで、データを2種類に分類できるようになる。この場合、閾値は0.5となるが、迷惑メールの識別にこの関数を用いる場合などは、閾値を高めに設定するのが一般的である。
ソフトマックス関数
分類問題で2種類以上の分類を行いたい場合は、シグモイド関数の代わりにソフトマックス関数を用いることとなる。
ランダムフォレスト
ランダムフォレストは、決定木を用いる手法。
特徴量をランダムに選び、パターンを1つに絞っていき、最終結果を予測する。
それぞれの決定木に対してランダムに一部のデータを取り出して学習に用いることをブートストラップサンプリングという。
複数の決定木から、ランダムフォレストでは、それぞれの結果を用いて多数決をとることによって、モデルの最終的な出力を決定します。
アンサンブル学習
キーワード
- ブートストラップサンプリング
- アンサンブル学習
- バギング
- 決定木
コメント