
機械学習の手法は、「教師あり学習」と「教師なし学習」に大きく分けられます。今回は、教師あり学習と教師なし学習の違いや応用例について解説していきます。
教師あり学習とは
機械学習における教師あり学習とは、入力とそれに対する正解ラベルを使い、予測値を正解ラベルに近づけることを目標に学習を行う手法です。
教師あり学習の例
教師あり学習は更に、「回帰」と「分類」の二種類に大きく分けられます。回帰とは出力値を予測するために使われる手法で、家賃、年収、気温、株価予測などに使用されます。回帰の代表的な手法は線形回帰モデルですが、株価データなどの周期性のあるデータには、曲線で表すことができる非戦回帰モデルを使用します。
「分類」とはあらかじめ設定したクラスにデータを割り振ることをいいます。例えば、典型的な例ですが、画像に写っている犬や猫の識別は分類タスクです。分類の代表的な手法は、ロジスティック回帰、knn法(k近傍法)、サポートベクターマシンなどが挙げられます。
教師あり学習を始める前に、十分の学習データのアノテーション作業が必要となります。当社は20年を渡るAIプロジェクトの実績を持ち、教師データの作成やアノテーションサービスを提供させて頂いているので、これらの課題でお困りの方は、ぜひお問い合わせください。
自己教師あり学習
自己教師あり学習(self supervised learning)は自己「教師あり」ですが、次にご説明していく、教師なし学習の部類とされています。名の通り、教師がないデータに対し、自ら教師を作成し、その問題において良好な特徴表現を獲得する手法です。最近の自己教師あり学習の研究では、必要な正解データ量を従来の1%まで大幅に削減し、同精度の性能が発揮されました。
教師あり学習と教師なし学習の違い
教師あり学習と異なる「教師なし学習」は、教師データを使わずに、データの本質的な構造を浮かび上がらせる方法を意味します。具体的に見ていきましょう。
教師なし学習の例
教師なし学習は主にクラスタリングで行われます。クラスタリングとは、与えられたデータ群をいくつかの集まり(クラスタ)に分けることで、データの本質的な構造を浮かび上がらせる方法です。データに事前にクラスに与えないので、教師あり学習における分類とは異なる方法です。代表的な手法は、クラスタの中心を重心の位置にずらす k-means法となります。
教師なし学習は、膨大なアノテーション作業がいらずデータを準備しやすいというメリットが挙げられます。

機械学習は「教師あり学習」と「教師なし学習」に大きく分けられますが、他にも、弱教師あり学習(「弱い」アノテーションを付与しる学習法)、半教師あり学習(少量のラベル付きデータを用いることで、大量のラベルなしデータをより学習に活かす学習法)や強化学習(収益を最大化する方策を獲得することを目的とした手法)などもありますので、また次回取り上げていきます。ぜひ、メールマガジンにもご登録ください。
本記事を気に入って頂けた方は、併せてこちらもご一読ください。