機械学習

機械学習とは

機械学習とは、「ML（Machine Learning）」とも呼ばれる、AIを実現するためのデータ分析技術の1つで、データから、コンピュータシステムが自動で「学習」し、データの背景にあるルールやパターンを学習する方法です。
機械学習の代表的な分析手法にディープラーニングがあります。
人工知能（AI）においては、現在まで、ブームと冬の時代が繰り返し起こってきました。

1950年代後半〜1960年代：第一次人工知能ブーム

コンピューターで「探索」と「推論」を行い、特定の問題に対する解を提示できるようになりました。
複雑な問題を解くことができないことが明らかになり、冬の時代を迎えました。

1980年代：第二次人工知能ブーム

コンピューターに「知識」を与えると、実用可能な水準に達することを利用し、エキスパートシステム（専門家の代わりに特定の分野においてアドバイスや診断を行うコンピューターシステム）が多く作られました。
しかしながら、コンピューターに与える情報を人間が準備する必要があり、必要となる情報すべてを用意することは困難であったため、再び冬の時代を迎えました。

2000年代〜現在まで：第三次人工知能ブーム「機械学習」

2000年代以降、コンピューターシステム自身が知識を獲得する機械学習が実用化されました。
その後、ディープラーニングと呼ばれる、学習データの「特徴量（判断基準）」自体を人工知能が自ら習得する方法が登場したことで、再び注目を集めています。

機械学習の種類

教師あり学習

正解のデータを教える学習方法です。数百万というりんごやバナナの画像に「りんご」または「バナナ」という単語をタグ付けすることをデータラベリングと言います。
このようにしてラベル付けされた正解のデータを教えることで、次のデータが提示された際に出力データが推測できるようになります。
教師あり学習では、「回帰」と「識別」が可能となります。
回帰とは、ラベルが連続的な数値である場合に、提示されたデータの数値を推測することで、識別とは、ラベルが離散的な数値の場合に、提示されたデータの分類を推測することです。
教師あり学習には膨大なデータのラベリングが必要というデメリットがあります。

教師なし学習

正解のデータを教えない学習方法です。ラベルのない大量のデータを与え、データの背景にある隠れたパターンや構造を見つけ出し、学習する方法です。
教師あり学習と比べ、教師なし学習には正解のデータがないため、各データ間の近さや類似度などを計算して、データをグループに分けたり、データ間のつながりを推計します。従って、データ教師なし学習では、パターン認識、異常検出、データのグループ化が可能となります。
教師なし学習はラベリングの必要がないため、設定は簡単というメリットがある一方、正確な予測ができないというデメリットがあります。

強化学習

報酬値による学習方法です。強化学習では教師あり・なし学習と異なり、最初からデータがある訳ではありません。
一定の環境の中で、コンピューターシステムの行動に報酬値を与えます。
コンピューターシステムはより多くの報酬ポイントを蓄積できるように試行錯誤を行います。
行動と報酬値のプロセスを繰り返すことで、コンピューターシステム自身が何が良い行動であるのかを学習させます。
そして、最終的に目標値に到達できるようになります。強化学習は、ロボットの制御や戦略ゲームなどに利用されています。