概要
機械学習(ML)とは、AIを実現させるための一手段で、コンピュータにある特定の分野について学習させることを言います。
また、その学習を実現させる方法として、3つの学習法があげられます。その3つとは、「教師あり学習」「教師なし学習」「強化学習」です。
教師あり学習
教師あり学習は、学習するデータに「正解」データを含む学習のことです。また、ここでいう「正解」とは、予測したい結果に該当するデータのことです。
例えば、ある人の収入を予測するために、その人の年齢、職業、教育、およびその他の要因を使用して、機械学習アルゴリズムをトレーニングすることができます。
ほかにも、店に並んでいる商品の画像から、商品を分別・予測したいのであれば、その「商品名」が学習データに含まれています。
教師なし学習
教師なし学習は、学習データに「正解」を含まない学習法のことを言います。
教師なし学習の代表的な例は、「クラスタリング」です。クラスタリングは、データをグループに分割することで、似た特徴を持つものをまとめることができます。
たとえば、AIは、「商品A」を買う人は、「商品B」も買う、というグループ分けを行なっています。これが、クラスタリングです。
また、教師なし学習のもう一つの代表例は、「次元削減」です。
次元削減とは、高次元のデータを低次元に変換する手法です。この変換により、データの可視化や計算の高速化などが可能になります。
具体例としては、顔画像認識が挙げられます。
顔画像はピクセル単位で表現されますが、このままでは解析が困難です。そこで、顔画像の特徴量を抽出し、低次元の空間に変換します。これにより、顔画像の分類や類似度の計算が高速に行えるようになります。
強化学習
強化学習は、上記の二つとは異なり、既存データを用いずに学習する手法です。この手法では、環境との相互作用を通じて、自己学習することができます。
強化学習は、環境に対するアクションを選択するプログラムに、「報酬を最大化する」よう指示を与えることで実現されます。
例えば、ゲームでいうと、強化学習を使って自動的にゲームをプレイするAIを開発することができます。このAIは、自分が選んだ行動が報酬にどのように影響するかを学習し、報酬を最大化するように行動を選択するようにプログラムされます。
また、ロボット制御にも使用されています。自律走行車のように、環境に対するアクションを選択することで、最適なルートを選び、安全に目的地に到達することができます。
問題点
ただ、上記の3つの学習法には、それぞれ問題点があります。
「教師あり学習」は、人間による正解データの作成が必要なため、正解データがない場合に利用できないという問題があります。
「教師なし学習」は、正解データがなくても学習可能ですが、グループ分けの基準が人間には解釈しづらい場合があり、その結果、不適切なグループ分けが行われる可能性があります。
「強化学習」は、報酬を最大化することが目的のため、報酬が不適切に設計されている場合、不適切な行動を取る可能性があるという問題があります。また、報酬の設計が難しい場合もあります。
結論
機械学習には、教師あり学習、教師なし学習、強化学習の3つの方法があります。その中でも、強化学習は人間の介入を必要としないため、自己学習を行うことができます。ただし、それぞれの学習法には問題点もあります。教師あり学習には正解データの作成が必要、教師なし学習にはグループ分けの基準が人間には解釈しづらい場合がある、強化学習には報酬の設計が難しい場合があるといった問題点があります。