【機械学習のアルゴリズム超入門】原理からプログラミング実装例まで解説

機械学習のアルゴリズム（原理）やプログラミング方法について入門者向けにまとめました。

機械学習とは？
回帰分析
サポートベクターマシン（SVM）
決定木
ランダムフォレスト
ニューラルネットワーク（多層パーセプトロン）
深層学習（ディープラーニング）
階層型クラスタ分析
非階層型クラスタ分析
正則化
主成分分析(PCA)による次元削減
トピックモデル
強化学習
関連ページ

機械学習とは？

AI（人工知能）とは、「会話する」「画像を認識する」「意思決定する」といった「人間の知的活動を模倣する技術全般」を指します。機械学習（Machine Learning）とは、AIを実現するための手法の1つで、「人間が経験から学ぶ仕組みをコンピュータに学習させる技術」のことです。また、深層学習は機械学習の中でも「特徴抽出も自動で行う高度な手法」のことです。）

【ポイント】
・AIは「上位概念」
・機械学習はその中の「学習技術」
・深層学習は機械学習の中でも「特徴抽出も自動で行う高度な手法」

活用事例や基本用語など、詳細は以下ページで別途解説しています。

AIと機械学習の違いとは？モデルを構築するまでの基本的な流れを解説

AIと機械学習の違いとは?基本用語から種類・活用事例まで幅広く解説します。

また、機械学習の手法は「教師あり学習」「教師なし学習」「強化学習」の3つに分類されます。詳細は、以下ページで別途解説しています

「教師あり学習」「教師なし学習」「強化学習」の違い・比較

AIや機械学習を学ぶ際に登場する「教師あり学習」「教師なし学習」「強化学習」の違いについて解説します。

回帰分析

線形回帰
非線形回帰
その他
- ロジスティック回帰

ロジスティック回帰

予測対象	学習タイプ	可読性	並列処理
分類	教師あり	○	✕

特徴
- 線形回帰の出力をロジット関数に変換
- 対数オッズを重回帰で予測し、ロジット変換で確率を算出
- 尤度関数を目的関数に使用
原理の解説ページ
実装方法の解説ページ
- PythonとScikit-learnでロジスティック回帰分析を行う方法

サポートベクターマシン（SVM）

予測対象	学習タイプ	可読性	並列処理
分類	教師あり	○	✕

特徴
- マージン最大化により汎化性能が高い
- スラック変数で誤分類を許容
- カーネル法で非線形分離を可能に（カーネルトリックで計算量削減）
原理の解説ページ
- サポートベクターマシン（SVM）の原理と仕組み
実装方法の解説ページ
- PythonとScikit-learnでSVM
- PythonとOpenCVでSVM

決定木

モデル	学習タイプ	予測対象	可読性	並列処理
木構造	教師あり	分類	○	✕

特徴
- 説明変数と閾値で条件分岐を繰り返す
- ジニ不純度やエントロピーで分岐条件を決定
- スケーリング不要・説明が容易
実装方法の解説ページ
- Scikit-learnで決定木

ランダムフォレスト

モデル	学習タイプ	予測対象	可読性	並列処理
木構造	教師あり	分類	○	✕

特徴
- 決定木＋バギング（多数決で予測）
- 過学習の抑制・前処理が少ない
- 安定した精度・ハイパーパラメータ調整が可能

ニューラルネットワーク（多層パーセプトロン）

モデル	学習タイプ	予測対象	可読性	並列処理
神経回路	教師あり	連続値・分類	✕	○

特徴
- 入力・中間・出力の3層構造
- バックプロパゲーションによる学習
- 過学習しやすいが複雑なモデル構築が可能
原理の解説ページ
- ニューラルネットワークの原理と仕組み｜MLP
実装方法の解説ページ
- Pythonで単純パーセプトロン
- Scikit-learnで実装

深層学習（ディープラーニング）

特性

モデル	学習タイプ	予測対象	可読性	並列処理
神経回路	教師あり	連続値・分類	✕	○

特徴
- ディープニューラルネットワークを使用
- 複雑なモデル構築が可能
- 多くのハイパーパラメータ・過学習・勾配消失問題あり
原理の解説ページ
- 深層学習（ディープラーニング）の原理と仕組み
- CNN（畳み込みニューラルネットワーク）の原理と仕組み
実装方法の解説ページ
- Kerasで実装
- PyTorchで実装

階層型クラスタ分析

教師なし学習で、類似するデータをグループ化。クラス分類とは異なる。

予測対象	学習タイプ	可読性	並列処理
分類	教師なし	○	✕

特徴
- ユークリッド距離＋ウォード法が代表例
- 距離定義に基づきクラスタリング
- クラスタ数は後から変更可能

非階層型クラスタ分析

予測対象	学習タイプ	可読性	並列処理
分類	教師なし	✕	○

特徴
- k平均法が代表例
- クラスタ数は事前に指定（変更不可）
- 初期値により結果が変動
原理の解説ページ
- k平均法
実装方法の解説ページ
- Scikit-learnでクラスタリング
- OpenCVで画像クラスタリング

正則化

過学習を防ぐために、モデルの複雑さを抑える手法。パラメータのノルムを制限することで汎化性能を向上。

代表的手法
– LASSO正則化：特徴量選択が自動で行われる
– Ridge正則化：ノルムを小さく保つ（特徴量選択はしない）

主成分分析(PCA)による次元削減

次元削減とは、できるだけデータの情報を失わずに、データの次元数を減らすことです。
機械学習では「構造抽出」「汎化能力の向上」「可視化」「メモリ節約」などに活用されます。
代表例として主成分分析(PCA)があります。

特性
- 線形の次元削減を行う手法
特徴
- 寄与率を計算することで、各成分の重要度がわかる
- 主成分を計算することで、各成分の意味を推測できる
原理
- 主成分分析(PCA)の原理

トピックモデル

予測対象	学習タイプ	可読性	並列処理
分類	教師なし	✕	○

特徴
- 代表例はLDA
- トピック数（分類数）は事前に与える必要あり
- トピック毎の出現頻度からスコアを計算してデータを分類
- 計算量が大きい

強化学習

強化学習（Reinforcement learning）とは、エージェントがある環境内で現在の状態を観測し、収益を最大化するための取るべき行動を決定する学習手法の１つです。つまり、エージェントが試行錯誤を繰り返していき、徐々に環境に適応した行動を取るような学習を行います。

特徴
- 試行錯誤を繰り返し「評価値（報酬）が最大となる行動」を学習
実装方法の解説ページ
- 強化学習の原理