AIと機械学習の違いとは？モデルを構築するまでの基本的な流れを解説

AIと機械学習の違いとは?基本用語から種類・活用事例まで幅広く解説します。

「AI」と「機械学習」の違いとは？
機械学習の基本
学習手法やモデルを選ぶ際のポイント

「AI」と「機械学習」の違いとは？

AI（人工知能）とは、「会話する」「画像を認識する」「意思決定する」といった「人間の知的活動を模倣する技術全般」を指します。

機械学習とは、AIを実現するための手法の1つで、「人間が経験から学ぶ仕組みをコンピュータで実現させる技術」のことです。また、深層学習は機械学習の中でも「特徴抽出も自動で行う高度な手法」のことです。

【ポイント】
・AIは「上位概念」
・機械学習はその中の「学習技術」
・深層学習は機械学習の中でも「特徴抽出も自動で行う高度な手法」

コンピュータ技術の進歩とともに、機械学習の性能も大きく向上しており、今では私たちの生活のあらゆる分野で活用されています。

分野	活用例
金融	・株価や為替の予測・ローン審査における信用スコアリング・不正取引の検出（フラウド検出）
医療	・患者データから病気の判定（がん・糖尿病など）・レントゲン画像の異常検知・新薬候補の探索（バイオインフォマティクス）
自動車	・自動運転技術（物体認識、経路推定）・ドライバーの疲労・注意力検知・エンジンや車両状態の異常予測
小売・EC	・ユーザーの購買履歴からレコメンド・在庫・需要の予測・顧客離脱予測
製造業	・工場設備の異常検知（予知保全）・品質検査（画像認識）・工程最適化（スループットの向上）

【余談】
今では、ビジネス業界や学術界の至る所で「AI」とう言葉が用いられています。しかし、私が学生の頃は（2010年代）、理工系の学術界で「AI」という語が過剰に期待を煽るマーケティング用語と見なされ、「研究テーマ名」や「論文タイトル」に使うのは避けられていました。代わりに「機械学習」「パターン認識」「深層学習（ディープラーニング）」など、より技術的かつ具体的な表現が用いられていました。

動画で見る

機械学習の基本

前節にて、機械学習は「人間が経験から学ぶ仕組みをコンピュータで実現させる技術」と説明しました。もう少し具体的に言うと、「事前に与えられたデータからパターンやルールを学習し、予測や判断を行う」技術です。人間が「経験」から学ぶように、コンピュータも多くのデータから「このパターンならこの結果になる」と学ぶことで賢くなっていきます。例えば、VTuberの配信における視聴者数を予想するとき、人間の経験と機械学習では以下のようになります。

【例】VTuberの配信における視聴者数の予想

項目	説明
人間の経験	「このVtuberは人気だから、夜のゲーム配信なら30,000人くらいは硬いだろう」などと予想
機械学習	VTuber達の過去の配信履歴から視聴者数を予測するパターンやルールを学習。作成した学習済みモデルを利用して「VTuberの配信情報から視聴者数は40,000人」と予想

では、機械学習ではどのように「パターンやルールを学習」するのか解説します。以下は、機械学習により「視聴者数の予測」を行うモデルを構築するイメージです。

① データセットを作成します。

(データセットの例）兎野ぴこり、港あくび、星空スバリ、修士みよりの配信履歴を収集してCSVファイル等に整理

② データセットからモデルの学習に用いる特徴量(説明変数)を選定し、ターゲット変数（目的変数)とセットにして訓練データを作成します。

(特徴量の例）過去80回分の配信時間、配信時間帯、配信カテゴリ、サムネの色、コラボ人数、登録者数
(ターゲット変数の例）視聴者数

③ 選定したモデルを、訓練データで学習します。

(モデルの例）ランダムフォレスト、線形回帰など

登場する単語の意味を以下にまとめました。最初は大体で理解しましょう。

用語	意味	例
モデル	入力データから出力を予測するための数理的な構造	「この配信は何人くらい見そうか？」を予測する関数やアルゴリズム（例：線形回帰、ランダムフォレスト）。
学習	モデルが訓練データからパターンを見つけて、予測精度を高める	過去の配信履歴を使って「どんな配信が人気か」をモデルが学ぶこと。
データセット	モデルの学習や評価に使うデータの集合	複数のVTuberの配信履歴をまとめたデータ(CSVファイル、データベースなど)。
訓練データ	モデルの学習に使うデータセットの一部	データセットから抽出した過去80回の配信履歴。
ターゲット変数（目的変数）	モデルが予測・分類しようとする「答え」	配信の視聴者数（例：1200人）
特徴量（説明変数）	モデルの学習時に入力として使う個々の情報	配信時間帯、配信カテゴリ、コラボ人数、登録者数などの視聴者数に影響する各項目。
パラメータ	モデルが学習により決定する値。予測の計算式に使われる重みや係数。	線形回帰の傾きや切片など。
ハイパーパラメータ	モデル設計時に手動で設定するパラメータ。	学習率、決定木の深さ、正則化係数など。自動では学習されず、手動で調整することにより性能向上を図る。

以下は、機械学習により構築した「学習済みモデル」を用いて「視聴者数の予測」を行うイメージです。

④ 学習済みモデルの性能を評価します。一般的には、テストデータをモデルに入力し、予測精度や汎化性能を確認します。

用語	意味	例
学習済みモデル	学習が完了し、予測に使える状態のモデル(パラメータが調整済み)	「この配信は視聴者数が1000人くらい」と予測できるようになったモデル。
入力	モデルに与える情報（予測の材料）	配信時間、カテゴリ、サムネ色、コラボ人数など。
出力	モデルが予測する結果	視聴者数（例：1200人）。
テストデータ	モデルの性能を評価するために使う、訓練に使用していないデータ	データセットから抽出した過去20回分の配信履歴(訓練データに未使用)。
過学習	学習データに過度に適合してしまい、汎化性能が低くなる問題	学習データには強いが、テストデータでは精度が落ちる
汎化性能	未知のデータに対する予測精度	新しい配信でも視聴者数を正確に予測できるかどうか。精度が低ければ、過学習の抑制や交差検証によって改善
特徴量エンジニアリング	学習性能を高めるために、データから新しい特徴量を作成するプロセス。	「配信日」から「曜日」を抽出、「カテゴリ」から「ジャンル傾向」を導くなど
正則化	モデルの複雑さを制御し、過学習を防ぐ技術	L1正則化（特徴量の選別）、L2正則化（重みの抑制）など
交差検証	データを複数の分割にして、繰り返し学習・検証することでモデルの性能を安定して評価**する方法	K-Fold交差検証で、配信履歴を5分割して検証
評価指標	モデルの予測性能を測る基準	回帰ならMSE・R²、分類なら正解率・F1スコアなど
未学習	モデルが訓練データにすら適合できていない状態	モデルが単純すぎて、視聴者数の傾向を捉えられない