AIと機械学習の違いとは?モデルを構築するまでの基本的な流れを解説

AIと機械学習の違いとは?基本用語から種類・活用事例まで幅広く解説します。

「AI」と「機械学習」の違いとは?

AI(人工知能)とは、「会話する」「画像を認識する」「意思決定する」といった「人間の知的活動を模倣する技術全般」を指します。

機械学習とは、AIを実現するための手法の1つで、「人間が経験から学ぶ仕組みをコンピュータで実現させる技術」のことです。また、深層学習は機械学習の中でも「特徴抽出も自動で行う高度な手法」のことです。

出典:総務省ホームページ (令和元年版 情報通信白書|AIに関する基本的な仕組み

【ポイント】
・AIは「上位概念」
・機械学習はその中の「学習技術」
・深層学習は機械学習の中でも「特徴抽出も自動で行う高度な手法」

コンピュータ技術の進歩とともに、機械学習の性能も大きく向上しており、今では私たちの生活のあらゆる分野で活用されています。

分野 活用例
金融 ・株価や為替の予測
・ローン審査における信用スコアリング
・不正取引の検出(フラウド検出)
医療 ・患者データから病気の判定(がん・糖尿病など)
・レントゲン画像の異常検知
・新薬候補の探索(バイオインフォマティクス)
自動車 ・自動運転技術(物体認識、経路推定)
・ドライバーの疲労・注意力検知
・エンジンや車両状態の異常予測
小売・EC ・ユーザーの購買履歴からレコメンド
・在庫・需要の予測
・顧客離脱予測
製造業 ・工場設備の異常検知(予知保全)
・品質検査(画像認識)
・工程最適化(スループットの向上)
【余談】
今では、ビジネス業界や学術界の至る所で「AI」とう言葉が用いられています。しかし、私が学生の頃は(2010年代)、理工系の学術界で「AI」という語が過剰に期待を煽るマーケティング用語と見なされ、「研究テーマ名」や「論文タイトル」に使うのは避けられていました。代わりに「機械学習」「パターン認識」「深層学習(ディープラーニング)」など、より技術的かつ具体的な表現が用いられていました。

動画で見る

機械学習の基本

前節にて、機械学習は「人間が経験から学ぶ仕組みをコンピュータで実現させる技術」と説明しました。もう少し具体的に言うと、「事前に与えられたデータからパターンやルールを学習し、予測や判断を行う」技術です。人間が「経験」から学ぶように、コンピュータも多くのデータから「このパターンならこの結果になる」と学ぶことで賢くなっていきます。例えば、VTuberの配信における視聴者数を予想するとき、人間の経験と機械学習では以下のようになります。

【例】VTuberの配信における視聴者数の予想

項目 説明
人間の経験 このVtuberは人気だから、夜のゲーム配信なら30,000人くらいは硬いだろう」などと予想
機械学習 VTuber達の過去の配信履歴から視聴者数を予測するパターンやルールを学習。作成した学習済みモデルを利用して「VTuberの配信情報から視聴者数は40,000人」と予想

では、機械学習ではどのように「パターンやルールを学習」するのか解説します。以下は、機械学習により「視聴者数の予測」を行うモデルを構築するイメージです。

データセットを作成します。

(データセットの例)兎野ぴこり、港あくび、星空スバリ、修士みよりの配信履歴を収集してCSVファイル等に整理

② データセットからモデルの学習に用いる特徴量(説明変数)を選定し、ターゲット変数(目的変数)とセットにして訓練データを作成します。

(特徴量の例)過去80回分の配信時間、配信時間帯、配信カテゴリ、サムネの色、コラボ人数、登録者数
(ターゲット変数の例)視聴者数

③ 選定したモデルを、訓練データで学習します。

(モデルの例)ランダムフォレスト、線形回帰など

登場する単語の意味を以下にまとめました。最初は大体で理解しましょう。

用語 意味
モデル 入力データから出力を予測するための数理的な構造 「この配信は何人くらい見そうか?」を予測する関数やアルゴリズム(例:線形回帰、ランダムフォレスト)。
学習 モデルが訓練データからパターンを見つけて、予測精度を高める 過去の配信履歴を使って「どんな配信が人気か」をモデルが学ぶこと。
データセット モデルの学習や評価に使うデータの集合 複数のVTuberの配信履歴をまとめたデータ(CSVファイル、データベースなど)。
訓練データ モデルの学習に使うデータセットの一部 データセットから抽出した過去80回の配信履歴。
ターゲット変数(目的変数) モデルが予測・分類しようとする「答え」 配信の視聴者数(例:1200人)
特徴量(説明変数) モデルの学習時に入力として使う個々の情報 配信時間帯、配信カテゴリ、コラボ人数、登録者数などの視聴者数に影響する各項目。
パラメータ モデルが学習により決定する値。予測の計算式に使われる重みや係数。 線形回帰の傾きや切片など。
ハイパーパラメータ モデル設計時に手動で設定するパラメータ。 学習率、決定木の深さ、正則化係数など。
自動では学習されず、手動で調整することにより性能向上を図る。

以下は、機械学習により構築した「学習済みモデル」を用いて「視聴者数の予測」を行うイメージです。

④ 学習済みモデルの性能を評価します。一般的には、テストデータをモデルに入力し、予測精度や汎化性能を確認します。

用語 意味
学習済みモデル 学習が完了し、予測に使える状態のモデル(パラメータが調整済み) 「この配信は視聴者数が1000人くらい」と予測できるようになったモデル。
入力 モデルに与える情報(予測の材料) 配信時間、カテゴリ、サムネ色、コラボ人数など。
出力 モデルが予測する結果 視聴者数(例:1200人)。
テストデータ モデルの性能を評価するために使う、訓練に使用していないデータ データセットから抽出した過去20回分の配信履歴(訓練データに未使用)。
過学習 学習データに過度に適合してしまい、汎化性能が低くなる問題 学習データには強いが、テストデータでは精度が落ちる
汎化性能 未知のデータに対する予測精度 新しい配信でも視聴者数を正確に予測できるかどうか。精度が低ければ、過学習の抑制や交差検証によって改善
特徴量エンジニアリング 学習性能を高めるために、データから新しい特徴量を作成するプロセス。 「配信日」から「曜日」を抽出、「カテゴリ」から「ジャンル傾向」を導くなど
正則化 モデルの複雑さを制御し、過学習を防ぐ技術 L1正則化(特徴量の選別)、L2正則化(重みの抑制)など
交差検証 データを複数の分割にして、繰り返し学習・検証することでモデルの性能を安定して評価**する方法 K-Fold交差検証で、配信履歴を5分割して検証
評価指標 モデルの予測性能を測る基準 回帰ならMSE・R²、分類なら正解率・F1スコアなど
未学習 モデルが訓練データにすら適合できていない状態 モデルが単純すぎて、視聴者数の傾向を捉えられない

⑤ 実際のデータに適用し、運用開始します。

学習手法やモデルを選ぶ際のポイント

学習手法やモデルを選ぶ際には、次の要素をバランスよく考慮する必要があります。なお、一般的に「解釈のしやすさ」と「予測性能」はトレードオフになることが多いです。

・問題の性質(分類か回帰かなど)
・予測精度
・学習時間と実装・運用コスト
・利用可能なデータの量・質
・結果の解釈のしやすさ(説明可能性)

バランスの良い選択を行うには、各手法の数理的な理解が必要です。機械学習の仕組みについては、以下ページで詳しく学ぶことができます。

【機械学習のアルゴリズム超入門】原理からプログラミング実装例まで解説
機械学習のアルゴリズム(原理)やプログラミング方法について入門者向けにまとめました。

Pythonライブラリ「Scikit-learn」を用いた機械学習の実装方法については、以下ページで詳しく学ぶことができます。

【Scikit-learn超入門】使い方とPythonで機械学習を行うサンプルコードを解説
Pythonライブラリ「Scikit-learn」で機械学習を行う方法を解説します。
この記事を書いた人
西住技研

在学中はシステム制御理論や画像処理、機械学習を専攻分野として研究していました。就職後は、プログラミング(Python)を活用したデータ分析や作業自動化に取り組み、現在に至ります。そこで得たノウハウをブログで発信しています。
YoutubeX(旧Twitter)でも情報発信中です

西住技研をフォローする
機械学習

コメント