【Word2Vecとは】アルゴリズム・原理と計算例

Word2Vecのアルゴリズム・原理について入門者向けにまとめました。
Word2Vecは2013年にGoogle社によって開発され、単語をベクトルで表現し、単語同士の意味の近さの計算や、計算のアナロジーを行えるようにする仕組みです。

イメージ

例えば、女性職員、男性職員、女性、男性の4つの単語を次のようなベクトルで表すとします。

項目 ベクトル
女性職員 [0.5, 0.3, 0.3, 0.4]
男性職員 [0.4, 0.2. 0.8, 0.4]
女性 [0.2, 0.1, 0.2, 0.2]
男性 [0.1 0.0, 0.8, 0.2]

男性職員 – 男性 + 女性
= [0.4, 0.2. 0.8, 0.4] – [0.1, 0.0, 0.8, 0.2] + [0.2, 0.1, 0.2, 0.2]
= [0.5, 0.3, 0.2, 0.4]

となり、女性職員 ≒ 男性職員 – 男性 + 女性 となります。
このように単語の意味関係をベクトルの演算で行うことができます。

【機械学習入門】アルゴリズム&プログラミング
機械学習のアルゴリズム(原理)やプログラミング方法について入門者向けにまとめました。
【情報に関する理論】符号理論、述語論理、オートマトンなど
符号理論、述語論理、オートマトン、形式言語、計算量、人工知能(AI)、知識工学、学習理論、コンパイラ理論、プログラミング言語論・意味論についてまとめました。

コメント