ホーム > mixiニュース > IT・インターネット > IT総合 > コレ1枚で分かる「『学習』と『推論』――機械学習の2つのプロセス」

コレ1枚で分かる「『学習』と『推論』――機械学習の2つのプロセス」

0

2019年01月04日 15:33  ITmediaエンタープライズ

  • チェックする
  • つぶやく
  • 日記を書く

ITmediaエンタープライズ

写真写真

 「機械学習」は、大量の学習データを機械に読み込ませ、そのデータを分析することで分類や識別のルールを作ろうというプログラム。そのプロセスは、「学習」と「推論」の2つに分けられます。



【その他の画像】



●学習



 大量の学習データの統計的分布から、特徴の組み合せパターンを作り出すプロセスです。



 例えば、学習データである「ネコ」「イヌ」「トリ」の画像から、それぞれに典型的な特徴の組合せパターン(=推論モデル)を作ります。



 学習方式には、「ネコの画像」と「ネコであるという答え」といった「データとそれを説明する答え」の組み合せを学習データとして使う「教師あり学習」と、学習データだけを与える「教師なし学習」などがあります。



●推論



 分類や識別をしたいデータを、「学習」で生成しておいた「推論モデル」に当てはめて、その結果を導くプロセスです。



 例えば、未知の写真から、その特徴を抽出し、「推論モデル」にその特徴を照合します。そして、ネコの特徴の組み合せパターンから作られた推論モデルが、最もその特徴パターンに近いと判断すれば、「ネコ」という推論結果を出力します。



●ディープラーニングで機械学習が高度化



 機械学習は、ディープラーニング(深層学習)と呼ばれるアルゴリズムの登場によって飛躍的な精度の向上を果たしました。



 ディープラーニング以前は、画像を認識し、それを識別するために、どのような特徴なのか――例えば、「ネコ」であれば「目の配置」や「鼻の形」に着目して識別すするように人間が設定しなければなりませんでした。この特徴の組み合せを「特徴量」といいます。



 その上で、「ネコの画像」と「ネコであるという答え」をセットにした画像を大量に入力して、ネコの特徴の組み合せパターンを「推論モデル」として生成していました。



 ディープラーニングでは、この特徴量を人間が設定するのではなく、データを分析することで自ら作り出すことができます。そのため、人間には気付かない、より際だった特徴を示す「特徴量」を見つけ出せるようになり、精度の高い分類や判別が可能になったのです。



●著者プロフィール:斎藤昌義



 日本IBMで営業として大手電気・電子製造業の顧客を担当。1995年に日本IBMを退職し、次代のITビジネス開発と人材育成を支援するネットコマースを設立。代表取締役に就任し、現在に至る。


    あなたにおすすめ

    ランキングIT・インターネット

    前日のランキングへ

    ニュース設定