ホーム > mixiニュース > IT・インターネット > IT総合 > 文系でも分かる「機械学習」のススメ 教師あり/なし、強化学習を解説

文系でも分かる「機械学習」のススメ 教師あり/なし、強化学習を解説

0

2019年05月23日 07:12  ITmedia NEWS

  • チェックする
  • つぶやく
  • 日記を書く

ITmedia NEWS

写真写真

 最近よく耳にするようになった「機械学習」という言葉。ビジネスで活用するには機械学習でできることとその限界を理解しておく必要があるだろう。



【その他の画像】



 前回記事では、機械学習には大きく分けて「教師あり学習」「教師なし学習」「強化学習」の3種類が存在することを解説した。今回はこの3つについて、もう少し詳しく整理してみたい。



●機械学習の種類



 人間でも、何の手掛かりもなしに学習することは不可能だ。ちょうどいま皆さんがしているように、何らかの解説記事や参考書を読んで、そこに書かれている内容を覚えて知識にする場合もあれば、英会話の授業のように、教師のまねをして発音や表現を身に付けていく場合もあるだろう。



 AIの場合、前者のアプローチに近いのが、第2回の記事で触れた「エキスパートシステム」だ。つまり事前にルールを整理しておき、AIがそれに従って判断するようにプログラムを組むわけである。



 そして後者のアプローチに近いのが「機械学習」である。参考になるデータと、そこから知識を導き出すやり方(アルゴリズム)を用意して、あとは機械に何らかの判断を行うための知識(モデル)を構築させるのである。



 この場合にどのようなデータを与えるか、またどのようなアルゴリズムで処理させるかによって、同じ機械学習でもいくつかに細分化される。その整理法の1つが、「教師あり学習」「教師なし学習」「強化学習」の3つに分ける方法だ。



●「教師あり学習」とは



 教師あり学習の場合、あらかじめ質問とその答えになるデータが与えられる。前回の記事でも例として挙げたが、クレジットカード使用履歴のような大量の金融取引データを用意し、記録されている個々のトランザクションを「正しい取引」「不正な取引」に分類(つまり機械が参考にできる「教師データ」を与える)した上で、「あるトランザクションが不正かどうかを判断しろ」と命じるといった具合だ。



 このような教師データが得られる場合に、どのようなアルゴリズムを採用すれば目標を達成できるのか。教師あり学習に限った話ではないが、機械学習を使ったアプリケーションの構築では、そうした判断を通じてデータとアルゴリズムの用意を進める。時には使いたいアルゴリズムに応じたデータを用意することもあるだろう。



 教師あり学習で使われるアルゴリズムの単純な例として、線形回帰を挙げよう。Excelを使って簡単な売上分析などをしたことがある人なら、おなじみの話のはずだ。



 例えばある店舗における過去のアイスの売上データと、周辺地域の気温データがそろっていれば、これを「教師データ」として、「ある気温のときにアイスが何個売れそうか」を判断するモデルを線形回帰で構築することができる(しかもExcelの機能を使えば数クリックで済む)。気温はアイスの売上を左右する重要な変数で、その変化に応じてアイスの売上という結果も一定のパターンに沿って変化すると期待できるからだ。



 しかし「こんなのAIじゃない」と思われたかもしれない。確かに私たちが「人工知能」という言葉から連想するものとは程遠いが、「教師あり学習」さらには「機械学習」という分類には、回帰分析も十分当てはまる。一口に機械学習といっても、その中身は千差万別であるということを覚えておこう。



●「教師なし学習」とは



 教師なし学習では、機械に大量のデータだけを与えてその中にある隠れた規則性を発見させる。こちらも前回記事の例だが、ECサイト上の大量の取引データから、同じような購買パターンを持つクラスタ(集団)を把握するとしよう。



 この場合、ユーザーをあらかじめ「40代男性」「東京に住むサラリーマン」のように分類しておき、彼らがiPhoneを買う傾向があるかどうかを判断するといった手法を使うこともできる。



 だがそれでは、事前に人間が考えた分類でしか分析することができない。例えば「マイルドヤンキー」といった具合に、新しい社会グループの存在が日々発掘され、概念化されているが、そうした未知の概念に気づかない可能性が出てくるわけである。



 しかし教師なし学習の場合には、機械が自ら適切なクラスタの分け方を導き出してくれる。実際にこうしたクラスタ分析と、それを活用した商品レコメンデーションは、多くのECサイトが導入している。



 いまは「第3次人工知能ブーム」の時代といわれている。このブームのきっかけになったと考えられている出来事がいくつかあるのだが、その1つが2012年の「Googleによる猫画像認識」である。



 覚えている方も多いと思うが、これはAIに大量の画像データを与えることで、人間が教えることなく、AIが自発的に猫を認識することに成功したというものだ。実はこの際に使われた手法も、教師なし学習だった。



 このときGoogleは、YouTube上に投稿された動画の中からおよそ1千万枚の画像を無作為に抽出し、そこに何のラベルもつけずに(つまり「教師データ」の状態にはせずに)彼らが開発したアルゴリズムに与えた。するとこのアルゴリズムは1週間後に、画像の中に猫が映っている場合、そこに猫がいると正しく分類できるようになったのである。ただし機械に「猫」という言葉は教えていないので、正確には「猫に相当するグループ」を分類できたことになる。



 このニュースは世界に衝撃を与え、教師なし学習に対する注目が一気に高まった。



 教師なし学習は画像分析や映像分析、音声分析などの分野でその精度や用途を大きく前進させるために活用されている。またセキュリティの分野で、未知の脅威を検知するAIを開発することにも役立てられている。不正検知などでは過去のデータから異常な取引のパターンを学習させているが、それでは新しい手口に対抗できない。教師なし学習であれば、クラスタ分析のように人間がまだ気づいていない概念にも対応できるわけである。



●「強化学習」とは



 強化学習も同様に、アルゴリズムに対して何が正解かを事前に教えることはない。その代わりに、まずは機械に達成させたい「ゴール」(ゲームに勝利するなど)を設定し、アルゴリズムが何らかの判断を行うと、その結果に応じて「報酬(もしくは罰)」を与える。それを繰り返すことで、得られた報酬がフィードバックとなり、機械が自ら「正しい」行いを把握できるようになる。行動を繰り返していく中で、徐々に学習していくわけだ。



 ちょうど飼っている犬や猫をしつける際、お手ができたらおやつを上げる、テーブル上の料理を盗み食いしたらしかるといったフィードバックを繰り返すことで、望ましい行動を取ってくれるようになるイメージである。



 強化学習の解説においては、ゲームやスポーツの試合が引き合いに出されることが多い。「勝利する」という目的は1つでも、そこに至る道筋は1つではなく、短期的には悪手と思われるような判断が長期的にはメリットをもたらす場合もある。そのようなシチュエーションにおける最適な行動を機械が学習するために、強化学習が活用されている。



 例えばカナダにあるライアソン大学の研究者らは、自動運転車に急ブレーキを回避する運転技術を学ばせるために強化学習を応用した。



 事故を防ぐためにはもちろん車両を止めないといけないが、あまり急激に停止すると中にいる乗客がダメージを負う危険がある。そこで研究者たちは「クルマが衝突したら罰を与える」「ブレーキをかけた際に急停止したら罰を与える」という2種類のフィードバックを用意し、その結果に応じて罰の厳しさを調整しながら車両に搭載するAIでシミュレーションを行った。その結果、この2つの罰を回避することで事故を避けつつ乗り心地も守るという運転技術を、AIに考えさせることに成功した。



●進化を続ける機械学習の手法



 前回も解説したように、ここで挙げた3つの方法は排他的なものではなく、教師あり学習と教師なし学習を組み合わせた「半教師あり学習」という手法も存在する。



 半教師あり学習では、アルゴリズムをトレーニングする際に、教師ありデータと教師なしデータの両方を活用している。機械学習を研究する専門家たちは、こうして2種類のデータを組み合わせることで、学習の精度を著しく向上させられると指摘する。



 半教師あり学習では、教師ありデータの方が少ないことが一般的で、与えられるデータの大半が教師なしデータだ。これは教師ありデータを大量に用意できない場合に有効で、従来に比べ少ないデータから精度の高いモデルを完成させることができる。



 また「どのようなデータを与えるか」だけでなく、「どのようにデータを与えるか」「既存の資産をどう生かすか」といった観点からも、さまざまな手法が生まれている。



 一例として「転移学習」を挙げよう。教師あり学習のところで、クレジットカードの不正取引を判断させるケースを例として挙げたが、そこで構築されたモデルを使って似たような判断ができないだろうか。



 例えば金融機関がチェックすべき取引は、詐欺行為に関するものだけではない。近年の国際情勢によって、テロリストやテロ行為に関係すると思われる取引をチェックすることも極めて重要になっている。もちろん金銭を得ることが目的の不正取引と、マネーロンダリングのような犯罪を目的とした不正取引を同一視はできないが、一部の知識は流用できるはずだ。



 それを実際に行うのが転移学習で、ある領域において構築したモデルを別の領域へと文字通り「転移」して活用する手法を指す。そう簡単にはいかないが、新しいモデルをゼロから構築するのに比べ、より少ないデータで一定の精度を得られる可能性がある。



 実際にさまざまな取り組みで成果を上げていて、例えば今年3月に理化学研究所が発表した「人工知能による高精度緑内障自動診断」では、転移学習が活用され少ないデータで高い精度が実現できたとしている。ちなみにこの研究では「ランダムフォレスト」という別の機械学習手法も組み合わされている。



●「最新手法が最善」とは限らない



 このように機械学習の分野では、次回解説するディープラーニングと合わせて学習方法に関する研究がいまも進んでいる。人間の学習法ですら「アクティブラーニング」(能動的な学習)のようなトレンドや革新が生まれていることを考えれば、それも当然の話だろう。



 当然ながら、最新の手法や流行の手法が自社にとっても最善の選択肢であるとは限らない。しかし少なくとも、いちど検討が終わったら満足してしまうのではなく、「もっと優れたやり方が登場しているかもしれない」という関心や好奇心を持ち続けていくことが望ましい。


    あなたにおすすめ

    ニュース設定