ホーム > mixiニュース > IT・インターネット > IT総合 > データサイエンティストの仕事は奪われない 「Kaggle Grandmaster」が語るデータ分析の本質

データサイエンティストの仕事は奪われない 「Kaggle Grandmaster」が語るデータ分析の本質

0

2019年10月21日 19:52  ITmedia NEWS

  • チェックする
  • つぶやく
  • 日記を書く

ITmedia NEWS

写真日本経済新聞でデータサイエンティストを務める「Kaggle Master」の石原祥太郎さん
日本経済新聞でデータサイエンティストを務める「Kaggle Master」の石原祥太郎さん

 「AutoML(などの自動化ツール)はデータサイエンスのプロセスの一部を効率化できますが、データサイエンティストの業務全体を置き換えることはあり得ないと思います」



【その他の画像】



 「よくAutoMLでデータサイエンティストの仕事がなくなるといわれますが、本当にそれで仕事がなくなら、もうなくなってるんじゃないでしょうか」



 10月17日に開催されたデータサイエンティスト協会のシンポジウムで、こんなやりとりがあった。登壇したのは、パナソニックの阪田隆司(ビジネスイノベーション本部 AIソリューションセンター)さんと、ディー・エヌ・エー(DeNA)の小野寺和樹さん。



 2人は、データ分析や機械学習のコンペに参加できるプラットフォーム「Kaggle」(カグル)で、最高位である「Grandmaster」の称号を持つ(注1)。Kaggleは全世界で300万人以上のAI研究者や技術者が参加するサービスで、Grandmasterは日本では10人ほどしかいないという。



注1:Grandmasterになるには、Kaggleのコンペで5つのゴールドメダルを獲得する必要がある。Kaggleはチームでも取り組めるが、5つのうち1つはソロゴールド(1人参加)でなければならない



 数少ないGrandmasterの2人は、Kaggleと業務におけるデータ分析をどう結び付けているのか。Kaggleの魅力や、Grandmasterになって見えた景色などについて語った。モデレーターは、日本経済新聞でデータサイエンティストを務める「Kaggle Master」の石原祥太郎さん(デジタル事業情報サービスユニット)。



●「機械学習の初心者」からGrandmasterに



 小野寺さんは大学で経済学を専攻し、阪田さんは大学院で航空宇宙工学を専攻していた。両者とも機械学習とKaggleは社会人になってから触れたという。チームでコンペに臨むことが多いという小野寺さんは、「数学的なバックグラウンドがないので、数学が詳しいメンバーに助けてもらっています。私は特徴量エンジニアリング(注2)が得意のようです」と役割分担について語った。



注2:機械学習モデルの精度向上に向けて、追加の変数(特徴量)を作ってデータセットに追加すること



 大学と大学院で機械学習を学んでいた石原さんは、「大学ではSVM(サポートベクターマシン)など有名な手法を学びますが、それがKaggleの文脈では必ずしも使われないことがあり、理論と実践の両方で良い勉強になっています」と話す。阪田さんも「理論を知っているだけじゃKaggleでは良い順位を取れません。実際に手を動かして、体系化しにくいノウハウを実体験に基づいて学べるのがKaggleの良い所です」と続ける。



 正解がない課題に取り組み、試行錯誤しながら答えを探していく姿勢は、業務でも大事だ。Kaggleは順位がはっきりと出るため、「他のユーザーに負けたくない」という気持ちに火がつくと、ついついKaggleに夢中になってしまうのは石原さん含め、三者共通だという。



 Grandmasterになったことで、何か反響はあったのだろうか。



 2014年にKaggleを始め、19年6月にGrandmasterになった阪田さんは「Kaggle熱が高まっているのを感じます」と語った。



 「一般的にKaggleが知られるようになったのはここ2年くらいで、手を動かして一定の成果を出せる人材の重要性が理解されてきたと感じます。Grandmasterになったことは社内でも大きく取り上げてもらい、データサイエンスの業務に関係ない人にも周知されましたし、データサイエンスに関する業務の相談も増えました。自分のキャリア的にも大きな意味を持っています」(阪田さん)



●データサイエンティストの仕事がなくならない理由



 AutoMLなどの自動化ツールによって機械学習のプロセスが自動化されると、機械学習エンジニアの仕事が奪われるのではないか――ここ最近は、こうした脅威論も散見される。こうした意見をどう受け止めているか、石原さんが2人に問いかけた。



 阪田さんも小野寺さんも、「データサイエンティストの業務全体が自動化ツールで代替されるとは思えない」という意見で一致した。



 阪田さんは「機械学習エンジニアの定義が曖昧ですが、データサイエンスには現場の課題を正しく理解し、それにマッチした評価指標やKPIを設定して分析にもっていくことが大事です。そうした問題設定は、実際に手を動かして勘所が分かっている人間にしかできないでしょう。データサイエンスの業務全体が置き換わることはあり得ないと思います」と主張する。



 小野寺さんも「私も阪田さんと同じ考えです。そもそもモデリング自体はほぼ自動化されてますよね。それよりも社内の折衝や(稟議の承認をもらう)スタンプラリーを自動化してほしいですね」と笑う。



 データサイエンティストの力量が発揮されるのは、モデリングよりもその前段の問題設定ということだ。「事業部から、こういう課題を解きたいという相談があったときに、どういう手法を使えばいいかの目利きはKaggleで養われました。古典的な手法で間に合うことも多いですからね。それは今の自分のコアな力になっています」と阪田さん。「関係部署とのコミュニケーションや会議は案外多いですし、自分の頭の中にあるものをいかに分かりやすく相手に伝えるかを考える作業はばかにできません」と強調する。



 事業部が抱える課題をデータサイエンスの問題に落とし込める人材は、今後も必要とされそうだ。


    あなたにおすすめ

    ニュース設定