AI×教育で新しい取り組みにチャレンジするClassi伊藤さんのキャリア観とは?
教育業界に人工知能(AI)を使った新しい視点で貢献しようと試みる、Classi伊藤さんは、なぜその道を選び、どこを目指すのか?たっぷりと聞いてきましたので、ご紹介します。
伊藤 徹郎
大学卒業後、大手金融関連企業にて営業、データベースマーケティングに従事。
その後、コンサル・事業会社の双方の立場から、さまざまなデータ分析やサービスグロースに携わる。
現在は、国内最大級の学習支援プラットフォームを提供するEdTech企業「Classi(クラッシー)」のAI室で、データサイエンティストとして活躍。
営業からキャリアをスタートし、社内公募でデータ分析へ転向
これまでのご経歴を教えていただけますか?
もともと大学の専攻が金融工学で、統計やちょっとした金融市場のデータ分析には馴染みがあり、大学卒業後は、金融関連企業のSBIホールディングスに入社しました。
最初のキャリアは営業で、金融情報のデータ販売を経験したことから、データ分析に興味を持ちました。
その後、社内公募制度を使ってデータベースマーケティングをやりたいと手をあげ、そこからデータ分析のキャリアを築きはじめました。
当時は、ちょうどリーマン・ショックの余波で金融業界は厳しい時期だったこともあり、事業部が解散になってしまって、別部署に異動になってしまったのですが、データ分析のキャリアを歩んでいきたくて、データアナリスト職に転身しました。
移った会社は、ALBERTというデータ分析会社です。
そちらでPOSデータの分析やECサイトのレコメンデーション、アドテクノロジーの分析などに携わりました。
データ分析に必要な、統計学や機械学習のための数学などをみっちりと学び直すこともできました。
3年くらい携わったところで、コンサルも面白かったのですが、分析結果から改善などは手が届かず、そこまで携わりたいという思いが強くなってきました。
そこで、事業会社に戻りたいと思い、クックパッドに移りました。
最初はデータ分析をやっていたのですが、ディレクター職に転身し、サービスの機能改善や株主優待の特典の仕組みなどを作りました。
その後は、マネーフォワードに移り、サービス開発やサービスグロースを担当しました。
マネーフォワードでは、新規サービスの立ち上げも経験して、リリースすることができました。
0→1などを一通りやってきたので、そろそろ次のキャリアを考えようかなと思い始めた時に、世の中ではディープラ-ニングブームが沸き起こりました。
個人的には、ディープラーニングに距離をおいていた部分もあったのですが、そろそろ知っておかないとまずいぞと思い始め、次のキャリアとしてデータサイエンティストにチャレンジしようということで、現職のClassiに入社しました。
現在はAI室という部署に所属しています。
学校では統計をやられていたのに、なぜ最初営業にいかれたのでしょうか?
就職活動では幅広い会社を見て回りました。
最初に入社したSBIの面接で面接官(営業の方)から、「営業は、最初しかできないからやったほうがいいよ」というアドバイスをいただき、確かにその通りだなと思い、営業職につきました。
営業はずっとやっていくつもりではなかった、ということですかね?
そうですね。
私の中で、3年で1億売るというKPIを勝手に自分の中で持っていて、それを達成したら違う職種につこうと考えていました。幸いなことに、予定より早く2年で達成することができました。
その後、たまたま社内の公募で「データベースマーケティングやりたい人!」みたいな募集があったので、「じゃあやってみようかな」という形で手をあげました。
とはいえ、なにもない状態からのスタートだったのですごく苦労しました。
社内にいても何もわからないので、外部のセミナーやコミュニティに参加して、少しずつ情報を集めていきました。
Tokyo.Rなどのコミュニティが立ち上がったのもそれくらいのころで、割と黎明期からよく参加していました。
当時は全然知らないなと思いながらやっていましたが。
人工知能分野に別の視点を与えられると思い、教育業界へ
たくさんの選択肢がある中でなぜ現職を選ばれたのですか?
今、教育業界が2020年からスタートする改革に向け、ICT化を推進していこうという流れがあり、これからさまざまな学びのデータが蓄積していくフェーズなんです。
今までデータ分析であまり聞かなかった業界に早くから携わるのに興味を持ちました。
もう一つ別の選択肢として、人工知能(AI)を本気で活用していこうという会社に転職するというのもあったんですが、そういったところは、今kaggleをやっている強い若者がどんどんでてきていて、同じ土俵で戦っても、ずっと専門でやってきたわけでもないので、勝てないなと思いました。
それより、もっと新しいところで私の経験をいかし、「新たにデータサイエンスに取り組んでいる分野もあるんですよ」というのを広めて、優秀な若者を誘引するのをやっていきたいと思いました。
また、人工知能分野の研究って日進月歩なんですが、みんないかに良いデータを集めて、コンピューティングリソースを活用してネットワークのチューニングをしていいモデルを作るかってことをやっているんです。
私は、教育という分野で、子供が学習して成長していく様子をうまくモデル化することで、人工知能分野に別の視点を与えられるのではないかと思って、そこにチャレンジしようと日々仲間と議論をしています。
全然違うところから、教育業界に貢献できるんじゃないかという仮説を持ち、チャレンジしたいと思い、現職に入社しました。
伊藤さんの考えるデータサイエンティストの定義ってどのようなイメージでしょうか?
業界団体であるデータサイエンティスト協会の定義するスキルマップ(https://www.slideshare.net/DataScientist_JP/2017-81179087)はすごく良いと思っていて、結構、羅針盤的につかっています。
私は、アナリスト時代は統計領域をやっていましたし、事業会社ではビジネス寄りに転身したかなと思っています。
事業会社ではエンジニアも多く、エンジニアリングに関しても学べました。
そこは継続的に伸ばしていきつつ、今は再び統計や数学の力を伸ばしていきたいと思っています。
あのスキルマップの各領域を最大化していくのがデータサイエンティストとして目指すべきところだと思っています。
アナリストをやっていた当時、発注側の無茶なオーダーもたくさんあり、事業会社側のコントロールって割と大事だと感じました。
RFPとかでもありましたが、実現可能性がなさそうな夢物語のパワポってあるんですよ。
それをどう軌道にのせていくかっていうところにすごく苦労した記憶があります。
今そういうことをkaggleマスターやコンピューターサイエンスの人ってやりたがらないような気がしています。
そういうところを整備して、彼らが活躍できるようになるといいなという気持ちがあります。
今後は教育用の特化型の人工知能を作りながら、新たな領域へ広げたい
現職ではどんなことをされていますか?
今は、アダプティブラーニングという、個々の生徒にあわせた学習コンテンツのレコメンデーションのようなものをやっています。
今までの教育は、カリキュラムに沿って集団で画一的に進んでいく感じでしたが、やっぱりできる子はできる、できない子はできないままでそのまま授業は進んでしまいます。
そこに対して、生徒それぞれの習熟度にあわせて適切な教育コンテンツをレコメンドしていこうというプロジェクトにジョインしています。
それだけではなく、学校は、一般の企業などと比べて少し遅れているといいますか、未だに紙文化だったりするので、そこを少しづつIT化していこうっていうのはあります。
手書きを大事にされる学校も多く、そこでディープラーニングを使った技術が活躍できそうな場がたくさんありそうなので、そういうところに絡んでいくという状況です。
Classiは、学校教育の課題をどこよりも理解しているベネッセと、ネットワーク環境の整備やタブレットの提供などの豊富な実績をもつソフトバンクのジョイントベンチャーです。
今のEdTech業界は、塾や英語など一部だけをサポートするというのがフォーカスされやすいのですが、教育×ICTの強みを活かして、学校教育そのものを変えていこうというのがClassiの強みだと考えています。
そして、学校教育に関するさまざまなデータを活用していこうというのが、日本で今までどこもできていなかったところです。
従来の学校は、学校毎のデータとして閉じられたデータでした。
Classiには、2014年の提供開始から、それらのデータが、どんどんたまっています。
現在は、これらのデータをどう活用すれば、ユーザーに還元していけるのかを社内で考えているところです。
サービスのシェアとしても、全国の高校の約4割超、80万人以上のシェアがあります。
それだけのデータがあり、企業が公式に提供しているアプリで、学校単位で契約するものなので、そこに定期テストや外部の模試の結果などの教育データが入ってきます。
今、日本全国で高校って5,000校くらいなんですよ。
そのうちの2,100校がClassiを使用しています。
その活用フェーズに入ってきたというところで、私もジョインしました。
今後はどこを目指していかれますか?
まずは、2020年から開始する教育改革です。
教育改革で今どこが一番ボトルネックになっているかというと、学校の先生方の日常業務が多いことです。
Classiが、ICT化を推進することで、先生方の日常業務の業務負荷を下げ、生徒と向き合う時間など本質的な部分に時間をさけるよう支援しながら、我々のようなデータサイエンティストがそのデータ活用を通じて、新たな価値を提供できるようになるのが目指すべきところです。
そのうえで、新しい学びを提供していけるようなところを目指していきたいと思います。
サービス的にはそこなんですが、もう一つの私の軸としては、データサイエンティストのキャリアとして、人工知能を良くしていくというとおこがましいのですが、通常のアプローチとは別の人間の学習を科学的に解明していくことで、別のところから教育業界に貢献していきたいなというところの2軸があります。
人工知能の何が大切かというと、適切なデータが大量にあり、すごく膨大な計算リソースがあって、そういう環境を作れる投資ができるかが今問われていると思います。
そうすると、GoogleとかFacebookとかAmazonのような大企業が勝ってしまいます。
人間の学習が何を経て育っていくかっていうところを教育がやろうとしているところで、そこから人工知能の開発のほうにも活かせる知見があるんじゃないかなとは思っていて、それが何かを見つけたいですね。
ちょっとでかいテーマなんですけど。
先日、ゲーム業界の方ともディスカッションする機会があったのですが、ゲームの中では人工知能が昔から動いていて、かなり進化もしてきています。
なぜそれができるかというと、ゲームは開発者の箱庭の中で動いているからなんですね。
チェスや将棋もルールがありますが、そこから逸脱はできないわけです。
そういった限定条件を付与すると人工知能はとても強くなるのですが、その制約を外してしまうと途端にうまくいかなくなる。
そもそも学校ってかつては閉じていたところでもありますし、データすらもともとなかったので、そういう意味でも新しいチャレンジですし、そこで新しい領域を広げていきたいなと思っています。
データサイエンスの業界でも中々聞かないので、仲間に話しても面白そうだねっていう話はよく聞くので、楽しみです。
教育用の特化型の人工知能を作りながら、そのヒントから汎用型に広げる要素があればと思っています。
人工知能の分野ってまだ数十年で、学問として新しい分野なのでやれることってたくさんあるはずですし、ディープラーニングのブームでみんなネットワークばっかりやっているようなイメージで、他の方法もないのかなと思ってます。
ブームにも良し悪しがあって、いろいろな人がこの分野に興味を持って、日々情報がアップデートされてきたり、予算が投入される点ではものすごくいいなと思います。
一方でそういうブームは玉石混交になりやすいので、質には気をつけていきたいと思います。
たくさんあるライブラリを用途に応じて適用できる人は価値が高い
市場で求められる人材とはどんな人だと思いますか?
データサイエンティストという名の付く人はこれからも求められる傾向にあると思うんですが、ある突出した領域を一つもっていて、かつ全体感がわかる人が求められるのかなと思います。
ジェネラリストのようなところから入り、何ができるかをある程度選別してプロジェクト化したうえでスペシャリストをアサインするような人がいれば、世の中前進していくのかなと思います。
今でも業界の中で言われているのは、データサイエンスをやってみたいと入ってみたけれど、データはそろってないし、共有もされてないし、そんな文化もないしというのはよくある話です。
だから、データ文化を高められるのがジェネラリストの役割だと思っているので そこが高められたうえで、そういうスペシャリストが出すアウトプットがこれからの企業の差別化要素になるかなと思っています。
最近ではデザイナーもデザイナー組織をどう作っていくかという話があるので、データサイエンティストもそれと同じような文脈で語られるんだろうなとは思っています。
まずはデータ文化を成熟させるというのが一番求められるフェーズかなと思います。
キャリアを歩み始めた時と今現在とどういう勉強の仕方をしていますか?
社内外の勉強会やコミュニティで刺激をもらいながら、勉強している感じでしょうか。
結局コミュニティとかで同じような課題感をもっている人が集まってきて、そこで得られるものはとても多かったですね。
もちろん教科書などもみたりするんですが、数式ばかり並んでいたりするのを見ると『うわ~』って思ってしまうこともあったりします(笑)。
まあ、それは地道にやるしかないんですけど。
ただ、現実社会で求められる課題の解決方法って教科書や専門書には載っていないことが多いので、基礎体力をつけた上で、それらの応用問題をどうやって解決して行くか、SNSなども通じて情報を収集しつつ対応しています。
今も昔も、一番参考にしているのはTwitterの情報です。
あれだけ水平的にいろいろな分野の情報が展開しているのもなかなかないですし、そういう体制をこれまで積み上げてきましたから、自分にとってのもっとも強力な情報収集ツールになっています。
興味ある人をフォローしておくと、いろいろな情報や知らないハッシュタグが出てきたりして、新たな発見があるので、オススメです。
2012年ごろの国内でビッグデータという言葉が叫ばれ始めた時は、今ほどの情報量はありませんでした。
当時のマーケティング界隈は、情報を外に出すようなことはあまりありませんでしたし、時代がだいぶ変わったなと感じています。
私も、キャリアが少し長くなってきたので、そういう場を作ったりとか、Webメディアへ寄稿したりしています。
例えば、データマイニング系の人が集まるコミュニティとか、機械学習をビジネスに活用しようっていうのをカジュアルに語る場とか、あとはBI関連などです。
データサイエンティストは、なかなか横のつながりがなかったり、まだまだ人数が少ないので、企業内で孤立したりするので「情報共有しようよ」みたいな感じで集まっています。
現在、DataAnalystMeetupという事業会社で実際にデータ分析をやっている人たちが集まって共有する会を主催しています。
参加者は、事業会社のアナリストやデータサイエンティストに限定という制約を設けている少しクローズドなコミュニティですが、人気も出てきました。
情報を共有したいけれども、オープンの場だと話づらいっていう人も結構いらっしゃるので、そうした制約を設けています。
これから付加価値を高めるために重要なことは何だとお考えですか?
常に情報やスキルをアップデートしていくことだと思います。
それにつきるというか、永遠に答えはないんじゃないかと思います。
歩みを止めるとそこで終わりかなっていう気はするので、やり続けることが一番大事かなとは思います。
それと今、PythonやRなどで便利なライブラリがたくさん用意されています。
選択肢が多すぎて、皆さん何を選んでいいのかわからない状態だと感じます。
なので、きちんとロジックを理解して適切に用途に応じて使い分けられる、選球眼のようなものを適用できる人は価値が高いと思います。
私の中で危惧しているのは、アカデミックな領域で研究していた人が企業の研究者に転身してしまうことが多くなってきていることです。
グローバルな企業にどんどん基礎的な研究者が入ることで、知識の主従関係ができてしまうことが怖いなと思うこともあります。
それが杞憂であればいいですけど、オープンソースの概念と企業の囲い込みのバランスが適切になされてほしいと思っています。
ライブラリの充実化に伴って、データサイエンティストがいなくても、機械学習などを取り組める環境は整っています。
なので、よくわからないけれど、機械学習を使ってますという事例も少なからず目にしたりします。
開発時には問題ありませんが、運用が始まると技術的負債になりやすいケースが多く、メンテナンスをどのようにしていくかというのもこれからは重要な視点になるのではないでしょうか。
最近では強化学習に注目し、この分野をリサーチしていきたい
最近注目してる技術やトレンドはありますか?
私としては、深層学習系は専門の方々にお任せして、あえてそこはあんまり掘っていないんです。
ただ、論文の読み会やサーベイなどはやっているので、完全に追ってないわけではありません。
最近では強化学習の分野に注目をしていて、この分野のリサーチをしていこうと思っています。
人工知能の未来は目先でなく、先を見据えて探求することで見えてくると思う
人工知能の未来は今後どうなっていくと思いますか?
今年の人工知能学会で甘利俊一先生(理化学研究所脳科学総合研究センター脳数理研究チーム シニア・チームリーダー)が講演でおっしゃっていたのですが、「犬や猫やサルが記号操作をできるわけではない。ニューラルネットワークがあるからと言って使いこなせるわけではない。人間には特殊なニューラルネットワークがあるはずで、ディープラーニングの向こう側にある真に知的可能性を開く構造があるので、それを探求せよ。」とおっしゃっていました。
なので、目先の成果ではなくてその先を見据えて探求しなさいと、甘利先生がおっしゃっているので、私はそれに従おうかなと思っています。
このあたりが見えてくると結構ブレークスルーがあると思います。