人工知能の研究者兼実務家両方の顔をもつ芦原さんの世界観と目指すもの
大学で博士に行き、研究をしながらも、企業にも在籍し、実務でコンサルティングや実装までこなす芦原さん。論文に数式が入っていないから方向性を変えたという無類の数学好きは、「どんな経験をして」、「この先どこを目指すのか?」たっぷりと聞いてきました。
芦原 佑太
2014年 電気通信大学情報理工学部 卒業
大学では主に解析学について研究を行う。
2016年 電気通信大学大学院 情報システム学専攻 修了(学科総代)
大学院ではDeep Learningの数理について研究を行う。
2016年 同大学院 博士後期課程に進学
2016年 株式会社クロスコンパスに入社
業務でも、研究でも、DeepLearningを扱っている。
現在はクロスコンパスのR&Dセンターで上級研究員を務めている。
数式が少ない論文を読むのがつらくてDeepLearningの世界へ
人工知能はいつからはじめられましたか?
もともとは数学で物事を考えたいタイプでした。
ただ、研究している途中でこの先、研究者としての道がみえにくいなと感じ、大学院の時は別の学科を探しました。
当時興味があったのは、複雑ネットワークやマルチエージェントと呼ばれているようなものでした。
興味をもった理由は、複雑ネットワークの話のひとつで、単体では特段に賢くはないのですが、たくさん集まると複雑な現象が生まれるようになるという話を聞いてからでした。
例えばイワシの群れなどはまさにそうで、イワシは個体の比較的簡単な性質で大きな群れになります。
その現象を数式で説明するのが難しく、イワシの個体を数式でつくったとしても、群れをつくる理由を数式で説明することは難しいです。
現実にも同じようなことが起こっていて、個々のものが単純な性質でも全体では複雑な現象が起きており、その理由というのは実はなかなか説明できません。
その分野を研究するのは面白そうだと思い、やっていました。
いかに小さい単位のものを単純にするのかは大事だと思っています。
今は自動運転などでDeepLearningを使って、車がモノを見るようなものは複雑になっています。
僕のイメージでは、車が単純な性質しかなくても街にたくさんセンサーが設置されていて、社会全体でうまく自動運転ができているというような、そういう世界のほうが理想じゃないかと思っています。
自律走行という意味では重要な研究ではありますが、車だけ賢くてもまだまだかなと思います。
個々がいかに単純で、それらが合わさって複雑な世界をつくるかというのは、とても世の中で大事かつ面白そうなので、そういう研究分野に飛び込もうと思っていました。
その当時特に印象深かったことは?
そんなマルチエージェントシミュレーションに興味をもって入ったのですが、実は入ってすぐに、数学の論文ばかり読んでいたせいで、数式が少ない論文を読むのがつらすぎて指導教員に相談しました。
数式がもう少し多い方がよいという話をしていたところ、複雑ネットワークとは全然違うのですが、DeepLearningを指導教員にすすめられました。
指導教員からは、個々のニューロンは情報をもらったら送ることしかできないけれど、全体では複雑な情報を表現するから面白いなどと言われ、うまくのせられました(笑)
そのような経緯があって、大学院の途中からはニューラルネットワークの世界に変更しました。
当時の研究室は指導教員が異動して間もない頃だったので、DeepLearningをやっている学生がおらず、その研究室でDeepLearning研究の第一号になりました。
先生は数学を専攻していた人がいたら研究をして欲しかったそうで、複雑ネットワークに興味をもって入った僕は、先生にうまくはめられました(笑)
なぜそこまで数学が好きなのでしょうか?
小学校の時に微分・積分を読んでいて、ワイエルシュトラスという方がいるのですが、その方の定理に乗っている数式を見て、かっこよく見えたからです。
普通なら記号が何となくかっこいいで終わるかもしれませんが、僕はその記号の意味まで何となく知りたくなって、はまっていきました。
本には難しいことがたくさん書いてありましたが、難しいことがわかるとうれしいと感じ、そういう好奇心もあって、自然と学んでいきました。
機械学習の基礎の勉強は大事
画像や自然言語などどの分野を主にやられていますか?
自然言語処理はあまり興味の対象ではないのでやっていません。
ただ、画像や音声は基本的にやっています。
現在の業務は製造業のお客様が多いので、センサーデータ・画像などを主に扱っています。
DeepLearningをやっていてポジティブに感じることは?
ちょうど今DeepLearningブームになっていますが、ニューラルネットワークを学生のうちに触れられたのは恵まれていたなと思います。
社会人のキャリアをつくっていく上でも、数年先を考えれば、今やっておいてよかったなと。
逆に、ネガティブな点としては、流行だっただけに、Deep Learningのアルゴリズムばかり勉強していて、機械学習の基礎の勉強を後回しにしていたことです。
ビジネスではなく研究においては、それこそ基礎から着実にやらなければいけないことがありますよね。
この分野が早すぎるせいで、結果を急がれることがよくありました。
学問としてやる上で急かされることは、かなりの障壁だと思っています。
スピードが早すぎるということは、自分もそれだけ成果を出せば広く知られるきっかけにはなりますが、 研究が雑になりやすかったなと、他の論文を読んでいても実感しています。
例えば、KerasやTensolflowを扱っていたりすると、ニューラルネットワークの基礎動作原理を知らなくても書けてしまうのですが、実際中で何をどうしているのかは、プログラミングの知識をベースにしているとよく知らないということが起こり得ると思います。
そうするとうまくいかなかった時に、なぜうまくいかなかったのか理解や対処ができないことがあります。
どの分野で学んでいくにしろ、最低限の礼儀となるようなベースナレッジはありますから、その辺をしっかり勉強する必要はあると思います。
実際、きちんと基礎から学んでいる人と、とりあえず使ってしまう人では、差があるような気がします。
何か行き詰まった時に、どこに立ち返ればいいのかという点では、全然違うと思いますね。
だから、プログラミングはもちろんですが、それ以外のベースの知識を学ぶことが相当大事だと思います。
研究をしながら仕事ができる環境に魅力を感じ現職クロスコンパスに入社
大学院を卒業した後は、インターンをしたのでしょうか?
大学院在学中に今の会社でインターンをしていました。
当時全脳アーキテクチャの勉強会に参加していて、今の会社に出会いました。
実は、弊社の社長の息子さんは、高校時代の同級生で、同じ部活でした。
そのため、社長の顔はちょっと知っていました。社長だとは知らなかったのですが。
以前部活の試合に来ていたことがあるな、この親父さんは、なんて思って声をかけました(笑)
声をかけたら、『人工知能の会社をやっている』とのことでした。
そこでつながりができたので、研究室に1回遊びにきてもらったら、「うちにインターンに来い」、「鍛えなおしてやる」と言われました。
当時の研究室では、僕以外にニューラルネットワークをやっている人がいなかったので、やっている人たちとの環境を欲していた僕とのニーズが合い、行くことにしました。
当時のクロスコンパスは、技術者が3名しかおらず、田町に小さなオフィスがありました。
インターンといえど人数も少なく、みんなとても忙しそうで、バタバタやっておりました。
それが大学院2年生の時で、1年間くらいインターンをしました。
インターンをしていたら、自然と内定通知書が届きました(笑)
ただ、博士に行こうと思っていたので相談したところ、両方やればいいと言われました。
そんなやりとりがあって、実は今博士後期課程の2年生でもあります。
だから研究員という名刺をもっています。
この分野で新しいことをやろうとすると、外に出なければ、見つからないこともたくさんあるので、研究をしながら仕事をするのは理にかなっている部分もあると思います。
データを使って新しいことをするような職場の環境は、研究室の中にだけいたら出会えない発見や、実現できないこともあると思っています。
同じような条件を提示してくれそうな他社と比較されたりしましたか?
弊社は、新しいことにどんどんチャレンジさせてくれるため、働くならここがいいなと思っていたので、比較はしていません。 例えば、論文を読んできて、使いたいような方法があると話をすると、すぐやらせてくれます。
そういう意味では、圧倒的にスピードが早いです。
弊社の社員は、論文をちゃんと読む人が多いので、おすすめとしてタイトルや中身をざっくり会議の場で紹介すると、会議の次の日には読んだうえで質問がくることもしばしばあります。
情報が入ってきたらすぐ消化して、自分のものにしたがるという貪欲な人が多いので、そういう切磋琢磨できるような環境は貴重だなと思います。
だから働くならここがいいとはじめから思っていました。
論文を探すのも大事な能力。プロジェクトへの応用を意識し論文を見る
現在はどのようなことをされていますか?
例えば、『こういうデータを持っている』、あるいは『このデータからこういうことをしたい』というような要望に対して、ソリューションの提供(実装を含む)を行っています。
データとゴールを結びつけるようなコンサルティングと実装がメインですね。
もうひとつ、発表されてから1週間たっていないような新しい論文も含め、技術的に重要になりそうな論文をいくつか読み、社内に向けて使えそうなものを皆さんに共有しています。
論文は探すのも大事な能力だと思っています。
例えば、論文を探す際、著者で探すなどいろいろな方法がありますが、僕は会社で他のメンバーが行っているプロジェクトも知りつつ、 論文で発表された新しい技術を合いそうなプロジェクトに向けて共有することを意識しながら読んでいます。
論文の情報収集は主にどこからされていますか?
自然言語処理にそこまで興味がないと言いましたが、目は通しています。
当然、画像や音声もですが。
最近のDeepLearningの勢いで、画像や自然言語などそれぞれの分野でDeepLearningで処理しましょう、という風潮はでたものの、画像や言語処理はもともと違う分野ですよね。
そのため基本的にはそれぞれの分野の中で、要所技術を持っている先生を見つけておくことがまずひとつです。
面倒だったら、何をやっているかを早めにおさえてリスト化をしてしまうことです。
具体的には、概要と導入と結論だけでもとりあえず読んで、何をしているのかを把握しておくのがいいかと思います。
そして、読むか読まないかのリストに早めにストックしておけば、後でじっくり読む時にも、何千もある中からでなく、ストックしておいた中から探せて、早く読めると思います。
最近の業務で特に印象深かったものは?
最近は言葉を聞いてきている人たちが多く、例えば強化学習を使ってみたいという要望などプラスアルファのご注文をいただくことが多くなってきました。
間違っていない事前知識があることはとてもありがたく、機械学習が流行ってくれたおかげか、話がスムーズになることはありがたいなと思います。
打ち合わせの中で、お客さんの、「こういうことがしたい」という状態は結構具体化されてきたようにも思います。
仕事をしているとものすごいスピードで変化していて、1年前と現在では皆さんが使う言葉が変わってきていると感じますね。
今後はプロジェクトが完了したら終わりでなく、継続的にお互いが勉強しあえる形が理想
今後どこを目指していかれますか?
7月くらいにあったAIEXPOに出店していたのですが、細かな技術を知らなくても、データをうまくとって、それをいれればちゃんと処理をしてくれるプラットフォームを作ることが目標としてあります。
ちなみに、製造業向けのプラットフォームについては、使用してもらっています。
今後はそれを各分野に拡大していき、プラットフォームのコミュニティを広げていくというのができるといいですね。
個人的にはプロジェクトを受注して、3ヶ月、6ヶ月のプロジェクトをやって終わりでなく、お互いの会社が成長するような形にできたら理想だなと思います。
先ほどのプラットフォームにつながる話なのですが、お互いに成長できるコミュニティができるというのが大事で、お互いに継続して勉強しあえる環境ができるというのは、お互いにメリットがあると思います。
少し前に、クロスコンパスといえばAIの駆け込み寺みたいな記事が書かれていましたが、駆け込まれて願いがかなったらさよならというのではなくて、また次も駆け込んでほしいという感じですね。
そのためにはお客さんの役立つ形になるまで誠実にやりきりたい思いです。
今は特に、『うちはDeepLearningが使えますよ』といったところで、短期的なお客さんしか来なくなっていると思います。
DeepLearningをどうやって使っていくかということや、今後会社としてどうその技術を使っていこうかまで踏み込める位置にいないと、単発な付き合いになりがちだと思います。
大きなコスト削減に期待できるコンピューターシミュレーションをやっていきたい
個人として目指していることはありますか?
シミュレーション環境に今は興味があります。
例えば、魚の群れを数式で表現しようとすると、複雑な数式が必要ですが、コンピューターシミュレーションは難しいことは考えなく表現できて、ショックを受けました。
そんなコンピューターシミュレーションの世界は魅力的で、コストを低減するというのも大きなメリットだと感じています。
例えば、強化学習の場合、ものによってはぶつけたり壊したりして、学習をしているような例もあります。
ただ、それを続けていると金銭的負担が大きくなってしまいます。
学習環境にも使えるリアルなシミュレーション環境をつくることができれば、 革新的になると思っています。
そうすると、もちろんやっている自分も面白いですし、トライアンドエラーのコストも目に見えて下がっていき、電気代だけで済むようになっていきます。
ただし、シミュレーションが現実と離れすぎてはいけないので、それをいかに作るかというのが、個人的にやりたいもののひとつです。
DeepLearningをビジネスに応用されていくというのは何となく形は見えてきています。
ただ、DeepLearningと呼ばれるものの大半は大量にデータが必要で、リアルに使える強化学習などこれからやっていくものは1回1回の試行にコストがかかっていくものだと思います。
例えば、新薬をつくるためのプロセスは、莫大なコストをかけてやっています。
この薬を投与するとどうなるという結果を数値変換してシミュレーションをするようなものができればよいなと考えています。 データ元とデータの結果が過去のもので大量に集まっているはずなので、それをDeepLearningに学ばせることで嬉しいのは、ある人に対してどういう薬を打つとこういう結果になるという予測ができることです。
そのモデルは、シミュレーションに帰着すると思っていて、それが全体のコスト削減につながると思っているので、是非やっていきたいです。
お金儲けは考えているわけではないのですが、コストが下がらないと、発展しない分野がたくさんあると思います。
プログラムが書けて知識があるのは前提、うまく伝えられる人は市場価値が高い
市場で求められる人材像は?
プログラミングは必要で、それは勉強していくしかないと思います。
ほかに大事なことは、人にちゃんと今の技術の状態を伝えられる人材です。
この市場では、新しい知識が常に入るので、勉強はみなさん当然やりますが、人に情報を共有できる、伝えられる人があまり多くないように感じます。
基礎勉強ができていてプログラムが書けると、困ることはないですが、さらに求められるレベルは人に伝えられるところですね。
コンサルティングの現場では、自分たちの技術に嘘をつかず相手に納得してもらえるように伝えられるか、というのがあります。
AIエンジニアって呼ばれる人たちは、単にコードが書けるだけでなく、技術説明を含めなんでもできる実力がついた上で、何かを人に伝えられる人だと思います。
コードが書けるだけの人をすごいAIエンジニアとは思っていません。
知識があるまでは前提で、伝えられる人がステップアップすると思います。自分もそうなりたいと思っています。
付加価値を高めるために重要なことは?
個人の付加価値を高めるという意味では『このAIエンジニアはなにをやっているのだろう?』って謎のままで終わらないようにすることかなと思います。
誰ふり構わず、臆することなく、自分のために、いろんなことを「今すごい人」に聞いてほしいと思っています。
すごい人がいるなって見つけたうえで、その人たちとしっかり話してみることです。
人を見て、目線が鍛えられていくことが重要だと思います。
外に出て人と話せることって大事で、 どんな質問でも怖がらずに聞き、何でも勉強して吸収しにいくことです。
『相談のレベルが低いと、この講師に失礼なんじゃないか』とか思うかもしれないですが、それは風習としてよくないと思います。
付加価値を高めたいなら臆せず質問することが重要で、最初から変に前置きを入れたりして(初心者で申し訳ないのですが、みたいなこと言って)、自分のレベルを下げないことです。
人工知能技術の面白さは、人間の見立てよりスムーズに実現されること
人工知能の未来についてどう思っていますか?
起こりうることはいろんな人が予言しているのですが、僕が思うのは、その予言よりも早く予言されたことが終わるっていうことですね。
2045年のシンギュラリティに関しては、シンギュラリティなものって紆余曲折あってどこがポイントなのかわからず、気づかないからシンギュラリティだと思っています。
各々の情報が思ったよりスムーズに、気づかないうちに実現されるって思います。
人工知能という技術を聞いて期待する人たちは、うちは3年後に導入できるかもって考えがちですが、案外1年で実現できることもあります。
人工知能技術の面白さは、人間の見立てよりもスムーズに実現されることだと思います。
悲観的な未来はあまり考えておらず、これからこういうのが実現されるという憶測よりもっと早く実現する、それが近未来だと思います。
そして、個人的には先々はそんなに予測をしたくないです。
3年でこれ作りましょうってなったとき、次の1カ月にやることが決まってしまうので、1日の過ごし方が変わってしまうのがいやだと感じてしまいます。
転移学習と強化学習をもう少しビジネスの現場で活用したい
短期的に注目している技術はありますか?
転移学習は個人的には注目しています。
転移学習は、事前にあるデータで学習しておいて、そのあと人からもらったデータで解析し、そのモデルを最初に別のデータで学習させた状態でほかのデータに使うと、性能が良くなる技術のことです。
転移学習は、技術的には結構前から出ているのですが、ビジネスの場であまり活用されておらず、注目されるべき技術のひとつだと思っています。
転移学習の世界でみると、データ同士、関連がなさそうに見えても実は学習という側面では使えるデータになる可能性が(低いですが)あるので、使えないゴミデータだと思っていたものが宝になるチャンスがあります。
もうひとつは、強化学習は面白いなとずっと思っています。
ビジネスで使えるシーンがまだ多くないと言われますが、強化学習は研究に値する考え方を持っていると思います。
特に、自律学習が重要な技術になってきていると感じています。
ただ、意味をはき違えてはいけなくて、データや環境がずさんでも自律的に学んでくれるわけではないので、いろいろ誤解は招かない説明が必要です。
強化学習については、難しいと思いつつも、もう少しビジネスに進展できそうなところは色々ありそうです。
世界の大学の研究でも、実世界に向けた強化学習の話については増えてきています。
囲碁やゲームなどのクローズドな世界ではなく、オープンな世界への強化学習がだいぶ増えてきて、要注目です。