「機械学習の研究を始めるなら今」Machine Learning Tokyoを取材

2020年03月26日

応用言語学者であるスザナ・イリチ氏は、専門としていたデータおよびテキスト分析を通じて機械学習の研究を始めました。感情分析や感情認識のプロジェクトに取り組むうち、コードの作成を始め、今は自然言語処理の深層学習プロジェクトに携わっています。現在、東京を基盤として、Googleなどの企業や理研などの研究機関と協働しています。

イリチ氏はまた、非営利団体Machine Learning Tokyoの設立者です。Machine Learning Tokyoは、熱心なエンジニアや研究者のコミュニティが一丸となってプロジェクトに取り組み、新たな技術を開発するための場を提供したり、業界の専門家を招いて定期的なイベントを開催しています。

今回のインタビューでは、日本の機械学習の傾向、エンジニアが直面している課題、Machine Learning Tokyoがどのように4800人以上のメンバーを持つコミュニティに成長したのか、 そして今後の展望についてイリチ氏にお話を伺いました。

 

日本のAIおよび機械学習の現状をどのように捉えていますか?

自然言語処理の分野では、BERTやGPT-2など、事前に学習させた言語モデルで飛躍的な進歩が見られています。これらのモデルは、ちょっと微調整すれば様々な言語タスクに応用できます。さらに、IoTに活用するためのエッジAIや機械学習への関心も高まってきていると私たちは見ています。これらは日本が得意とする分野です。

また、ビジネスへの活用から社会問題の追跡に至るまで、実世界で機械学習が利用されるケースもますます増えています。生産レベルでの機械学習には、インフラや大規模な生産パイプライン、実際の影響の評価および測定など技術的・非技術的な課題が伴います。最近私が読んだボストン・コンサルティング・グループのレポートでは、AIへの取り組みの多くが失敗に終わっているとされ、調査を行った企業のうち7割がAIの影響はわずかである、または全くないと回答しています。とはいえ、ますます技術活用が広がる市場において優位に立つためにはAIが鍵を握ると見られています。

machine learning tokyo
エンジニア、研究者、デザイナーが仮想現実・拡張現実で深層学習を探索、実験し、2日間で実用的なデモを構築した最初のDeep Perception Hackathon(ディープ・パーセプション・ハッカソン)の様子

日本あるいは世界で、機械学習に関する何か興味深い傾向はありますか?

日本では、科学と産業界の協働が行われている研究所が数多く現れています。大学から生まれたAIスタートアップも登場していますが、これは東京大学発が多く、UTEC(東京大学エッジキャピタル)など、大学のベンチャーキャピタルファンドから支援されているものもあります。私は現在、理研CBS-トヨタ連携センターの客員研究員を務めていますが、そこでは、赤石れい教授が決断科学やデータサイエンスの分野で産業界と連携しています。これは、私が気づいた日本における傾向の一つです。

もう一つの傾向は、前に述べたようにエッジコンピューティングの推進です。東京には、Preferred NetworksやLeapMindなど、この分野ですばらしいプロジェクトを行い、結果を出している企業もありますが、分散型エッジ・インフラストラクチャやハードウェア設計の最適化に取り組むEdgeCortixなどの新興企業も登場しています。

 

Machine Learning Tokyoを始めたきっかけは何ですか?

2017年7月、非常に小規模でスタートしました。私たちは二人だけで、それぞれ自分たちが必要なことを行っていました。共同創設者のユブラジ・シンデと私は別々のバックグラウンドを持っていましたが、二人とも、自分たちの専門分野の進歩に機械学習が役立つことに気づきました。そこで、機械学習コードを作成するため、週二回、コワーキングスペースでミーティングを始めました。毎週、口コミで参加する人が増え、ある時点から一つのスペースに全員が収まりきらないほどになりました。そこで、ミートアップを始めることにしましたが、それ以来かなりのスピードで成長してきました。過去二年半で東京の会員数は4,800人ほどまで増加しました。私たちの活動は、コードの作成やシステムの構築など主に実践的なものです。アルゴリズの調査・開発やモデルの機械学習を行う数多くのワークショップや勉強会を主催して、この分野のエンジニアや研究者を支援しています。Machine Learning Tokyoは2019年、Mistletoe Japan(ミスルトウ・ジャパン)と孫泰蔵氏のサポートを受け、非営利型一般社団法人として設立されました。

 

では、主な役割はエンジニアや研究者のサポートでしょうか?

2019年5月、コミュニティが急速に成長し、私たちは企業や大学との連携や提携を開始するようになったので、Machine Learning Tokyoを非営利団体として設立しました。現在、15人のメンバーから成る中核チームを持ち、主にオープンエデュケーション、オープンソース、オープンリサーチに力を入れています。新しいアルゴリズムの概念や導入方法を教える指導者を招いてワークショップを開催しています。さらに、再現可能かつ再利用可能なオープンソースプロジェクトや独立した研究も行っており、昨年バンクーバーで開かれた国際学会NeurIPSではワークショップを二つ開催しました。 

 

イベントはどのくらいの頻度で開催していますか?

Machine Learning Tokyoは毎月3〜5回、定期的にワークショップや勉強会を開いています。例えば、毎月開催されるレコメンドエンジンに関する勉強会やエッジAIラボでのワークショップなどです。そこでは、Jetson NanoやTinker Edge T、Raspberry Pi 4といったエッジデバイスやマイクロコントローラーなど様々なハードウェアを提供しています。これらのセッションでは、5〜6時間かけて概念実証を構築します。メンバーはこれまで、いくつか興味深いデモを作成していますし、実験するのはとても楽しいです。また、様々なタイムゾーンで働く各国の人々が主催し、世界中の人が参加できるリモートセッションも行っています。これらのセッションは機械学習専用で、1,000人以上が登録しています。

 

Machine Learning Tokyoの今後の目標とは?

昨年の経験から、オープンソースのプロジェクト構築と研究に集中するのは良い決断であることがわかりました。今後も、プロジェクトにさらに力を入れ、今行っている勉強会の数を増やしていこうと思っています。もう一つの目標は、海外への拡大です。私たちの取り組みに対して、海外からも非常に大きな反響が寄せられているので、グローバルなコミュニティをサポートする方法を考えています。

 

エンジニアや研究者と関わってきたご自身の経験を踏まえると、機械学習に取り組む際は、どのような課題に直面すると思いますか?

IT分野は目覚ましい速度で進化しているので、それに伴う一般的な課題があります。新しい研究論文やツール、機械学習ライブラリが毎日のように公開されています。そのため、機械学習分野の最先端技術や最新動向に精通しておくのは難しい場合があります。また、機械学習の研究をめぐるプレッシャーは相当なもので、学会での研究発表は非常に競争が激しく、いくつかの理由で批判されています。

初めて機械学習に取り組む場合は、できるだけ早く自分がやりたいことを見つけるとよいでしょう。スタンフォード大学やマサチューセッツ工科大学、カリフォルニア大学バークレー校などトップの大学が優れたリソースや教材を無料で提供しているため、この分野の研究を始めるのは、これまでになく簡単になっています。理論や数学からfast.aiなどのトップダウンアプローチまで、個別指導やツール、ライブラリがあるので、プロトタイプを作成し、失敗して、迅速に学ぶことができます。しかし、これらの情報量には圧倒されることもあるでしょう。何を専門とするのか決めておくと、情報収集もはるかに容易になります。

キャリア半ばで機械学習の研究を始める場合についてもご質問を受けることがよくあります。私はいつも、自分の専門知識と経験を生かしてトップダウンとハンズオンで機械学習に取り組むことをお勧めしています。これによって競争力を強化できるからです。

Machine Learning Tokyoメンバーの集合写真

 

Machine Learning Tokyoのイベント情報などはどこを見ればわかりますか?

多くのソーシャルメディアを使い分けています。

  • Meetup: イベント情報
  • Slack: 技術に関するコミュニティディスカッション
  • Twitter: 技術関連の最新情報
  • LinkedIn: 機械学習の活用事例

Machine Learning Tokyoは、全てのイベントや資料を無料でコミュニティに提供しています。Machine Learning Tokyoを支援したいメンバーの方はPatreonをご覧ください。サポーターには、イベントへの早期アクセスや特別招待が提供されます。Machine Learning Tokyoに貢献する方法は他にもたくさんありますので、詳しくはGitHubをご覧ください。

 

LionbridgeのAI学習データサービスについて

AI向け教師データの作成やアノテーションのサービスを提供し、研究開発を支援しています。世界の各タイムゾーンを渡る、100万人のコントリビューターが登録されており、大規模なAIプロジェクトも素早く仕上げることができます。お問い合わせ・見積もりはこちらから。

機械学習に肝心なデータやアノテーションを300言語で提供いたします。

メディア掲載結果

    AI・機械学習の最新情報をお届けします!

    Lionbridge AIのブログで紹介している事例記事やトレンドニュースといったビジネスに役立つ情報はもちろん、オープンデータセット集なども合わせてメール配信しております。