みなさんこんにちは。dottの清水です。
dottのCTOとしての役割を果たすために、今日からdottで行っているAI(人工知能)やディープラーニング(深層学習)などの研究開発の話題について連載を始めることになりました。毎週火曜日に公開する予定ですので、みなさまぜひよろしくお願いします。質問やテーマのリクエスト等もぜひぜひお待ちしております!
dottの研究開発 – R&D
dottが得意としているのは、業務システムを企画の段階から一緒になってテンポ良く構築していくことです。そして今では素晴らしいdottのメンバーによって、さまざまなシステム開発が行われています。
そんな中、この連載ではこれまであまりお話しする機会が少なかったdottのシステム開発とはちょっとだけ異なるR&D事業、いわゆる研究開発の話をしていきたいと思います。
下町のディープラーニング工場
「下町のディープラーニング工場」と自分で表現することがありますが、dottは新しいニューラルネットを研究するほどの専門家でもなければ、Deep Mindのように強化学習AIについて世界最高の知識があるわけでもありません。あくまで自分たちの目的は、技術をビジネスや社会課題の現場でも使えるようにし「課題を解決する」ことです。
車の話に例えると、何百億もかけて世界最速のFormula 1のマシンを開発するというよりも、そこで生まれた最先端の技術をうまく市販車に取り入れていき、運転がしやすく便利な車を開発するという感じでしょうか。
なので「下町の工場」を自負しているわけですが、僕は生まれも育ちも新潟県は柏崎です。
24/365の危機管理情報監視
そして今日は、実際に運用状態に入って1年以上経過し、問題なく稼働し続けている「NewsPic」というシステムについてお話ししたいと思います。
NewsPicとは、株式会社レスキューナウ(以下、RSQ社)様に向けて開発をおこなった、ニュースの自動分類システムの名称です。RSQ社は「情報配信サービス」「危機管理サービス」といった、災害等に関する情報を収集し配信する事業を行っており、「RIC24」という危機管理情報センターでは、有人による24時間体制の情報監視を行っています。
「危機管理情報」というのは、災害や事件・事故などによって人々の生活に影響がある情報を指しています。RIC24では大量に配信されるニュース記事の中から危機管理情報とそうでないものを24時間365日監視し取捨選択することが求められます。
AIのラスト1メートル
RSQ社ではこれまでも一般的なニュースの自動分類の仕組みを使っていましたが、ヒアリングを行う上で以下のような問題があることがわかってきました。
- RSQ社が「危機管理情報」として扱いたいニュースと一般的に重要な「災害ニュース」にギャップがあった。
- 偽陰性(本来は危機管理情報として扱いたいニュースを、危機管理情報でないと判定する状態)として判定されたニュース見つける作業のインパクトが大きい。
このように、汎用的な自動化手法を用いて大多数の自動化ができるものの、自分達のオペレーションやビジネスに100%そぐわないことで、せっかくの自動化が使いづらいものになっている状態のことを、dottでは「AIのラスト1メートル」と呼んでいます。
ただし、本稿を書きながらそう呼び始めたので、僕がこう呼んでいることを知っている人は社内にも存在しないのが少し残念です。
重要なことは人それぞれ
一般的に良しとされているものと、専門性の高い現場で求められるものにはギャップがあることが多いです。それは専門性が高ければ高いほど多いと思います。まさにRSQ社が抱える問題もそのような状態でした。元々利用していた自動化の手法に問題があったわけではなく、分類するための技術をオーダーメイドする必要がありました。
例えば文化財に指定されている寺社で火災が発生した場合、人々にとって関心のある重要度の高いニュースと判定することは素晴らしいことですが、RSQ社では「どれだけ人々の生活に影響があるか」ということが重要であるため、火災の結果怪我人や交通機関の影響がなければそれほど重要度が高くないニュースと判定する必要があります。
そして細かい条件で文章を分類するタスクは、ルールベースで処理するには不向きだと考えました。ルールが多岐に渡り、さまざまなルールを網羅して自動分類器作ることが難しく、ニュースの表現が想定と違えばすぐに破綻してしまいます。
そのためNewsPicではディープラーニングを利用した自然言語処理を用い、より柔軟に分類する必要がありました。
これらの問題をどのように解決したか、それはまた次回の記事で。