日経コンピューターと日本経済新聞による、国内大手企業113社を対象にした共同調査結果(参照:AI活用、独自調査で判明した9つの事実)によると、83%の企業が「AIを活用中」と回答(「今は活用してないが、今後活用予定」という回答を含めるとその割合は98%を占めるそうです...)。そのうちの6割は「期待通りの効果が得られている」と回答しており、その導入したAIに一定の効果を感じているようです。

今や、大手企業にとっては「AIは当たり前」の存在。月額課金型のクラウドサービスの充実により、中小企業での導入も進みつつあります。一方で、「AIなら何でもできそう」と何となく導入したものの、失敗している企業は意外と多いと言います。

"データ活用" が、AI導入の成功 or 失敗を決める

unsplash.com

日経コンピューターと日本経済新聞による調査でも、「必要なデータが十分に揃っている」と回答した企業がわずか10%。導入したものの「使えないAI」になってしまっている原因に「データの不足」や「データ形式のばらつき」などが挙げられるでしょう。

AIと聞くと、必要な情報を自動で収集し、勝手に賢くなるかのようなイメージを持たれている方も多いのですが、AIの精度を高めるためには、マニュアルやFAQなどAIにやらせたい業務に関わる十分なデータを基に、その知識を学ばせる作業が必要不可欠です。しかし、AIに学ばせるためのデータは、ExcelであったりPDFであったりWebベースであったりと、バラバラの形式であるケースが大半。そのため、データはあるが、形式がバラバラで整えるための時間を割けない、どれが重要なデータか判断が難しいなど、AIを導入された企業の方の悩みを耳にするケースも少なくありません。

本当に未学習データと学習済みデータで"確信度"に差が生じるのか?

"確信度"とは、「AIが判断する確からしさのこと」を指します。AIが正しく動いているかを判断する指標と言えるでしょう。今回、未学習データと学習済みデータを使って、Watsonが質問に対して正しく回答できるか、「確信度に差が生じるか」を検証した結果を見てみます。

1つ目の質問では、未学習データの場合、質問に対して正しい回答が導き出されるのはわずか40%程度であるのに対し、学習済みデータの場合は99%という結果になりました。これは、AI自身が合っているか自身がない状態です。2つ目も同様で、未学習データの場合はただし回答が導き出されるのはわずか25%でしたが、学習済みデータでは93%にまで改善しています。

さらに3つめの質問は、AIが自信満々に間違った回答を導き出しているというケースです。「国保の加入手続きには何が必要ですか?」という質問を「税金」というカテゴリーに区分してしまっています。しかし、ちゃんと学習させることで、「国民健康保険」というカテゴリーに正しく区分されるようになりました。

画像: 本当に未学習データと学習済みデータで"確信度"に差が生じるのか?

AIの潜在的な能力がどんなに高くても、十分に学ばせていなければ、本来の価値を発揮できません。このように正しく学習させることで、AIを活用できるようになります。

AI導入成功のカギは "学習データ"にあり

Watsonにおける学習データとは、それぞれの業種に特化した専門知識や蓄積されたナレッジのことを指します。業界や各企業の業務内容に応じて、適切な学習データを用意しておくことが重要です。さらに、学習データの定期的なメンテナンスも欠かせません。

しかし、学習データの作成/メンテナンスとは「専門家の知識をAIに教える」こと。AIに学習をさせるためには、AIを扱う人にもその分野のスキルや知識が求められます。社内のリソースだけでは学習データの構築やメンテナンスが難しい場合もあるでしょう。

S&Iでは、Watsonを活用するための学習データの専門スキルを持つ組織「CORPUS factory」が、学習データの構築をサポートするサービスを提供しています。第三者がお客様に代わって学習データを構築することは、本来の在るべき姿とは異なるように思えますが、CORPUS factoryは、効率よくWatsonの学習データを作成し、さまざまな形で熟練させるためのノウハウと継続的に学習データを運用していくためのプロセスを熟知しています。

初期導入の前に挫折したり、苦労して用意した学習データの精度が悪く使い物にならない...といった課題を抱えている方は、ぜひご相談してみてください!

▶︎ CORPUS factoryについて、詳しくはこちら!

コメントを読む・書く

This article is a sponsored article by
''.