イベント出展用の通話録音デモ機構築の様子をお届けしている「クロ・クロ・クロ!」、おかげ様でなぜか人気上々です。第3話から少しご無沙汰してしまいましたが、本日は「第4話」をお届けします。

《前回のあらすじ》
デモ機の設定と稼働テストに取り掛かった、ミスターKと配下のアイタタターな皆さん。さまざまなトラブルを乗り越え、オペレーター対応の採点・評価をするQuality Management (QM)の「評価フォーム」が表示されるところまではこぎ着けたのですが、録音した会話内容を分析するSpeech Analytics (SA)のテストをしてみたところ、録音データがテキストに変換されず、トランスクリプション(=文字の書き起こし)のフィールドは真っ白け!
リーダーのミスターKは、不用意な発言のせいで編集部が作った「ペナルティーボックス」に隔離され、エースの黒ヒゲ幹部は顎ヒゲに電気シェーバーの刃が絡まって退席中。
そして、残された全身黒タイツ姿の黒子Aさんと黒猫Tさんの頭の中は真っ白け!……ということで、続きをどうぞ。


ミスターK「あ゛ーっ、出られたっ!脱獄成功!」

【登場人物】
ミスターK
ミスターK: グループのリーダーで、黒仮面に黒マント姿の黒幕。巨大化をはじめとするさまざまな"特技"を持つ謎の怪人物。
黒子A
黒子A: ミスターKの右腕となって働く、黒タイツ姿の痛い部下。割と冷静。セリフはすべて「イーッ!」
黒猫T
黒猫T: ミスターKの左腕となって働く、黒タイツ+猫耳姿の痛い部下。割と悪フザケ。セリフはすべて「ニャー!」
黒ヒゲ幹部
黒ヒゲ幹部: ミスターKの頭脳となって働く、口数少なめの幹部。割とシャイ。作業を実質的に取り仕切る影の黒幕。

注)この記事の登場人物の設定や会話の内容などはフィクションです。

黒子A「イーッ!」(おっ、お帰りなさいませ!いったい、どうやってあの閉鎖空間から脱出できたのです?)
ミスターK「ふん。小賢しいカフェサン記者め。ペナルティボックスとかヌかしておったが、HTMLソース内に"box"というそのまんま名前のクラス定義があったので、削除してやったワ」
黒ヒゲ幹部(と、登場人物が記事のHTMLソースを書き換えタ?)
ミスターK「フッフッフ。この私を排除したくば、次元波動爆縮放射器やコロニーレーザーでも持ってくることだな」
黒猫T「ニャー!」(RPGの次はSF!? フィクションだから架空の兵器でもやりたい放題できるね! わくわく)

記者・注 (ミスターKが脱獄するというシナリオは聞かされていなかったので、正直びっくりです)

『さァ、始まるザマスよ!』『いくでガンス!』『フンガー!!』

ちょっとだけお三方に合掌したくなる見出しではありますが、それはさておき…。前回幽閉したはずのミスターKがいきなり脱獄するとは想定外でしたが、第4話が早くも数十行に達してしまったので、とっとと話の続きと参りましょう。
前回は、録音された通話データがうまくテキスト化されたか確認するためにSAの管理画面を開いてみたら、テキスト化の精度を見るどころか何も出力されず、黒子さん&黒猫さん、真っ白な灰になっちまいました。

ミスターK「むむっ?あとはSA分析機能の設定とテストでフィニッシュなのに、なにをモタついておる?」
黒子A「イーッ!」(それが、トランスクリプション(音声からの文字書き起こし=テキスト化)がうまくいかないのであります)
黒猫T「ニャー!」(空っぽなんだよね。ぜんっぜんテキスト変換してくんないの)
ミスターK「黒ヒゲ幹部はどうしたのだ。きゃつなら経験豊富なので、すぐに原因を探せるはずだぞ?」
黒猫T「ニャー!」(それが、鋼のおヒゲに電気シェーバーがぶら下がったまま取れなくて…)

そう。頼みの綱のミスターKも黒ヒゲ幹部もそれどころではなく、黒子さんと黒猫さん、原因が分からないまま完全にお手上げ状態になってしまったのです。

ミスターK「…ふむ、状況は分かった。QMとSAを使うためのユーザー権限は設定されていて、評価機能も動いているのに、SA用のインスタンスを作ろうとすると、そこでテキスト化されないので進めなくなった、というわけか」
黒子A「イーッ!」(そのとおりであります)
ミスターK「まあ、原因はたぶんアレとアレをやってないからだろう」
黒猫T「ニャー!」(もう分かっちゃったの?スゲー!!)
ミスターK「うむ。しかし、私はデモ当日の展示についての打ち合わせに行かねばならぬので、また留守にするぞ。メールでSA分析機能の設定方法を送るので、しばらく待っておれ」

リーダーともなると多忙なのは仕方ないのですが、この先の原稿を書きやすくするために、せめて「アレとアレ」がナニとナニなのか、ちょっとだけ教えてくださいよ、ねぇ?ミスターKってば!

これが最後の設定作業!「SA分析機能」の設定、なんだけど…

それからしばらくして、ミスターKから黒子さんと黒猫さん宛てに、ロール設定と言語モデルの導入に関するメモがそれぞれ添付ファイルの形で届きました。でも…ミスターK、よほど急いでいたのか、あまり細かいところまでは書かれておらず、概略というか、大まかというか、アバウトというか、粗大というか、大ざっぱというか…。まあ、メモですからねぇ…何もないよりはマシなんでしょうけど、ヒントにぐらいにはなるのかな。

黒猫T「ニャー!」(う~、これ、番号とか振ってないんだけど、どっちから先にやればいいの?)
黒ヒゲ幹部「そ、それぐらい、ベリントのSAの導入ドキュメント(英語)見ろ」

そうです。悩む前に活字を読みましょう。活字で記されたドキュメントを読みましょう。そこにドキュメントや説明書があるのなら、たいていの解決策は、その中に記されてるはずです―なんて、記者はそのドキュメントを書くことを生業としているので、ちょっと熱くなってしまいましたが(笑)、とにかく導入ドキュメントを開いてみたら、案の定、次の順番で設定するよう説明されていました。
  1. SAのロールをサーバーに登録
  2. 日本語の言語モデルを登録
  3. テキスト化する通話の抽出ルールを設定

黒子A「イーッ!」(ふむふむ…順序とやり方は分かったであります)
黒猫T「ニャー!」(ライセンスを追加して、SAのロールを設定ね? FTRでもやったから楽勝~♪)

本記事では何かとお騒がせな黒子さんと黒猫さんですが、飲み込みは早いので、一度やったことならお茶の子さいさいで片づけてくれます。だからこそこのミッションのメンバーに抜擢されたわけですが、普段が普段なので、そんなことすっかり忘れていました(笑)。

さて、SAのロールが設定できたら、お次は言語モデルの導入です。
言語モデルとは、まあ、辞書ファイルみたいなものですね。日本語IMEに日本語の辞書ファイルが入っていないと、日本語変換入力ができないように、言語モデルが入っていないと、通話音声をテキスト化できないんです。

黒猫T「ニャー!」(あれれれれ?言語モデルが「English」(=英語)しか選べないよ?)
黒子A「イーッ!」(日本語の言語モデルなんて、どこにあるんだろ?マニュアルにも載ってないし…)
黒ヒゲ幹部「ああ、アレだな。ちょっと待っテろ…」

日本語の通話音声を変換するのですから、日本語の言語モデルの導入は必須です。英語の言語モデルしか選べないと、日本語の音声が変な英文に変換されてしまいます。例えば「君が代」の歌詞が「♪Kiss me, girl, and your old one~」みたく空耳変換されまくるわけで、そうなると手ぬぐいTシャツなどのノベルティーの大量発注へとつながり、運用コストの面から見てもよろしくありません。
幸い、今回は黒ヒゲ幹部が検証用のNASから日本語の言語モデルのファイルを見つけてきたので、所定のフォルダーに置いて、「Laguage Model Distributor」という言語モデル導入ツールを起動。今入れた日本語のファイルを指定したら、無事日本語(Japanese)が選択肢に出てきました。

やっぱり、黒ヒゲ幹部がいると進み方がスムーズですよね。さすがですね。天才っスよね。一騎当千、職人芸。いよっ、大統領!

黒ヒゲ幹部「☝前回イジり回してくれやがっタので、おだてにはノらない…」
黒子A「イーッ!」(☝あれ、黒ヒゲ幹部に長いセリフ言わせる魂胆だよ)
黒猫T「ニャー!」(でも、ちょっと欲しかったな~。手ぬぐい…)

記者・注 連載4回目ともなると、だんだんこちらの意図が見抜かれてしまいそうですが、まだまだ登場人物の皆さんには痴態をさらしていただきますので、どうぞご安心を。

さ、さて…、残るは3番目の、テキスト化対象通話の抽出ルールの設定でしたね。これはJavaを使ってWebブラウザー上で設定するため、クライアント側で作業をするようにと、ベリント社のガイドに記載されていたようです。

クライアント側でテキスト抽出の「ルール」を設定。録音装置番号に録音サーバーの番号を入力すると、その番号が「ルール」の一部として組み込まれる

この設定項目は多岐にわたるので、残念ながら黒子さんたちの奮戦の模様は割愛しますが、この設定画面で、どの録音サーバーの、どんな通話をテキスト化するのかという条件をいろいろと設定しておくと、必要な通話内容だけをテキスト化してくれるようになります。
↑上の例では、端末側のWebブラウザー内で、テキスト化対象通話の抽出条件として、録音サーバーの番号を設定しています。これにより、これ以外の番号の録音サーバーの通話は、テキスト化の対象外となるわけです。

これで設定完了のはずなのに…。SA、動け!SA、なぜ動かん!?

さあ、これでミスターKから教わったSA分析機能の設定は完了です。でも、「お疲れさま」って言おうと思ってたのに、黒子さんと黒猫さん、なんだか肩を落としているみたいです。

黒子A「イーッ!」(ドキュメントをしっかり読んで、日本語の言語モデルもちゃんと導入した…)
黒猫T「ニャー!」(SAのロールも設定したよ。あとテキスト化の対象の設定もね)
黒子A「イーッ!」(うまく設定できているはずなんだけど、まだ正しく作動しない…)
黒猫T「ニャー!」(音を入れてみたんだけどね、やっぱりテキストにならないの)
黒子A「イーッ!」(結構がんばったけど、もう黒ヒゲ幹部に頼るしかなさそうだ)
黒猫T「ニャー!」(え~ん、助けて~、Dラえも~ん!!)

黒子さんと黒猫さんたちが作業開始時に手渡された手順書は、正しく作動する/作動させる手順を示しているものですが、失敗や間違った設定をした後、どうフォローするかまではあまり詳しく書かれていません。だから、アクシデントが発生する度にオロオロしっ放し。

黒ヒゲ幹部「Dラえもんじゃあねエし。…こういウ時は、ログを見る!」
黒猫T「ニャー!」(え、ログなんて取ってあったの?)
黒ヒゲ幹部「任せロ。『Log Manager』と『Logger Manager』、両方設定シてある」

ログの出力設定は各コンポーネントごとに個別に存在していて、詳細モードでログを残すには都度設定しなければなりません。これを忘れて納品すると、障害発生時に痛い目に遭うことになります。
また、ログ採取用のツール「Log Manager」と「Logger Manager」は、"Log~"の方は Ver.11以降のコンポーネント用で、"Logger~"の方は Ver.10以前からあるコンポーネント用。機能が同じで名前も似ているので、ここだけのハナシ、とっとと統合しちゃってほしいのですが、今のところ両方とも設定しておかないとフルセットのログが記録できないという厄介さんなんだとか…。

さてさて、解説している間に、ログを解析していた黒ヒゲ幹部の鼻が、何か嗅ぎ当てたみたいですよ。よーしよし、偉いぞ黒ヒゲ号~。

黒ヒゲ幹部犬じゃあねぇヨ!
黒猫T「ニャー!」(Dラえもんだもんね)
黒ヒゲ幹部「違ウって!! …それよか、コレ……何も動いてねエし。アソシエーション(関連付け)できてなサげ」

おぉーっと!! ついに、ついに、つ~いにラスボスの部屋にたどり着いたか!? どうやら関連付けの設定にミスがあったようだ!! どういうことなんでしょう、解説の…っと、また泡吹いて倒れられるといけないので、無茶振りはやめておきますね。
 
とにかく原因が判明したようで、レコーダーと SAのトランスクリプションサーバーを関連付ける必要があったようです。「元となる音声」はレコーダー内にあり、そのレコーダーとトランスクリプションサーバーが連携しなければ音声はテキスト化されません。考えてみれば当然なのですが、確か最初にやった関連付け設定では、レコーダー(Recorder)が選択肢になかったので、選ばなくてもいいものだと思っていたのでしょうか。これが大きな落とし穴だったようです。

アソシエーション(関連付け)設定画面で「Show Associations Outside The Scope」にチェックを入れることで、選択肢に「IP Recorder」が出現した

黒猫T「ニャー!」(あ、IP Recorder キタ━━━━━━\( ゜ω ゜)/━━━━━━!!!!)
黒子A「イーッ!」(今であります!黒ヒゲ幹部っ!!)

黒ヒゲ幹部「クリィィィィィィィィィィック!!!!」

ぷにぷにしたマウスパッドの上で、↑こんな大げさなセレモニーがあったかは関知しませんが、黒ヒゲ幹部がシステムを再起動させると、さっそくテキスト化関連のログが出力され始めました。
テキスト化された結果が表示されるまでには少し時間がかかりそうですが、ログを見る限りでは、安定して作動しているようです。

黒ヒゲ幹部「Hum... it's easy as pie」(ふん… ら、楽勝)
黒猫T「ニャー!」(黒ヒゲ幹部すげー!)
黒子A「イーッ!」(今オレ、黒ヒゲ幹部になら抱かれてもいいと思った!)

聞かせてもらうぞ、このトランスクリプションの謎を!

黒ヒゲ幹部の八面六臂の大活躍のおかげで、やっと「STT」(=Sppech To Text):つまり、音声のテキスト化の機能が使えるようになりました。そうなったらもう、トランスクリプション(=文字の書き起こし)の精度がどれほどのものか試さずにはいられません。
どっきどきの胸の鼓動を抑えながら、録音用の電話機のハンドセットを手に、さっそく録音開始!!

黒猫T「ニャー!」(えーと……)
黒子A「イーッ!」(………何しゃべったらいいんだろ?)
黒猫T「ニャー!」(自己紹介じゃむなしいし、歌うわけにもいかないよね)
黒子A「イーッ!」(コンタクトセンターのオペレーターさんの会話集みたいなものが欲しいね。ネットで探してみるか)

…というノリで、ネットで電話応対記録のサンプルを見つけた二人は、それを参考にいくつかのシチュエーションを想定したシナリオを考えて、録音用の台本を作っちゃいました。

ネットで見つけた応対サンプルを参考にして作った、録音用の台本。「ビビディバビディ・テレコム」は架空の会社名だが、電話口で話すと舌を噛みそう(笑)

黒子A「イーッ!」(よし、録音してみよう)
黒猫T「ニャー!」(なんだか、ドキドキするね)

台本片手に、しばし二人でトーク。それからしばらくの間、システム内部で分析処理をさせて、そのあと改めてポータルで結果を確認してみたら、やった!やりました!録音した音声がテキストになって記録されています!! 分析成功です!!!
おめでとう、黒子Aさんと黒猫Tさん。ここまでの苦労がついに実を結び……あれ?また、なんか表情暗くね?

黒子A「イーッ!」(???あれれ?)
黒猫T「ニャー!」(な、なんでこーなるワケ?)

トランスクリプションのテストに成功したはずの二人のところに、たった今戻ってきたミスターKが、二人の作業の進捗度を見に来ました。

ミスターK「どうだ、動くようになったか?」
黒子A「イーッ!」(かくかくしかじか)
黒猫T「ニャー!」(かくかくしかじか)
ミスターK「だ~から『かくかくしかじか』だけで話が通じたら、エスパーだと…ん??」(モニターをのぞき込む)

予想外のテスト結果を目にしたミスターK、思わず「特保」のお茶をスプラッシュ!!

なんと、テキスト化された黒子Aと黒猫Tの会話が、すべて「いーっ」と「にゃー」だった!!
……って、ここはフィクションですからね(笑) この画面も合成です。

黒猫T「ニャー!」(わ~~っ!!ミスターKが愛飲のトクホのお茶吹いた!!)
ミスターK「ゲホッゲホッゲホッ!な、なんじゃこりゃぁ~~っ!
黒ヒゲ幹部「お~!あのマスクの空気孔、側面にあっタのか。かっこイい」
黒子A「イーッ!」(そんなのいいから、何か拭くモノ!早くっ!!)

黒子さんと黒猫さんは台本どおりにセリフを読み上げて録音しただけなのですが、テキスト化された会話内容はすべて「いーー」と「にゃーー」。何をしゃべっても「いーー」と「にゃー」。ある意味最強の暗号化処理かも知れませんが、復号化できないと意味がありません。

ミスターK「ええい、極めて正確に記録されてはいるが、これでは音声が認識されていても、正しくテキスト化されたかどうか分からんではないか!」
黒子A「イーッ!」(はい…面目次第もございません)
黒ヒゲ幹部「『イーッ!』と『ニャー!』だけで会話が成立すルところにはツッコミなシ?」
ミスターK「お前たちでは力不足であったか。では…そうだな。私が吹き込んでみるとするか」
黒ヒゲ幹部 (ス、スルーさレたっ!!)

設定もテストもひとまず完了して、次はデモ用の通話(会話)データの録音というところで足踏み。しかし、ようやくリーダーが率先して作業を進める気になったのか、ミスターK自ら録音に臨もうと言い出しました。
でも、この先まだ一波乱か二波乱、いやいや波乱だらけなんですけどね、たぶん。経験則で知っていますので。とにかく、まだ何かやらかしちゃってくれそうですよ。


ところで、第4話の今回が最終回のはずだったのに、当初は予想していなかった反響の多さと、ミスターKから提供された膨大なネタを4話に収めきれなくなり、ここで「つづく!」ということで延長決定!! でも1話だけですけどね。
 
次は第5話。今度こそ本当の本当に最終回です。ミスターK『26のひみつ』が、まだ三つぐらいしか明かされていないので、最終回までにすべての秘密を、それが無理ならあと10個ぐらいむりやり暴いてやりたくて……もちろん冗談ですから、そんなに身構えないでくださいね(笑) > ミスターK

―つづく

コメントを読む・書く
Next

This article is a sponsored article by
''.