【CEDEC2023 フォローアップ】AIによる自然言語処理・音声解析を用いたゲーム内会話パートの感情分析への取り組み


こんにちは。開発運営支援のゲームエンジニアの立福です。CEDEC2023では「AIによる自然言語処理・音声解析を用いたゲーム内会話パートの感情分析への取り組み」というタイトルで発表を行いました。ご参加・ご視聴いただいた皆様、ありがとうございました。

当日の資料がこちらです。

質問への回答

こちらのフォローアップ記事では、講演中にチャットでいただいた質問へ改めて回答させていただきます。

Q. 結果を出している手法を用いても結果に寄与しなかったのは、感情分類というタスクが類義語、修飾語に対して学習率が低いということになるのでしょうか?

A. 類義語、修飾語を使った文書水増しは文章全体の意味や構造を大きく変えることはありません。文章が全体として変更されていないと、別の文章として学習しないので精度に寄与しなかったのではないかと考えています。逆に、安易に騙されてくれないという意味で、BERTクラスのモデルもかなり賢いと言えそうです。

Q. 様々な試行錯誤の知見の共有ありがとうございました。学習に使用したデータは複数のタイトルのテキストを混ぜて作成されたのでしょうか?あるいは特定のタイトルに絞って学習データを作成されたのでしょうか

A. 今回の講演で発表した内容は特定の1プロジェクトのみのシナリオ・音声を利用しています。キャラクターの表情のパターンはプロジェクトによって異なるので、データを混ぜるのは難しいです。ちなみに、今回はゲーム中の全キャラクターのセリフをすべてまとめて学習させています。キャラクターごとに学習してみたのですが、データ数が少なすぎてよい結果は出ませんでした。

Q. 自然言語処理に関してですが、ゲームのテキストの場合、キャラクター名やオリジナルの用語などが存在し、公開されている言語モデルには含まれない語彙が登場すると思いますが、それらの語彙を追加し再学習したのでしょうか?

A. 事前学習モデルに付属のvocab.jsonはそのまま使っています。ゲーム中の語彙やキャラクター名に関してはファインチューニングの過程で学習できているようです。

最後に

今回の講演では社内のスクリプトチーム用に開発した感情分析ツールの事例について紹介しました。テキスト・音声の感情分析は初めて扱う分野でしたが、試行錯誤を行なってある程度の精度まで辿り着くことができました。AIの機能開発は実際のデータを学習させてみないとわからないことが多いので、まずは手を動かして試してみることが大事だと思っています。今回の発表内容が少しでも皆様の参考になれば幸いです。

私たちは現在、技術力と創造力を兼ね備えたAIエンジニアを募集しています。
詳細はこちらをご覧ください。次世代のAI技術を開発し、一緒に未来を切り開いていきましょう!