【CEDEC 2021 フォローアップ】ゲーム制作効率化のためのAIによる画像認識・自然言語処理への取り組み


こんにちは。開発運営支援のゲームエンジニアの立福です。CEDEC2021で「ゲーム制作効率化のためのAIによる画像認識・自然言語処理への取り組み」というタイトルで発表を行いました。ご参加いただいた皆様には改めてお礼申し上げます。

当日の資料がこちらになります

本講演は事前収録でしたので、講演中はチャットで質疑応答をさせていただきました。こちらのフォローアップ記事では、講演中にいただいたご質問へ改めて回答させていただきます。

Q:自動タグ付けで90%ほどの精度だと人間による確認と最終的なリソースタグ付け作業を省略することはできないと思うのですが、AIでの推論結果を作業効率化に繋げるためにどのように利用されたのでしょうか?

A:今回のケースでは既存の画像データの大半には既にタグが付けられており、新規に画像を追加する場合に少しでもタグ付けが楽にできないか、という点を目標にしていました。そのため最終的なタグの判断は画像を追加するユーザーがおこなっています。

Q:SSDの学習データに対してデータオーグメンテーションは行わなかったのでしょうか?

A:画像データを増やすのではなく、学習で使用するときに拡大、縮小、切り抜き、明るさ変更などのオーグメンテーションを行なっています。今回はここに回転処理が入っていなかったので、画像に対してキャラクターが横向きになっているケースなどで顔を認識できませんでした。このようなケースは少ないので、どこまで回転させたほうがいいのかは難しいところです。

Q:Juman++で処理時間は問題になりませんでしたか?

A:ランタイムでの実行時には、形態素解析の後の処理のほうが重いので特に問題になりませんでした。むしろテストデータを大量に用意するときに一晩かかってしまうのが大変でした。他の高速な形態素解析モジュールと比較しながら使っていったほうがよいと思います。

Q:校正の変更履歴から誤字のパターンのデータを集める方法では足りなかったのでしょうか?

A:文章校正の現場で使われているファイルはフリーテキストで、実際の校正の情報以外にも様々な情報が含まれていました。そのため自動で抽出するのはあきらめて、目視で抽出しました。

Q:講演中で出てくる「出現順」というのは、持っている語彙の中で、その位置に該当する単語がでる確からしさの順番、という理解であっていますか?

A:はい。文章中の該当位置の単語の出現確率の高い順番という意味です。説明を完結にするために出現順という言葉を使っています。1が最高で、BERTの語彙数が最低です。

最後に

今回の講演では私たちのチームでAIの導入に取り組んだ事例を紹介させていただきました。機械学習・ディープラーニングに関する講演ではモデル本体の説明が多くなるのですが、実際の導入ではインフラ構築とデプロイの面でも様々な課題が発生します。そのため、こちらの講演では実際にAIを導入してアプリケーションとして提供するまでの全体のプロセスについて説明させていただきました。これからAIを導入される方の参考になれば幸いです。