【資料公開】「LLMアプリの品質保証って何すればいいの？」の全体像を整理して勉強会をやりました - Cybozu Inside Out

こんにちは！サイボウズOfficeという製品でQAをしている水谷(@dog_dog_3dog)です。

社内で「LLMアプリの品質保証～LLMの特性から全体像まで～」というテーマで勉強会を主催しました。この記事では、勉強会の内容と開催の背景を簡単に紹介します。

資料の内容

資料では、ざっくり以下のような流れで話をしています。

COMPASからのケーススタディ
まずAIの品質問題の実例を見て、なぜAI独自の品質保証が必要となる背景をさらっています。
LLMアプリ独自の品質特性
生成AI品質マネジメントガイドラインをもとに、機能要求満足性・信頼性・安全性・公平性など10の品質特性を見ています。
リスク分析
品質特性をどうやってテスト戦略に落とし込むか、一つのやり方としてリスク分析を紹介しています。
LLMアプリ全体の品質保証
LLMアプリはLLMの部分と従来通りのシステムで出来上がっています。LLMアプリの品質保証というとLLMに注目されがちですが、これまで通りのテストも変わらず重要だよね、という話をしています。