プロンプトエンジニアリング
2件
LATEST DROP
13 September, 2025記事を読む
LLMアプリ評価指標と実装ガイド【2025年版】:自動評価・人手評価・オンライン評価の設計
RAG/対話/要約/分類などLLMアプリの品質評価を、オフライン自動評価・人手評価・本番オンライン評価の3層で設計。メトリクス、ゴールドデータ作り、評価プロンプト、A/Bテスト、コスト管理まで。
編集部おすすめ
気になるテーマをショートリストでチェック
カテゴリハイライト
よく読まれているテーマから深掘り
最新記事
新着順にコンテンツをピックアップ