llm-evaluation Guide

Name: llm-evaluation
Author: davila7

Master comprehensive evaluation strategies for LLM applications, from automated metrics to human evaluation and A/B testing.

27,615 starsby davila7

When to use llm-evaluation

Master comprehensive evaluation strategies for LLM applications, from automated metrics to human evaluation and A/B testing.

How to use llm-evaluation

llm-evaluation is a Claude skill in the SKILL.md format. Add it to your Claude environment from the source repository below, then it activates as a user-invocable skill when your task matches its description.

Skill source

https://raw.githubusercontent.com/davila7/claude-code-templates/main/cli-tool/components/skills/ai-research/llm-evaluation/SKILL.md

Details

PlatformClaude

CategoryAI & ML

Invocationuser-invocable

Modelany

Maintainerdavila7

LicenseMIT

llm-evaluation Guide

When to use llm-evaluation

How to use llm-evaluation

Details

Resources