advanced-evaluation Guide

Name: advanced-evaluation
Author: sickn33

This skill should be used when the user asks to "implement LLM-as-judge", "compare model outputs", "create evaluation rubrics", "mitigate evaluation bias", or mentions direct scoring, pairwise comparison, position bias, evaluation pipelines, or automated quality assessment.

38,911 starsby sickn33

When to use advanced-evaluation

How to use advanced-evaluation

advanced-evaluation is a Claude skill in the SKILL.md format. Add it to your Claude environment from the source repository below, then it activates as a user-invocable skill when your task matches its description.

Skill source

https://raw.githubusercontent.com/sickn33/antigravity-awesome-skills/main/plugins/antigravity-awesome-skills-claude/skills/advanced-evaluation/SKILL.md

Details

PlatformClaude

CategoryAI & ML

Invocationuser-invocable

Modelany

Maintainersickn33

LicenseMIT

advanced-evaluation Guide

When to use advanced-evaluation

How to use advanced-evaluation

Details

Resources