@prefix schema: <https://schema.org/> .
@prefix af: <https://anchorfact.org/ns#> .

<https://anchorfact.org/kb/ai/llm-evaluation-benchmark-harnesses-and-task-registries>
  a schema:TechArticle ;
  schema:headline "LLM Evaluation Benchmark Harnesses and Task Registries" ;
  schema:url <https://anchorfact.org/ai/llm-evaluation-benchmark-harnesses-and-task-registries/> ;
  af:status "public" ;
  af:confidence "medium" ;
  af:confidenceScore "0.725" ;
  af:confidenceBasis "verified_sources" ;
  af:generationMethod "ai_structured" .

<https://anchorfact.org/kb/ai/llm-evaluation-benchmark-harnesses-and-task-registries>
  schema:citation <https://huggingface.co/docs/evaluate/en/a_quick_tour> ;
  af:sourceTier "B" .

<https://anchorfact.org/kb/ai/llm-evaluation-benchmark-harnesses-and-task-registries>
  schema:citation <https://lm-evaluation-harness.readthedocs.io/writing_tasks/groups_and_benchmarks/> ;
  af:sourceTier "B" .

<https://anchorfact.org/kb/ai/llm-evaluation-benchmark-harnesses-and-task-registries>
  schema:citation <https://crfm-helm.readthedocs.io/en/latest/code/> ;
  af:sourceTier "B" .