LLM 평가 전략(GuideLLM, lm-eval-harness, OpenAI 평가 워크숍) — Taylor Jordan Smith