LLM-Leaderboard:由社区联合创建的用于展示大型语言模型(LLM)的集中式排行榜。排行榜上列出了各种模型在不同基准测试中的表现,如 Chatbot Arena Elo、HellaSwag、HumanEval-Python、LAMBADA、MMLU 以及 TriviaQA 等。:
https://github.com/LudwigStumpp/llm-leaderboard
LLM-Leaderboard:社区LLM的集中式排行榜
Previous: CAMEL:从LLaMA衍生并适应临床的模型
Next: WebCPM:首个联网支持中文问答开源模型