主题
https://arxiv.org/pdf/2603.01919
很多所谓“提供大模型能力的 API 服务”,实际上并没有用它们宣称的模型。这篇论文讲了如何测试。
https://mp.weixin.qq.com/s/h0-Il3XBX060R8JGV2uSuA