工具档案

promptfoo 是什么？

LLM 评测与红队工具，支持 GPT、Claude、Gemini、DeepSeek 等模型对比，提供声明式配置和 CI/CD 集成。声称被 OpenAI 和 Anthropic 用于内部测试，适合 AI 产品团队做质量保障。

智能体 / 自动化最佳信号分 96 21,751 stars

ToolPulse 结论

promptfoo 专注于 LLM 输出质量和安全性评估，21751 stars 中包含企业级用户背书。Topics 覆盖 pentesting、red-teaming、vulnerability-scanners 等安全场景，对 AI 应用上线前的合规审查有直接价值。320 个 open issues 相对可控，声明式配置降低了测试用例编写门槛。局限性在于仅覆盖 LLM 推理层，无法评估端到端产品体验。建议配合流量录制工具构建完整的 AI 质量门禁。

OpenAI/Anthropic 企业级用户声明式配置简化测试编写 CI/CD 集成支持质量门禁

历史推荐记录

2026-06-01：第 4 名，信号分 96，值得试用

来源证据

ToolPulse AI 的判断基于公开仓库信息、项目描述、近期更新、GitHub stars 和工具分类信号。

打开原始项目