工具档案
promptfoo 是什么?
LLM 评测与红队工具,支持 GPT、Claude、Gemini、DeepSeek 等模型对比,提供声明式配置和 CI/CD 集成。声称被 OpenAI 和 Anthropic 用于内部测试,适合 AI 产品团队做质量保障。
ToolPulse 结论
promptfoo 专注于 LLM 输出质量和安全性评估,21751 stars 中包含企业级用户背书。Topics 覆盖 pentesting、red-teaming、vulnerability-scanners 等安全场景,对 AI 应用上线前的合规审查有直接价值。320 个 open issues 相对可控,声明式配置降低了测试用例编写门槛。局限性在于仅覆盖 LLM 推理层,无法评估端到端产品体验。建议配合流量录制工具构建完整的 AI 质量门禁。
历史推荐记录
- 2026-06-01:第 4 名,信号分 96,值得试用
来源证据
ToolPulse AI 的判断基于公开仓库信息、项目描述、近期更新、GitHub stars 和工具分类信号。
打开原始项目