单模型测试
选择任意模型进行单独测试,查看响应质量和性能指标
- • 实时响应展示
- • 延迟和吞吐量监控
- • 成本预估
- • 历史记录
A/B对比模式
并排对比两个模型的响应,支持盲测和投票功能
- • 并排响应对比
- • 盲测模式
- • 投票和评分
- • 性能数据对比
高级功能
流式输出、工具调用、JSON模式等高级特性支持
- • 流式响应
- • 工具调用测试
- • JSON格式输出
- • 自定义参数
即将支持的模型
GPT-4GPT-5Claude 3.5 SonnetGemini ProLlama 3Mistral LargeDeepSeek V3更多模型...