Skip to content

SomeoneKong/llm_long_context_bench202405

Repository files navigation

llm_long_context_bench202405

简介

本项目包括两部分:

  • 各家LLM API SDK 的简单统一包装,未来会随着其他测试项目的需求而不断扩展。
  • 包括一个Long context能力和速度的测试方案。

使用方式:

  • 在环境变量中配置各家的API key,具体变量名请参考client_impl中的具体实现
  • 修改并运行 gen_test_cases.py 生成测试用例
  • 修改test_main.py中的测试任务设定,然后运行它来生成测试结果

由于目前各家LLM API的兼容性和请求速率限制问题都较多,所以目前本项目的任务配置和统计都需要人工进行。

测试结果数据

  • 每个测试的数据在独立分支上,注意查看本项目的分支。

未来测试可改进点:

  • SiliconFlow 带有session之间的缓存,每个请求首次请求时间较长,后续会快。目前的统计中会自动剔除最长的一次,导致第一次的较高延迟没有被纳入。 需要考虑设计能评估带有缓存方案的性能。

About

No description, website, or topics provided.

Resources

License

Stars

Watchers

Forks

Releases

No releases published

Packages

No packages published

Languages