多模态模型如何多卡部署 #1236

AlbertBJ · 2024-06-26T12:39:03Z

我看文档，多模态模型这块的部署，都是针对单卡部署的，那如果单卡太小，如何多卡的 tensor 并行部署

AlbertBJ · 2024-06-27T07:20:18Z

我看文档，多模态模型这块的部署，都是针对单卡部署的，那如果单卡太小，如何多卡的 tensor 并行部署

我这边用qwen-vl-chat来测试的，设置可见两张卡，模型可以运行，但是我看两张卡上 gpu 显存使用量不一致啊，是因为 vit的存在么？

tastelikefeet · 2024-08-28T06:45:05Z

考虑使用lmdeploy进行部署：
--infer_backend lmdeploy

Jintao-Huang self-assigned this Jun 28, 2024

tastelikefeet closed this as completed Aug 28, 2024

Provide feedback