请问能给一点实现动态batch size的建议吗？ #489

shushanxingzhe · 2024-03-04T11:59:13Z

现在训练时样本长短不一，如果batch size设的过大会导致OOM，设的过小GPU算力有没有被利用起来，我想把数据根据大小排序或分组，然后希望训练时能根据根据当前batch的长度来动态调节batch size，达到算力的最优利用，气温能给我一些实现的建议吗？

Jintao-Huang · 2024-03-04T14:08:53Z

可以设计这样的算法:

shushanxingzhe · 2024-03-05T01:23:21Z

@Jintao-Huang 谢谢你的回复，我的意思是，在代码的大概什么位置，可以动态的设置每个批次的batch size或者说可以调节每个批次取到的样本数，比如说哪个文件或哪个类

tastelikefeet · 2024-08-27T13:15:44Z

动态batchsize已经在transformers最新版中支持

Jintao-Huang self-assigned this Mar 4, 2024

Jintao-Huang added the enhancement New feature or request label Mar 4, 2024

tastelikefeet closed this as completed Aug 27, 2024

Provide feedback