Regarding the batch size used for different model training #5376

Zengyf-CVer · 2021-10-28T10:59:34Z

@glenn-jocher
I saw in README that you set batch-size like this. As far as I know, batch-size is generally 2 to the n-th power, but what is the setting of 40 and 24 here? Or is it arbitrarily set according to the different GPU memory usage?

The text was updated successfully, but these errors were encountered:

glenn-jocher · 2021-10-28T13:23:38Z

@Zengyf-CVer arbitrary for single-GPU, or use --batch -1 for autobatch.

Zengyf-CVer · 2021-10-28T13:43:45Z

@glenn-jocher
Is this autobatch designed based on the maximum memory of a single GPU?

glenn-jocher · 2021-10-28T14:09:10Z

@Zengyf-CVer it's an experimental feature only available for single-GPU training at the moment. See #5092

Zengyf-CVer · 2021-10-28T16:33:43Z

@glenn-jocher
Thank you very much.

Zengyf-CVer added the question Further information is requested label Oct 28, 2021

Zengyf-CVer closed this as completed Oct 28, 2021

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Regarding the batch size used for different model training #5376

Regarding the batch size used for different model training #5376

Zengyf-CVer commented Oct 28, 2021 •

edited

Loading

glenn-jocher commented Oct 28, 2021

Zengyf-CVer commented Oct 28, 2021

glenn-jocher commented Oct 28, 2021

Zengyf-CVer commented Oct 28, 2021

Regarding the batch size used for different model training #5376

Regarding the batch size used for different model training #5376

Comments

Zengyf-CVer commented Oct 28, 2021 • edited Loading

glenn-jocher commented Oct 28, 2021

Zengyf-CVer commented Oct 28, 2021

glenn-jocher commented Oct 28, 2021

Zengyf-CVer commented Oct 28, 2021

Zengyf-CVer commented Oct 28, 2021 •

edited

Loading