请将以下文本翻译成中文:
子部分:
-
使用单一节点模拟多节点设置 – 关于如何仅使用单个节点模拟多节点设置的说明 – 我们在这里使用了
deepspeed
启动器。
工具:
-
printflock.py – 一个微型库,它使您的
print
调用在多 GPU 环境中不会交错。 -
multi-gpu-non-interleaved-print.py – 一个基于
flock
的包装器,用于print
,可以防止当多个进程同时打印时消息被交错——这是在使用torch.distributed
和多个 GPU 时的典型情况。