首先,生图总 GPU 时间 = GPU 服务器启动时间 + 运行生图时间。
而启动不同等级的 GPU 服务器速度之间差异。A100 做为比较受欢迎的高级 GPU,有可能需要排队等待,所以启动时间会比较长。
另外,如果你运行工作流并不复杂,这样并不能发挥 A100 GPU 的所有性能,可能最多快 1、2 秒。但启动时间可能会慢 3、4 秒,所以最终总时间更长。
但如果你运行的是文生视频工作流,这个工作流相对复杂,能发挥出 A100 的性能,其运行文生视频工作流的速度甚至能比本地 RTX 4090 还要快(经过我的测试,相同的工作流,A100 耗时 52.8s,而 4090 耗时 81.38s)。
所以经过我们的测试,我们的建议是:
如果使用 SD1.5 模型或者相对简单的工作流,使用 T4 就足够了。
如果使用 SDXL 模型或者复杂的工作流,使用 A10G。
如果要生成视频,建议使用 A100。