新款NVIDIA L40S GPU 提供了经济实惠的人工智能训练和可视化

在最近的一篇文章中，我们强调了NVIDIA L40S作为NVIDIA A100和H100 GPU的一个值得注意的替代品，它在价格、性能和功能方面具有明显的优势。为了进一步探讨这个话题，我们制作了一个视频，展示了L40S在我们对超微的访问过程中的实际应用情况。

L40S相比其前身L40来说，在人工智能训练和推理方面代表了一个重大的改进。尽管它们有着共同的血统，但可以明显看出，L40S在性能方面带来了独特的改进。

虽然L40和L40S在绝对内存容量、带宽或FP64性能方面可能无法与A100和H100竞争，但值得注意的是，人工智能工作负载越来越受到重视，相对于传统的FP64计算。对于大多数用户来说，这种权衡应该是完全满意的。

虽然L40S在内存方面似乎比A100少，但它支持NVIDIA Transformer Engine和FP8。使用FP8可以显着减小数据大小，从而允许更少的内存消耗和带宽需求，同时保持性能。NVIDIA在Transformer Engine的推广旨在优化成本和改善其产品的人工智能性能，这也是与H100共享的特性。

在视频编码和解码方面，L40S提供了更注重可视化的方法，而H100则更注重解码能力。这种区别为用户提供了根据其特定需求的灵活性。

尽管H100速度更快，但价格要高得多。根据CDW上公开的价格，目前H100的价格约为L40S的2.6倍。

L40S的另一个优点是其可获得性。与备受需求的NVIDIA H100相比，这些GPU更容易获取，后者常常需要排队购买。

自初次发布以来收到的反馈揭示了多样的使用场景，超越了人工智能集群。用户报告称他们利用L40S进行可视化和虚拟GPU（vGPU）集群。凭借视频流水线和RT核心的加入，这些卡片可以在白天进行vGPU工作负载，在晚上vGPU需求较低时无缝转换为人工智能任务。

适合这些用例的一个示例是Supermicro SYS-521GE-TNRT系统。

总之，NVIDIA L40S是一款引人注目的GPU，易于获得，并提供了H100和A100所缺乏的功能。虽然它可能不适合需要FP64计算的用户，但对于不需要如此精确性的用户来说，它是一个很好的替代选择。

The source of the article is from the blog radiohotmusic.it