英伟达:美团机器学习平台使用 NVIDIA T4 GPU,相比

 头条123   2025-05-19 10:23   2113 人阅读  0 条评论
英伟达:美团机器学习平台使用 NVIDIA T4 GPU,相比 据英伟达官方动静,美团机械进修平台利用 NVIDIA GPU,经由过程算子融会、计较图等价替代等一系列优化 ,相较于 CPU 正在不异本前束缚下,NVIDIA T4 GPU 年夜幅加快美团 CTR(Click-Through-Rate)模子展望机能,神经收集模子吞吐才能晋升了 10 倍;同时正在搜刮精场面景中,端到端团体吞吐才能晋升了一倍以上。

英伟达暗示,美团的 CTR 模子曩昔一向正在利用 CPU 推理的体例,但跟着用户拜候量的晋升和深度神经收集的引进,CTR 模子布局趋于庞大,吞吐和计较量也愈来愈年夜,CPU 起头不克不及知足模子对算力的需求,而仅仅经由过程 CPU 办事器的堆叠带来的机能晋升性价比相较偏偏低。而 GPU 具有数以千计的计较焦点,能够正在单机内供给麋集的并行计较才能,出格合适深度进修场景,正在行业内已正在 CV、NLP 等范畴展现了壮大的才能。经由过程 CUDA 及相干 API,NVIDIA 成立了完全的 GPU 生态体系。基于此,美团根本研发平台将 CTR 模子摆设到 GPU 上,并经由过程一系列针对 CPU 与 GPU 的异构体系并行计较设想、数据存储体例和传输体例上的特定优化。

NVIDIA Tesla T4 GPU 是一款推理加快器,搭载 NVIDIA Turing Tensor Core。官方称,NVIDIA Tesla T4 GPU 具有野生智能推理的多精度计较机能,从 FP32 到 FP16 再到 INT8,又到 INT4 精度,T4 的机能比 CPU 超出跨越 40 倍,实现机能的严重冲破。

本文地址:https://www.toutiao123.net/news/29793.html
版权声明:本文为原创文章,版权归 头条123 所有,欢迎 本文,转载请保留出处!