
英伟达暗示,美团的 CTR 模子曩昔一向正在利用 CPU 推理的体例,但跟着用户拜候量的晋升和深度神经收集的引进,CTR 模子布局趋于庞大,吞吐和计较量也愈来愈年夜,CPU 起头不克不及知足模子对算力的需求,而仅仅经由过程 CPU 办事器的堆叠带来的机能晋升性价比相较偏偏低。而 GPU 具有数以千计的计较焦点,能够正在单机内供给麋集的并行计较才能,出格合适深度进修场景,正在行业内已正在 CV、NLP 等范畴展现了壮大的才能。经由过程 CUDA 及相干 API,NVIDIA 成立了完全的 GPU 生态体系。基于此,美团根本研发平台将 CTR 模子摆设到 GPU 上,并经由过程一系列针对 CPU 与 GPU 的异构体系并行计较设想、数据存储体例和传输体例上的特定优化。
NVIDIA Tesla T4 GPU 是一款推理加快器,搭载 NVIDIA Turing Tensor Core。官方称,NVIDIA Tesla T4 GPU 具有野生智能推理的多精度计较机能,从 FP32 到 FP16 再到 INT8,又到 INT4 精度,T4 的机能比 CPU 超出跨越 40 倍,实现机能的严重冲破。
本文地址:https://www.toutiao123.net/news/29793.html
版权声明:本文为原创文章,版权归 头条123 所有,欢迎 本文,转载请保留出处!
版权声明:本文为原创文章,版权归 头条123 所有,欢迎 本文,转载请保留出处!