据英伟达官方动静,美团机械进修平台利用 NVIDIA GPU,经由过程算子融会、计较图等价替代等一系列优化 ,相较于 CPU 正在不异本前束缚下,NVIDIA T4 GPU 年夜幅加快美团 CTR(Click-Through-Rate)模子展望机能,神经收集模子吞吐才能晋升了 10 倍;同时正在搜刮精场面景中,端到端团体吞吐才能晋升了一倍以上。英伟达暗示,美团的 CTR 模子曩昔一向正在利用 CPU 推理的体例,但跟着用户拜候量的晋升和深度神经收集的引进,CTR 模子布局趋于庞大,吞吐和计较量也愈来愈年夜,CPU 起头不克不及知足模子对算力的需求,而仅仅经由过程 CPU 办事器的堆叠带来的机能晋升性价比相较偏偏低。而 GPU 具有数以千计的计较焦点,能够正在单机内供给麋集的并行计较才能,出格合适深度进修场景,正在行业内已正在 CV、NLP 等范畴展现了壮大的才能。经由过程 CUDA 及相干 API,NVIDIA 成立了完全的 GPU 生态体系。基于此,美团根本研发平台将 CTR 模子摆设到 GPU 上,并经由过程一系列针对 CPU 与 GPU 的异构体系并行计较设想、数据存储体例和传输体例上的特定优化。
NVIDIA Tesla T4 GPU 是一款推理加快器,搭载 NVIDIA Turing Tensor Core。官方称,NVIDIA Tesla T4 GPU 具有野生智能推理的多精度计较机能,从 FP32 到 FP16 再到 INT8,又到 INT4 精度,T4 的机能比 CPU 超出跨越 40 倍,实现机能的严重冲破。
	
								本文地址:https://www.toutiao123.net/news/29793.html
版权声明:本文为原创文章,版权归 头条123 所有,欢迎 本文,转载请保留出处!
						版权声明:本文为原创文章,版权归 头条123 所有,欢迎 本文,转载请保留出处!
							
消息称三星量子点 OLED 新技术将与 LG 达成双赢
英特尔测试三星 PM1743 PCIe 5.0 SSD,组成阵列速度达
菲奥达亮相2018中国(郑州)国际物业管理产业博
网易云音乐正式登陆港交所,总市值达 425.9 亿港
安卓阵营马达天花板!一加10 Pro首发定制X轴线性
明确十大行动 天津碳达峰实施方案发布
禾赛科技宣布与英伟达达成合作,为 NVIDIA DRIVE
B2B业务达   二名6倍,爱回收二手3C行业优势凸显
英睿达发布 DDR5-4800 笔记本内存条,   高可选 3
日本预测30年内东京发生强震概率高达70% 若富士山喷发需疏散80万人
量化投资AI三要素不可有短板 明汯透露年底AI算力将高达400P 多家机构亮深度挖掘量化数据观点
云米与国美达成战略合作 共同打造全屋智能家居
IPO雷达 | 成立以来累计亏损79.2亿元,信科移动凭什么和华为、中兴掰手腕?
《阿凡达达》漳州开机 弘扬闽、潮商企业家拼搏精神
英伟达 GeForce NOW 云游戏已原生支持苹果 M1 系列
永辉超市2022年半年报:上半年扣非后归母净利润达0.94亿元 实现扭亏为盈
抖音搜索与苹果 Siri 达成合作,iPhone 用户“动动
显存升级:多款英伟达 RTX 3070 Ti 16GB、RTX 3080 12
消息称英伟达 RTX 40 显卡不支持 PCIe 5.0
苹果和特斯拉供应商台达电子遭勒索攻击,被要