向“音”而生 数美科技护航实时语音社交平台发展

 头条123   2025-04-23 13:07   1855 人阅读  0 条评论
向“音”而生 数美科技护航实时语音社交平台发展

  2021年初,音频社交应用Clubhouse迅速冲击互联网圈,在马斯克入驻的名人效应和自身独特的邀请注册与推荐机制双重加持下,Clubhouse的讨论迅速在中国火热蔓延开来,“音频社交”赛道引爆业界关注,国内互联网圈迅速开启军备竞赛,抓住音频社交领域的新机遇。

  但值得所有即时性音频社交平台关注的是,Clubhouse在国内的火爆犹如烟花般绚烂且短暂。由于信息智能管理的缺失,Clubhouse的讨论房间多次出现风险内容,几经周折 终在国内被暂停服务。自此,爆火中文社交网络的Clubhouse热度大减,不复往日繁荣。

  为了抓住音频社交领域的新机遇,国内互联网圈迅速开启军备竞赛,纷纷开始尝试打造国内版的“Clubhouse”。 映客直播上线对话吧;金融信息服务提供商鲸准推出Capital coffee;小米刚刚结束服务的即时通讯软件米聊在几天后即重新上线,打造与Clubhouse有高度相似的语音聊天软件……

  面临的挑战

  实时语音社交平台,每天都会产出海量聊天信息,聊天内容很容易失控,极有可能混有敏感信息和灰色内容,不利于平台业务的发展,对网络环境造成威胁。由此可见,敏感信息过滤已经成为影响平台业务发展的风险线,也必将成为语音社交平台运营发展中的重要模块。

  面对海量增长的音频消费和使用需求,音频内容审核迫在眉睫,但平台的风控系统往往会遇到以下两大方面的困境:

  1.敏感信息过滤

  人力投入成本高:音频内容数据量大,人工日均审核量有限

  实时响应要求高:内容复杂多元,及时响应时事政策难度大

  培训投入成本高:人审理解能力参差不齐,培训投入成本大

  2.平台运营管理

  专业程度要求高:实时流内容风控难度大,自研投入成本高

  风险应急能力弱:突发违规处理能力弱,危机应对经验不足

  审核效果需求严:兼顾风控与体验,高实时与高产能难两全

  语音审核除了要识别音频包含的文本内容是否涉及敏感信息,同时还存在语音语调上的拟声词、感叹词和语气词的审核难度,例如涉及色情信息的娇喘、呻吟等。这为语音审核提出了更高的挑战。目前普遍采用的人工审核方式虽然能够提供较好的审核能力,但需要对音频文件进行整段察验,对音频流进行实时监控,造成了较高的时间成本和人力投入。

  数美实时语音社交平台内容风控专项解决方案

  对此,数美科技经过多年在内容风控领域的深厚积累和持续自我升级,开发了基于深度学习与画像的全栈式智能音频风控解决方案,能够精准识别色情、违禁等内容风险与垃圾广告信息,实现高效、准确、全面覆盖的内容审核过滤,帮助平台防御音频内容风险。

  方案架构

  在语音内容获取上,数美科技的智能音频过滤技术支持OGG、MP3、ASF、WMA、WAV、MP3PRO、RM、REAL、APE、MODULE、MIDI、VQF等多种音频格式和音频流,能够应对不同语音内容提供平台使用的常用音频格式,同时支持语音直播实时监控、语音点播、语音消息和各种音频文件的检测。

  除此之外,智能音频识别还整合了业界一流的语音识别技术、大规模GPU计算的深度学习、基于敏感词库的名单服务、特殊声音识别模型、基于深度学习的NLP模型以及实时分布式规则引擎等。其中深度学习模型能够让系统从多个维度检测语义环境,准确识别说话意图。而智能音频识别技术根据不同场景和行业采用了专门化的判断策略,结合强大的标签体系能够为不同类型社交平台提供定制化的过滤服务。

  音频内容识别组成

  在获取到待检测的音频文件和音频流后,主要从四个方面进行内容的检测识别:

  1.违禁违规

  利用语音转文本技术将语音信息转为文本信息,再通过成熟的文本内容检测,对音频中出现的多种类型违规内容进行检测。

  2.涉黄违规

  利用大规模GPU集群的计算能力和深度学习技术,准确快速稳定地识别音频中出现的色情,低俗或性感部分,在管理后台对其进行标注和反馈,从而大规模提升人工审核团队效率,增强用户浏览体验。

  3.特殊声音识别

本文地址:https://www.toutiao123.net/news/16404.html
版权声明:本文为原创文章,版权归 头条123 所有,欢迎 本文,转载请保留出处!
 相关文章  关键词:而生 数美 科技 护航 实时