登录站点

用户名

密码

搜狗语音技术实力大爆发 加速AI商业化落地

已有 55 次阅读  2017-08-21 10:07

  8月8日,搜狗召开发布会,正式推出其自研的速记神器--搜狗听写。搜狗听写APP的出现,颠覆了用户的想象,录音转文字只是一瞬间的事,让语音转文字的方法从纯手工时代进化成人工智能时代。

  8月8日,搜狗召开发布会,正式推出其自研的速记神器--搜狗听写。这是一款能够将语音实时转变成文字的速记工具,使用了搜狗知音引擎的长时语音转写技术,为文字工作者提供会议、采访、写作等场景下的速记要求,用户可以在App商店免费下载。

  搜狗公司语音交互技术中心总经理王砚峰表示,搜狗知音是搜狗一年前发布的语音交互引擎,主打“自然交互+知识计算”的技术战略。而搜狗听写产品是搜狗语音深入用户垂直场景下的又一个全新探索,通过更加专注于特定的场景和人群,去理解用户需求、解决实际问题,从而让语音技术为更多人所用。

  而在近日,不少在网上看庭审直播的公众发现,与以往只有视频画面和声音不同,还增加了实时动态的字幕,成为庭审视频直播的新亮点。原来,这是为全国法院提供庭审过程互联网视频直播及案件开庭录像云服务的新浪法院频道,引入了搜狗公司提供的人工智能语音识别技术,在庭审直播中实现了各角色发言自动转写为文字,视频和语音识别文字的融合,让全过程一目了然。

  据了解,截止到今年8月15日,搜狗与新浪合作的庭审语音识别系统已经部署在全国17个省份的50家法院,提供了357场次的庭审语音识别服务,其中有194场次同步进行了庭审直播。

  作为国内最早进行语音识别研究的公司,搜狗每天响应超过2.6亿次的语音请求,为搜狗智能语音系统提供了海量的真实语料数据,使得机器不断自我学习,识别准确率越来越高,可应用的场景也越来越广泛。

  相较于此前的输入法,语音识别,搜狗听写的使用场景更加复杂,在算法模型层面,搜狗进行了优化。当谈到搜狗听写的差异性,搜狗语音交互技术中心总经理王砚峰认为,搜狗听写的优势在于可支持长时录音,转写服务免费。

  搜狗很早就开始做语音识别,很早就做 NRP 和搜索,通过雄厚的语音技术储备,在去年语音产品开始爆发的情况下开始对外输出,并且也开始逐步进行产品落地。此次,搜狗与已建成为全国最大的庭审视频大数据存储中心和应用平台的新浪法院频道合作,是搜狗语音自研团队深入垂直业务场景下的又一个全新探索。

  语音速记是语音识别技术的应用之一,主打AI的搜狗自然也在其中,目前,搜狗已经建立了强大的语音自研团队,拥有互联网规模最大的语音数据。

  事实上,AI是搜狗未来重要的核心战略。搜狗CEO王小川曾表示,“人类对于人工智能的终极描绘,始终是同人一样进行自然的语言交流,这也是搜狗人工智能的发展目标。”而以语言理解为核心,让输入法走向对话系统,让搜索走向问答系统的搜狗,势必也将成为未来智能生活最重要的入口之一。

  另外,王砚峰还透露,从今年年底开始,搜狗会推出更多自主研发的硬件产品,同时,搜狗会积极推广AI云平台、AI云服务,服务更多的行业伙伴。致力于在更多的垂直产品场景下,做更多好的产品,服务垂直行业的用户群体。未来,搜狗将会有更多的产品获得AI技术结合的能力。

分享 举报