搜狗输入法10.0版发布 AI让输入更快更准更聪明
中新网11月15日电 近日,搜狗输入法迎来重大产品更新,正式发布10.0版本。
作为面世13年的国民输入品牌,10.0版本的推出,对搜狗输入法具有里程碑式的意义。新版本中,搜狗输入法充分调用了人工智能技术,推出了八大核心功能,用更加智慧的方式进一步提升输入体验,不仅推出了“AI逐字校对”、“AI长句预测”等全新功能,同时也对已有的“滑行输入”、“智能纠错”等功能进行了AI化的全面升级,向市场展示了人工智能时代输入产品的应有面貌。
AI时代的输入效率:再快30%
输入效率一直是输入法产品的核心痛点。13年前,搜狗输入法以颠覆性的输入效率从市场中脱颖而出,而在10.0版本中,搜狗输入法更将输入效率提升到了行业的全新高度。
在10.0版本中,搜狗输入法推出了“AI纠错”和“AI滑行输入”两大功能来提升输入效率。“AI纠错”可以在用户误操作的情况下,照样呈现准确的输入结果,与过去的纠错功能不同,AI技术加持之后,纠错功能的容错率更高,呈现结果更加快速。而“AI滑行输入”则允许用户在手指不离开键盘的情况下,一气呵成地键入内容。经过测试,使用这两项功能之后,用户的平均输入速度将得到30%以上的提升,真正达到键字如飞的效果。
AI时代的准确度:连生僻人名都一次输对
在提升输入效率之外,AI技术也在输入准确度方面为用户带来了惊喜。在10.0版本中,搜狗输入法“AI个性化语音识别”功能,为每一个用户建立独立的个性化私人词库,并通过深度学习技术不断优化,无论是亲朋好友的昵称还是绰号,一次说出,便会一直正确,彻底省去了重新编辑的繁琐。
此外,搜狗输入法还推出了“AI人名模式”和“智能英文键盘”。“AI人名模式”会在检测到人名时,自动提供人名备选,备选丰富,避免输错人名的尴尬;“AI英文键盘”则深抓英文单词拼写不准的痛点,只需输入几个字母,就能自动联想出准确单词。
AI时代的智能化:私人助理式的输入体验
全面AI化的搜狗输入法10.0版本,最突出的能力在于智慧化,用户在使用时会感受到自己拥有一个私人的输入助理,获得热刀切奶油的顺滑体验。
例如“AI逐字校对”功能,会在句子输入完成后自动检测错别字,给出纠正方案,防止出错;“AI长句预测”功能,当用户输入几个字或几个字母之后,AI便会预测接下来的输入结果,提前将备选答案给出,犹如一个心有灵犀的朋友补足后半句;此外,搜狗输入法还贴心地加入了“快捷计算器”功能,当用户要进行简单的计算时,不需要打开计算器,只需要在输入框中输入,就能得到计算结果,极大地方便了常与数字打交道的用户。
不难发现,10.0版本的推出,意味着搜狗输入法AI化的全面升级。八大核心功能全部围绕AI技术展开,这一方面展示了搜狗输入法杰出的AI技术能力,更表现了搜狗输入法团队对极致输入体验的理想追求。搜狗输入法已经不仅仅是一个输入工具,它是一款实实在在的人工智能产品。
对用户而言,10.0版本的八大核心功能,将彼此联动,共同创造人工智能时代应有的输入体验。而借由这次重大的版本更新,搜狗输入法也证明了在输入框的方寸之间,也有如此广阔的技术发挥领域,也有如此细致的技术之美的表达,这不仅将再次颠覆用户的输入感受,也将为诸多人工智能产品带来可贵的实践参考。
搜狗推出唇语识别技术,提升远场语音交互,比谷歌都厉害
在刚刚过去的第四届乌镇互联网大会上,搜狗展台凭借着机器翻译、搜狗明医、搜狗大律师、智能问答、唇语识别等人工智能技术、产品受到参会者的关注,其中最吸引眼球莫过于唇语识别了。
所谓唇语识别是通过机器视觉,不用听声音,仅靠识别说话人的唇部动作,就能解读说话者所说的内容。
搜狗语音交互中心技术总监陈伟
今天搜狗举行媒体沟通会,公开介绍展示这项唇语识别新技术,包括背后的技术原理、研发这项技术的动因以及未来的场景应用。
一、通用唇语识别准确率达60%
与语音识别不同,唇语识别是一项基于机器视觉与自然语言处理于一体的技术,因此难度也比语音识别大的多。
搜狗语音交互中心技术总监陈伟向我们介绍了唇语识别背后的技术逻辑。唇语识别需要通过摄像头,从图像中连续识别出人脸,并提取说话人连续的口型变化特征,然后将这些唇语特征放入唇语识别模型来获取发音单元,并通过语言模型来获得文本数据,最终输出文字。
据搜狗介绍,这也是国内首个公开演示的唇语系统。搜狗通过端到端深度神经网路技术进行唇语序列建模,并通过数千小时的真实唇语数据训练,所建立的词汇表已经在10万词以上,在通用唇语识别上已能够达到60%的准确率,而在搜狗深耕的车载、智能家居场景下可以达到90%的准确率。
在搜狗主要布局的车载、智能家居场景下,由于限定了边界,所使用的词汇则大大降低,搜狗又针对这些场景通过制作“限定词”的方式,如车载场景的“播放音乐”来大大提升唇语识别的准确率。目前搜狗团队已经围绕场景做了1000多个限定词。
正常人的唇语识别能力在10%左右,一些受过训练的聋哑人则可以达到40%左右,而在这项能力上机器已经超过人类。

二、提升远场语音交互是动因
尽管在近场的语音识别上,各家的技术都可以做到95%以上,但是一旦将语音识别由近场扩展到远场,尤其再伴随着噪声混响环境,语音识别的准确率就会大大降低。
目前通用的办法是通过麦克风阵列来进行远场环境下的噪声等处理,来提升语音识别的效果。如当下火热的智能音箱采用的就是麦克风阵列的技术来做前端的信号处理。
陈伟谈到,麦克风阵列和唇语识别是面对在远场噪音环境下提升语音识别的两种手段,麦克风阵列是从消除噪音的角度做的,而唇语识别则是直面噪音等环境,直接通过读唇的方式和语音识别结合起来,提升语音识别准确性。麦克风阵列是当前的技术应用,已经落地很多产品上,而唇语识别则刚开始,会在未来落地到产品上。
根据智东西的观察,尽管麦克风阵列技术可以大大提升智能设备的远场语音识别能力,但当环境的背景噪声过大过复杂,机器在语音识别上还会存在问题,而唇语识别或许是一个很好的补充,通过直接读唇的方式也可以不受环境噪声的干扰。
“就是把语音识别和唇语识别做到很好的结合,让唇语识别起到辅助作用”,陈伟表明了最初做这件事的动机。尽管唇语识别的准确率还不够高,但是通过限定场景,扮演辅助角色或许可以进一步提升远场语音交互的准确性。
三、唇语识别之痛:泛化性
谷歌的DeepMind团队在去年11月份也展示了其唇语识别技术,当时它的识别率接近50%。可以说,搜狗在唇语识别上又往前走了一步。
搜狗唇语识别团队谈到,搜狗语音技术中心重要做的就是自然语言交互,主要深耕车载和智能家居场景,而在面对远场噪音环境识别准确率下降的情况下,除了麦克风阵列外,还想到了通过唇语识别提升语音识别这条路。目前这项技术已经开展了1年左右。
当智东西问及唇语识别中最大的难点在于哪里时,该团队称在于唇语识别的泛化性。比如电视中的主持人在发音、唇形都比较标准,就可以做到70%左右的唇语识别率,但是普通人在唇形方面差别很大, 唇语的识别率就会下降很多。此外中文语言的复杂性,往往一个唇语特征对应多个发音单元,比如“can/zang”,这就大大提升了唇语识别的难度。
针对人的泛化和场景的泛化等难点,搜狗一方面通过各类新闻、电视节目的数据进行训练,另一方面还通过搜集大量普通人的唇语数据进行训练,一定程度提升了唇语识别的泛化效果。而进一步具体到车载、智能家居场景中,又通过限定场景、限定词的形式,对唇语识别的准确性做了进一步优化。
智东西也现场体验了这套唇语识别技术,比如在车载场景中的一些常用语以及家居场景下的诗词等,均有不错效果,但通用的唇语识别还有待进一步提升。
结语:场景落地尚需时日
只有一项技术可以落地,可以商业化才能真正体现出其价值。在未来场景落地上,搜狗唇语团队谈到,一方面可以和语音识别技术相结合解决远场环境下的语音问题,另一方面未来也可以将唇语应用到验证、安防等领域。
但是由于通用唇语识别准确率还较低、泛化性较差,其技术落地或许尚需时日。而限定边界、扮演辅助角色或许是唇语识别走向应用的第一步。
搜狗发布“知音”引擎 它甚至会自己思考
【手机中国 软件】8月3日,搜狗旗下的语音交互引擎“知音”正式亮相,它让人机交互变得更加自然,不仅能听会说,甚至可以理解和思考。“知音”具有识别速度快、纠错能力强、支持更加复杂多轮的交互等特点。在发布会上,搜狗CTO杨洪涛、搜狗语音交互技术中心负责人王砚峰为大家详细介绍了“知音”的不俗之处。
王砚峰说到,当前语音交互的重要性逐渐凸显,当手眼被占用时、无法使用键盘输入时、打字不方便时都会用到语音功能。但语音交互也存在着不少问题,一是用户要收着说,二是机器不够聪明,为此,搜狗带来了更自然的语音交互。
“知音”引擎使用着互联网上规模最大的语音数据,在线语音输入日请求规模超过了1.4亿,每天用户产生出来的语料规模是11.7万小时,如此庞大的数据帮助搜狗大幅提升了语音识别的准确率。在过去一年中,“知音”引擎语音识别错误率进一步下降30%,识别速度提升了3倍。
过去,由于技术水平的限制,用户在语音输入错误,或较复杂的语音指令时无法正确识别,而“知音”支持用户修正输入内容,并使用更为自然的语言发布指令,比如把“张”改为立早“章”。
王砚峰在会上播放了一段视频,将“知音”引擎横向对比了几款提供同类服务的语音工具,结果显示“知音”可以理解用户语音指令的逻辑关系,同时可感知用户在语音请求背后真正的需求。
总结一下,“知音”引擎具备基于端到端技术的语音识别能力、利用自然语言交互的语音纠错能力、基于知识图谱技术的行业知识整合能力,以及多轮对话技术的复杂语义理解能力。
在会上搜狗CTO杨洪涛向大家透露,不久之后搜狗会推出一款语音工具类产品,功能主要面向记者,猜测可能会是语音转文字类的工具。最后,王砚峰表示搜狗一直秉承着开放的态度,未来希望与行业能力强的合作伙伴一起推动用户交互体验的提升。
标题:搜狗语音助手-查票和购火车票说话就搞定【搜狗智能语音助手】
链接:https://yyuanw.com/news/rj/54298.html
版权:文章转载自网络,如有侵权,请联系删除!
用户评论
终于不用再挤地铁排队去火车站买票啦!这个搜狗语音助手简直太牛了,“帮我查一下明天北京往返上海的票价” ,然后它都能直接给我报出来,是不是超级方便!现在出门前只需要跟它说几句,搞定出行计划真是太省心了!
有18位网友表示赞同!
我一直觉得火车票买起来太麻烦了,每次都绕一大圈,耗费时间精力不说,还经常遇到网购高峰期排队付款。搜狗语音助手可以远程查询和购票,这个功能真棒!虽然第一次试用的时候还是有点不熟悉,但是操作起来其实很流畅,未来出行肯定要靠它啦!
有13位网友表示赞同!
我还记得小时候跟爸爸妈妈坐火车旅行的时光,那时候只要报上目的地爸爸就能帮我买票。现在科技发展了,搜狗语音助手就好像我的“虚拟爸爸”一样,可以帮我查票和购票,想想都觉得很不可思议!未来出行生活会越来越方便了呢!
有11位网友表示赞同!
这个搜狗语音助手有点好玩,但感觉实用性还不太强。火车票种类繁多,价格也复杂,语音识别可能会出现偏差的话怎么办?还是传统的软件操作更可靠吧!
有20位网友表示赞同!
我觉得这个搜狗语音助手的语音辨识率还需要提升,有时候说错了它就理解不了,需要我反复说几次才能完成操作。希望以后能做得更好!
有12位网友表示赞同!
虽然很方便,但我担心票价信息准确性问题。毕竟不是每个人都像专业购票机构一样熟悉各种火车票类型的规则和价格变动,万一搜狗语音助手给的价格不准确,那可就麻烦了!
有6位网友表示赞同!
这个功能听起来真的很酷,但是我有点担心隐私泄露。给语音助手提供我的出行信息会不会造成安全隐患?这个问题需要慎重考虑!
有10位网友表示赞同!
搜狗一直挺厉害的,这次推出语音助手让我更有期待感了,感觉未来生活中要用到它的场景越来越多了,智能化发展速度真的很快啊!
有6位网友表示赞同!
我倒是觉得这个功能蛮不错,不过考虑到现在火车票网上抢购的竞争激烈程度,这个语音助手能否快速精准地帮我抢到票呢?还需要进一步测试和改进!
有7位网友表示赞同!
感觉现在越来越多的生活场景都被人工智能给“覆盖”了,无论是医疗、教育还是出行这些领域都开始融入智能技术,未来的生活会变得更加便利和高效!
有15位网友表示赞同!
虽然我很喜欢这个语音助手的便捷性,但是我还是希望搜狗能关注用户的体验优化,提高语音识别率和准确性,让它真正成为一个贴心又可靠的助手!
有5位网友表示赞同!
我觉得这个功能对老年人来说特别实用,不用再去学习各种复杂的手机操作也能轻松完成购票,方便了很多!真是太棒了!
有14位网友表示赞同!
我倒是觉得搜狗语音助手能不能实现其他功能?比如帮我查新闻、天气预报等等,如果能扩展更多功能,那真的就太好了!
有9位网友表示赞同!
每次买火车票都感觉是件很累的事儿,尤其是遇到高峰期的时候,简直焦头烂额!这种语音助手真真是救了好几个人的命,希望它越做越好!
有19位网友表示赞同!
虽然这个搜狗语音助手功能确实很强大,但我更期待它能进一步融合其他智能应用,比如帮我规划路线、预订酒店等等,形成一个更加完整的出行解决方案!
有12位网友表示赞同!
感觉这种语音助手已经走进我们的生活了,越来越多的程序都开始支持语音交互,以后我们可能连打字都不用学习了,哈哈哈!想想就觉得很奇妙!
有6位网友表示赞同!
我有点担心搜狗语音助手的安全问题,毕竟它需要处理用户的个人信息,希望搜狗能够重视用户隐私保护,确保数据的安全性!
有11位网友表示赞同!
感觉这种语音助手功能越来越常见了,很多手机软件都有类似的功能了。搜狗语音助手能不能做得更加智能化呢?比如能帮我分析我的出行需求,给出更个性化的购票建议?
有14位网友表示赞同!
这个功能对外出旅行的人来说真是太方便了!不用再去车站排队买票再赶火车,直接用手机跟语音助手“对话”,就能完成整个过程。科技的进步让我们人生更加便捷!
有20位网友表示赞同!