分享到: | 更多 |
如果你想今天去北京故宫参观,又担心人太多,那么你可以拿起手机,向其中的软件终端发出语音提问,很快,此时此刻故宫的人流量便会呈现在你面前。
科技改变生活,这种神奇的技术叫“语音识别技术”,它的无偿使用和一个名字息息相关——贾磊,他的身份是百度首席语音架构师。
在4月28日的全国劳模和先进工作者表彰大会上,这位新技术领域的领军者,获得了全国劳动模范称号。
让语音搜索免费
贾磊曾成功研发了松下手机上的英语、日语和汉语人名数字拨号系统;还参与研发当时世界上最先进的语音识别技术,能够对中国新闻节目中的语音内容进行实时高精度的识别;他还主导了中科院自动化所的云计算条件下的机器翻译系统构建工作……
技术“大牛”,源自一颗初心。15年前,贾磊在攻读博士学位期间对语音领域产生了浓厚的兴趣,将研究方向转向广播语音识别。此时,国内的语音领域的小型技术尚处于实验室中,国外却已经进入商业化运作,全球语音技术市场有超过80%的用户采用Nuance语音识别引擎技术。“我们用人民币购买这项技术,按照汇率计算,是国外价格的六七倍。”贾磊说。
经过10年的发展,国内语音领域技术提供商的格局发生了很大变化。2011年,贾磊加入百度,当时百度公司没有任何语音搜索系统的核心技术,只是依靠外部合作单位提供一些很基础的语音搜索API,而且没有任何源代码,其精度远远比不上美国谷歌公司在中国大陆提供的汉语语音搜索服务。
贾磊需要啃下这块硬骨头。
“在人人平等的企业文化下,技术团队负责人不是任命的,而是要自己证明自己。”贾磊说。一开始他一个人写代码、建模、做原型系统,每天的时间除了睡觉都是在工作。当他的方案被一个同仁认可时,就多一个人帮他做,就这样一个、两个、三个……新人不断加入,团队不断完善和细化,最终大家一起完成产品打磨。不到6个月的时间里,百度完全自主研发的语音搜索系统正式上线。
语音识别技术的重要评估标准就是识别率,当时谷歌的中文语音搜索识别率为80%左右。贾磊团队研发的语音搜索在2012年初一经上线就达到了85%的准确率,成为语音技术产业化的最成功案例。
接着,贾磊又在深度学习技术上大胆探索,最早实现语音技术的深度学习革命,这项成果领先了微软公司半年。
2013年和2014年,百度先后宣布了将语音识别技术和语音合成技术无偿提供给中国的所有开发者免费使用。这项技术的免费开放,整个社会使用语音技术的成本也大幅度降低,成为科技的普惠。
把握机遇 创新发展 | 2010-04-27 |
颜永红:“搜索”语音识别的未来 | 2010-04-27 |
颜永红:“搜索”语音识别的未来 | 2010-04-27 |
颜永红:“搜索”语音识别的未来 | 2010-04-27 |
浙大学生设计出智能“鸡” 会唱会跳会说话... | 2010-04-27 |
贵州年轻“乔布斯”们的梦想(组图) | 2010-04-27 |
刘庆峰的智能语音梦:让人机沟通无障碍 | 2010-04-27 |
李彦宏:多轮交互将改变移动互联(图) | 2010-04-27 |
语音架构师贾磊:让中国技术改变中国社会 | 2010-04-27 |
北京榜样 首都新时期劳模代表风采 | 2010-04-27 |