上一页|1|
/1页

主题:语音识别数据库—智能语音助手背后的秘密

发表于2016-03-15
标签:语音识别数据库— 声音 自然 信息查询 技术 
随着智能语音技术的进步和深度神经网络技术(DNN)的工程化应用,机器人越来越接近智能化,能够像人一样的学习、理解和思考。不仅能以自然度很高的声音与人交流,还会调侃 、卖萌。近期微软发布的智能机器人“小冰”和百度发布的“度秘”再次掀起智能机器人和人机交互的热潮,据北京海天瑞声科技有限公司解释说这样的惊人的背后全是智能语音识别数据库的带来的科技成果。
微软“小冰“是个17岁甜美伶俐的少女,她现在可以陪你文字聊天,很快也就可以和你语 音聊天了。那时你会发现,她不仅声音甜美,反应机敏,还会说好多流行的语言。你要犯二,小冰就调侃你“侬脑子瓦特了”;你要问她一个敏感的私人问题:“你喜欢他吗?”她就会机 智的说:“我喜欢他全家”。
百度“度秘”的梦想是让每一个人,不论是一年级的 生,还是七八十岁的老年人,只要 会说话,就都能平等地享受互联网服务。她不仅可以“听懂”人的指令和提问,并给予准确的 反馈、信息查询,还会体贴的嘘寒问暖。如果你提问:“那儿有按摩的?”她不仅会帮你找出 的按摩店,还会关心叮嘱你:“忙碌的工作之余,也不要忽视身体健康哟。”
这些成果是近半个世纪智能语音技术的进步和深度神经网络技术(DNN)的工程化应用不断进步的结果。语音交互技术是人工智能的关键技术,让机器能听会说、能像人一样的学习、 理解和思考,成为人类生活和工作的得力的帮手、亲密的伴侣,一直是人类的梦想。2013年, 全球智能语音产业规模达到33.7亿美元。其中,中国智能语音产业规模达到16.9亿元,同比增长95.6%。
在这些炫目的语音技术的背后,还有一个虽然沉默、但又至关重要的角色,那就是大规模 的语音语料库数据资源。包括语音和文本语料库、各类语音语义学词典等,可以说基础数据资源库是智能语音技术的关键性基础环节,而其中最重要的就是语音基础数据资源,其规模和质 量,在很大程度上决定了各种智能语音应用的广度和深度,也极大的影响着用户的体验。
虽然语音识别数据库、语音合成数据库已经得到应用,但是从小冰和度秘这样的聊天机器人,到真正的机器伴侣,还有一段很长的路要走,还有许多困难需要克服。她必须能更准确的听懂并响应对她发出的各种指令,还要能“理解”人的情绪变化和情感需要,能进行独立 的“思考“,从而为人提供更接近于真实的人的服务,包括情感支持和慰藉。在语言表达方面 ,也要更接近人类的真实情感和情绪的表达,要更自然流畅。这将会是个漫长的过程所以在智能语音方面还有很长的路要走。
上一页|1|
/1页