
12月7日,高德发布了新一代智能车载导航——高德2.0。 会上,包括Whatsmart Search在内的高德旗下语音技术服务商向外界展示了语音技术在汽车导航中的实际表现。 高德汽车事业部总裁魏东表示:“为了给用户提供更好的语音服务,高德还将开放语音接口,与语音解决方案提供商及众多合作伙伴共同开发和完善车内语音技术。 环境。 该应用为车主提供了更便捷、更安全的语音体验。”
(高德汽车事业部总裁魏东)
作为阿里巴巴旗下的移动搜索引擎,神马凭借在人工智能和语音技术方面的优势,成为高德的合作伙伴之一。 目前,这款语音战场的新玩家在嘈杂环境下的识别准确率已经达到97%,支持深度模型建模技术,以及百万级词典和超大规模语言模型。 综合经验的认可与科大讯飞、百度处于第一阵营。
Whatsmart语音技术负责人马泽军表示:“Whatsmart语音的特点包括,借助Whatsmart在大型分布式平台的经验,支持超过10万小时的深度模型 训练和超大规模解码空间构建算法。 在线系统可以实现每小时更新新词和热词,并能在0.1s内流畅地将识别结果反馈给用户,同时消耗极少的网络流量。”
人工智能的发展
根据艾媒咨询发布的《2016Q3中国移动搜索市场报告》,目前神马搜索市场份额为20.8%,排名第一 在移动搜索行业中位居第二。
作为用户获取信息的第一入口,神马在语音技术上的投入,不仅仅是为了提高输入效率,而是为了给用户提供更好的信息服务。 在人工智能的影响下,搜索引擎的学习能力和理解能力将进一步提高。 未来,当用户搜索咖啡时,搜索平台将通过大数据和知识图谱分析,计算出用户的真实需求,是否寻找最近的咖啡店在哪里,咖啡怎么做,并提供相应的完整服务 .
目前,要想将语音技术全面应用到客户端,前提是要有大数据挖掘和深度学习技术。 一方面,来自用户主动搜索的行为数据将在语义理解层面提供源源不断的大数据燃料,让语音技术在聆听和思考方面更加真实。
另一方面,在深度学习技术方面,结合用户的日常搜索行为和阿里矩阵平台,Whatsmart会编织一个N对1的语音训练样本知识谱,然后通过 深度神经网络经过建模技术,与千人千面进行多维学习,使其交互能力接近真人水平。
连接阿里生态
随着智能设备的屏幕和键盘虚拟化程度不断提高,用户更倾向于使用最自然的语言来发出指令。 需求的不断叠加,让语音技术有机会成为互联网下半场信息革命的主角。
2015年5月,Whatsmart搜索携手阿里云,在业界首次将整个服务架构部署在云服务上,实现快速识别、精准匹配、稳定反馈。 作为国内最大的公有云计算服务商,阿里云为Whatsmart提供了成本更低、更灵活的资源部署解决方案,强大的技术服务能力为Whatsmart的语音搜索提供了强有力的运营保障。 大大提高了神马语音搜索的准确性和稳定性。
在语音技术逐步完善后,作为语音技术中心的神马也与高德在基于LBS的语音技术上进行了合作。 高德地图用户对于POI搜索和路线规划的需求已经可以通过语音完成,进一步提高了行车安全。
其实语音技术的前半部分是人机之间的单向交流,比如输入法或者语音客服,只满足对方能听到的需求 这个阶段。 在语音技术的下半场,能听懂是最核心的部分。 在阿里体系的信息矩阵中,神马搜索将利用大数据和语音技术,为用户提供“千人千面”听得懂、会说的信息服务。
Whatsmart搜索语音产品负责人彭毅指出:“在搜索和地图场景中,语音技术的逐渐成熟解放了用户的双手,更容易链接使用需求和业务场景。 通过语音识别技术对业务场景的深度适配,让语音不再是单纯的输入工具,而是一个懂用户、懂场景、懂需求的综合助手,最终将形成千千万万用户的个人语音助手。
据了解,未来Whatsmart Search将在语音识别、自然语言处理和语音合成等方面不断深耕,提升易用性。尤其是在多轮交互和语义理解方面 ,为用户提供更快捷、更准确、更流畅的语音服务,已成为DT时代语音技术的中台。
免责声明:IT之家网站发布/转载此文,出于以下目的: 传递更多信息,并不代表赞同其观点或论证其描述。