从“听清”到“听懂”,远传为智能语音交互技术注入新动能

远传-IPCC 7.0 版本的诞生意味着远传已突破“智能打断”这一难点。日前,远传的U-IPCC 7.0 在某智能客服项目中大显身手,通过算法、技术赋能客服机器人,智能打断成功率达95%以上,为

2016年,在深度神经网络的帮助下,机器语音识别准确率第一次达到人类水平,意味着智能语音技术落地期到来。继而随着人工智能行业的快速发展,短短几年内,国内智能语音技术突飞猛进,整个行业市场正经历着高速的发展,越来越多的企业争相入局,智能语音真正成为风口。但是智能语音的发展是个开放性的课题,背后涉及的技术仍有不足,亟待我们的求索突破。

从“听清”到“听懂”,远传为智能语音交互技术注入新动能

“停”不下来的智能机器人

就拿智能语音机器人来说,用户经常会诟病“不够智能”,尤其是不能很好地支持打断、插话,或是反应慢、自说自话等问题。目前市场上大多数语音机器人采用一问一答的交互方式,先是照本宣科 TTS 播报内容,播报完成后,再去询问和倾听客户的意见,语音识别转译后再跳转对应的对话场景流程。但在实际沟通中,客户往往喜欢根据自己的想法和判断,对沟通进行各种插话打断,比如:

“等一下”

客户意图翻译:不需要机器人继续说下去,暂停思考一下,准备切换话题

“那  XXXX  问题呢?”

客户意图翻译:直接从当前话题切换到下一个话题

“好,我知道了”

客户意图翻译:客户对机器人的回答表示已经足够了解,希望终止当前对话

一旦出现打断的情况,机器人如果不能及时响应客户的最新想法和指令意图,仍然还在上一个频道“自说自话”,客户体验就会大打折扣。“想打断的时候它不停,明明没有说话它又不讲了”,在机器人的语音识别中,经常会遇到这样的问题。一些意外的噪音,比如关门声、装修声、音乐声等,会干扰语音交互,一旦机器人识别后就会造成错误打断;而混杂在环境噪声中的真人说话声,识别不到的话,就会造成漏打断。

在智能语音机器人应用中,如何合理、准确的判定客户是否有效打断,保证客户智能交互体验,一直是长期存在的问题。

从“听清”到“听懂”,远传为智能语音交互技术注入新动能

远传U-IPCC 7.0 能听、会听、更聪明

针对上述问题,远传的技术团队经过长时间地潜心研发,终于成功攻坚,U-IPCC 7.0 版本的诞生意味着远传已突破“智能打断”这一难点。日前,远传的U-IPCC 7.0 在某智能客服项目中大显身手,通过算法、技术赋能客服机器人,智能打断成功率达95%以上,为客户打造极致的用户体验。

U-IPCC 7.0 中采用独特的U-IPCC VAD人声识别算法模型,并经过大量测试优化,成功赋予智能语音机器人智能打断的能力。通过U-IPCC 7.0的平台,智能语音机器人可在通话时主动开启检测外线客户的语音流,当检测到语音被打断时,快速通过人声识别算法模型识别出是人声还是环境噪音。若判断为人声,立即停止当前TTS播报,将人声语音报送ASR引擎识别及NLP协同,根据分析结果进入下一轮人机交互场景。从打断、判断到直接进入新的对话场景,仅需几秒,保证第一时间响应客户诉求,跟上客户的节奏。

不仅如此,U-IPCC 7.0 还能通过分析人声语音与其他声音数据(语气词、环境噪声)的波形、能量等特征,提炼声音特征规律形成上百种人声及各种声音模型,可有效屏蔽关门、装修、汽车喇叭、音乐等各种环境噪声,并可精准识别混杂在噪声中的人声,避免错误打断及漏打断。

从“听清”到“听懂”,远传为智能语音交互技术注入新动能

经过上千次的测试和优化,U-IPCC 7.0 人声识别算法模型真正做到了“能听、会听”,基本上可达到人一说话就可以立即停止播放,自动进入新的对话场景,而各种语气词及环境噪音则可自动过滤。

由U-IPCC 7.0 智能打断赋能的智能语音机器人在反应速度、抗干扰能力方面可与真人媲美,大幅提升客户体验。目前U-IPCC 7.0 已准备就绪,随时可应用到各种智能客服项目中,使智能语音机器人在与用户的沟通中,及时、灵活、准确地获取用户意图,快速响应用户想法和节奏,给予用户最佳的智能交互体验。

本文版权归原作者所有,同心智造网(www.hahakm.com)转载文章仅为传播更多信息之目的,如作者信息标记有误,请第一时间联系我们修改或删除,多谢。

(0)
上一篇 2020年8月6日 上午7:59
下一篇 2020年8月7日 上午1:11

相关推荐

扫码关注
扫码关注
加入社群
加入社群
QQ咨询
分享本页
返回顶部