本发明属于音视频通信,具体涉及一种视频客服音频回音消除方法和系统。
背景技术:
1、实时音视频通信技术是一种允许用户在互联网上进行实时双向音频和视频交流的技术。这种技术的核心在于低延迟、高稳定性和高质量的数据传输,确保流畅、无明显滞后现象的沟通体验。基于实时音视频通信技术的视频客服,相比于传统的文字、语音沟通方式,给用户带来全新的感受。通过视频通话技术,双方可以更直观地进行交流,使得问题的解决变得更为顺畅。当客服人员能够看到客户的表情和语言,能更好地理解客户的需求和意图,从而提供更精准的帮助和建议,提供个性化的服务。音频回音消除方法已有较多报道,有些是通过优化缓存存储方法提升回音消除效果,有些是通过设置切换器兼顾回音消除和音质失真。另外,在视频客服领域中,如何设计界面友好且操作简单的视频客服入口,提高用户使用意愿和便利性也是关键问题。然而,尚未有兼顾考虑音频回音消除效果和客服人员调整回音消除的便利性的报道。
技术实现思路
1、本发明的第一方面提供了视频客服音频回音消除方法,其包括如下步骤:
2、基于用户端音频信息流和视频客服端语音信息流生成音频回音消除信息流;
3、基于所述音频回音消除信息流调整与用户端的当前用户对应的视频窗口实时轮廓;
4、基于用户端视频信息流调整与所述用户端的当前用户对应的视频窗口标准轮廓;
5、当所述视频窗口实时轮廓与所述视频窗口标准轮廓匹配后发出所述当前用户的音频回音已消除提醒。
6、本发明的第二方面提供了视频客服音频回音消除系统,所述系统包括至少一个处理器;以及存储器,其存储有指令,当通过至少一个处理器来执行该指令时,实施前述第一方面所述的方法的步骤。
7、本发明的第三方面提供了计算机可读存储介质,其上存储有计算机程序/指令,该计算机程序/指令被处理器执行时实现前述第一方面方法的步骤。
8、本发明的第四方面提供了计算机程序产品,包括计算机程序/指令,该计算机程序/指令被处理器执行时实现前述第一方面方法的步骤。
9、本发明的有益效果在于,可兼顾音频回音消除效果和客服人员调整回音消除的便利性。
1.一种视频客服音频回音消除方法,其特征在于包括如下步骤:
2.如权利要求1所述的方法,其特征在于:所述视频客服端语音信息流的生成方法包括:麦克风采集音频信号;将所述音频信号转化为音频数字信号;将所述数字信号进行预处理得到所述视频客服端语音信息流,所述预处理包括噪声抑制、增益控制;所述用户端视频信息流的生成方法包括:摄像头采集视频信号;将所述视频信号转化为视频数字信号;将所述视频数字信号进行预处理得到所述用户端视频信息流,所述预处理包括噪声抑制、增益控制。
3.如权利要求2所述的方法,其特征在于:所述视频客服端语音信息流的生成方法还包括重采样、去噪、回音消除、混音、编解码;所述用户端视频信息流的生成方法还包括剪裁、缩放、旋转、叠加和编解码。
4.如权利要求3所述的方法,其特征在于:所述音频回音消除信息流和所述视频客服端视频信息流经过编码后传输至所述用户端,其中:
5.如权利要求4所述的方法,其特征在于:配置所述视频客服音频回音消除方法的服务器包括信令服务器、mcu(multipoint control unit)服务器或sfu(selective forwardingunit)服务器,其中,信令服务器用于处理用户的登录、认证、频道创建等逻辑,以及音视频通信的建立和管理;mcu服务器和/或sfu服务器用于多方通信时进行音视频流的混流、转发和路由。
6.如权利要求1~5任意一项所述的方法,其特征在于:所述视频客服端语音信息流的音频特征跟随所述视频客服端的麦克风的位置变化而变化;优选的是:所述音频特征的生成考虑视频客服端的麦克风与扬声器的空间位置。
7.如权利要求1~5任意一项所述的方法,其特征在于:基于所述音频回音消除信息流调整与视频客服端的当前用户对应的视频窗口实时轮廓的方法包括:
8.如权利要求1~5任意一项所述的方法,其特征在于:基于用户端视频信息流调整与所述视频客服端的当前用户对应的视频窗口标准轮廓的方法包括:,
9.如权利要求1~5任意一项所述的方法,其特征在于:基于用户端音频信息流和视频客服端语音信息流生成音频回音消除信息流的方法包括:
10.一种视频客服音频回音消除系统,其特征在于,所述系统包括至少一个处理器;以及存储器,其存储有指令,当通过至少一个处理器来执行该指令时,实施按照权利要求1-9任一项所述的方法的步骤。