一种唇部特征辅助的语音增强方法及系统

专利名称：一种唇部特征辅助的语音增强方法及系统

专利国别：中国

专利号：202410154094.1

法律状态：实审

发明人：姜汉钧，浦宁，贾雯

申请人：清华大学，深圳清华大学研究院

地址：100084 北京市海淀区北京100084-82信箱

申请日期：2024-02-02

授权日期：

摘要：

本申请提供一种唇部特征辅助的语音增强方法及系统。语音增强方法应用于语音增强系统，语音增强系统包括语音传感器和图像传感器，方法包括：响应用户的对话操作，利用语音传感器采集用户的语音信号，并基于图像传感器的第一预设模式采集用户的面部图像数据；对面部图像数据进行唇部区域检测；当面部图像数据中存在唇部区域时，基于图像传感器的第二预设模式采集用户的唇部图像数据；提取语音信号的语音特征以及唇部图像数据中的唇部特征；对语音特征与唇部特征进行特征融合，得到融合特征；利用预设的语音增强模型对融合特征进行语音增强，得到增强后的语音信号。本申请实现了提升语音增强效果的同时降低工作功耗的技术效果。

清华•集成电路与系统(集成电路学院)