专利名称:一种唇部特征辅助的语音增强方法及系统
专利国别:中国
专利号:202410154094.1
法律状态:实审
发明人:姜汉钧,浦宁,贾雯
申请人:清华大学,深圳清华大学研究院
地址:100084 北京市海淀区北京100084-82信箱
申请日期:2024-02-02
授权日期:
摘要:
本申请提供一种唇部特征辅助的语音增强方法及系统。语音增强方法应用于语音增强系统,语音增强系统包括语音传感器和图像传感器,方法包括:响应用户的对话操作,利用语音传感器采集用户的语音信号,并基于图像传感器的第一预设模式采集用户的面部图像数据;对面部图像数据进行唇部区域检测;当面部图像数据中存在唇部区域时,基于图像传感器的第二预设模式采集用户的唇部图像数据;提取语音信号的语音特征以及唇部图像数据中的唇部特征;对语音特征与唇部特征进行特征融合,得到融合特征;利用预设的语音增强模型对融合特征进行语音增强,得到增强后的语音信号。本申请实现了提升语音增强效果的同时降低工作功耗的技术效果。