内蒙古自治区人民政府网站
长辈版 微信 微信 无障碍
部门网站导航

自治区政府组成部门

  • 发展和改革委员会
  • 教育厅
  • 科学技术厅
  • 工业和信息化厅
  • 民族事务委员会
  • 公安厅
  • 民政厅
  • 司法厅
  • 财政厅
  • 人力资源和社会保障厅
  • 自然资源厅
  • 住房和城乡建设厅
  • 生态环境厅
  • 交通运输厅
  • 水利厅
  • 农牧厅
  • 商务厅
  • 文化和旅游厅
  • 卫生健康委员会
  • 退役军人事务厅
  • 应急管理厅
  • 审计厅

自治区直属特设机构

  • 国有资产监督管理委员会

自治区直属机构

  • 市场监督管理局
  • 林业和草原局
  • 广播电视局
  • 体育局
  • 统计局
  • 能源局
  • 地方金融管理局
  • 国防动员办公室
  • 医保局
  • 信访局
内蒙古自治区科学技术厅
内蒙古
  • 网站首页
  • 组织机构
  • 科技动态
  • 政务公开
  • 政务服务
  • 互动交流
  • 专题专栏
  • 内蒙古自治区人民政府网站
  • 暖心专区暖心专区
  • 微信政务微信
  • 登录/注册
  • 部门网站导航

    自治区政府组成部门

    • 发展和改革委员会
    • 教育厅
    • 科学技术厅
    • 工业和信息化厅
    • 民族事务委员会
    • 公安厅
    • 民政厅
    • 司法厅
    • 财政厅
    • 人力资源和社会保障厅
    • 自然资源厅
    • 住房和城乡建设厅
    • 生态环境厅
    • 交通运输厅
    • 水利厅
    • 农牧厅
    • 商务厅
    • 文化和旅游厅
    • 卫生健康委员会
    • 退役军人事务厅
    • 应急管理厅
    • 审计厅

    自治区直属特设机构

    • 国有资产监督管理委员会

    自治区直属机构

    • 市场监督管理局
    • 林业和草原局
    • 广播电视局
    • 体育局
    • 统计局
    • 能源局
    • 地方金融管理局
    • 国防动员办公室
    • 医保局
    • 信访局
内蒙古自治区科学技术厅
  • 无障碍浏览
  • 退出长辈版
内蒙古
  • 网站首页

    网站首页

  • 组织机构
  • 科技动态
  • 政务公开
  • 政务服务
  • 互动交流
  • 专题专栏
当前位置: 首页 > 科技动态 > 工作动态 > 科技厅工作

我区科研团队在情感语音转换(VC)领域取得新进展

来源:内蒙古自治区科技厅基础研究处 发布日期:2022-08-25 09:18 
字体:[ 大 | 中 | 小 ]
分享到:
打印本页

近日,内蒙古大学计算机学院刘瑞研究员所在科研团队与日本大阪大学科学与工业研究所罗兆杰教授团队合作在国际信号处理领域TOP期刊《IEEE/ACM音频、语音和语言处理汇刊》(IEEE/ACM Transactions on Audio, Speech, and Language Processing)发表了“通过源滤波网络将独立于说话人的情感解耦以进行语音转换”(Decoupling Speaker-independent Emotions for Voice Conversion Via Source-Filter Networks)最新研究成果。

提出模型SFEVC的总体结构图

该研究依托内蒙古大学蒙古文智能信息处理技术国家地方联合工程研究中心、蒙古文信息处理技术自治区重点实验室,并得到2022年内蒙古大学骏马计划高层次人才引进项目的支持。

情感语音转换(VC)旨在将中性语音转换为情感声音,同时保留语言信息和说话者的身份。科研团队注意到,将情感特征与其他语音信息(例如内容、说话者身份等)的解藕是实现高质量转换效果的关键。由于情感语音中声学特征的解藕更加复杂,因此面向中性语音的特征解藕工作无法很好的工作。科研团队针对情感语音转换的声学特征解藕问题开展研究,提出了一种基于“源-滤波器”模型的情感语音转换系统。具体来说,为了解决情感语音转换的特征解藕问题,该论文提出了一种新颖的基于Source-Filter(源-滤波器)模型的情感VC模型(简称SFEVC),以从音色和音调特征中准确过滤说话人独立的情感线索。SFEVC模型由多通道编码器、情感独立编码器、预训练的说话人相关编码器和相应的解码器组成。所有编码器模块都采用信息瓶颈自动编码器。此外,为了进一步提高各种情绪的转化质量,提出了基于二维VA空间的训练策略。实验结果表明,提出的SFEVC模型以及VA训练策略的表现均优于所有基线系统,并基于非平行数据在说话人无关的情感VC场景下实现了最优性能。

论文链接:https://ieeexplore.ieee.org/document/9829916


附件:

上一篇: 内蒙古自治区人民政府、上海交通大学第一届校地合作指导委员会第一次会议在呼召开

下一篇: 自治区重点实验室优化重组开始了!

中国政府网
科学技术部
内蒙古自治区政府网
各省科技厅网
北京 天津 河北 山西 辽宁 吉林 黑龙江 上海 江苏 浙江 安徽 福建 江西 山东 河南 湖北 湖南 广东 广西 海南 重庆 四川 贵州 云南 西藏 陕西 甘肃 青海 宁夏 新疆 香港
各盟市科技网
呼和浩特市 包头市 赤峰市 兴安盟 通辽市 巴彦淖尔市 乌海市 乌兰察布市 阿拉善盟 锡林郭勒盟 呼伦贝尔市
网站声明 网站地图

主办单位:内蒙古自治区科学技术厅 承办单位:内蒙古自治区科学技术厅 政府网站标识码:1500000057

蒙ICP备2021001220号-1 蒙公网安备15010502002335号

地址:内蒙古呼和浩特市赛罕区丰州南路78号 电话:0471-6328766/6328706 传真:0471-6923617 

微信公众号

内蒙古自治区人民政府网站 无障碍浏览
  • 组织机构
  • 科技动态
  • 政务公开
  • 政务服务
  • 互动交流
  • 专题专栏
当前位置: 首页 > 科技动态 > 工作动态 > 科技厅工作
科技厅工作

我区科研团队在情感语音转换(VC)领域取得新进展

发布时间:2022-08-25 09:16  来源:内蒙古自治区科技厅基础研究处

近日,内蒙古大学计算机学院刘瑞研究员所在科研团队与日本大阪大学科学与工业研究所罗兆杰教授团队合作在国际信号处理领域TOP期刊《IEEE/ACM音频、语音和语言处理汇刊》(IEEE/ACM Transactions on Audio, Speech, and Language Processing)发表了“通过源滤波网络将独立于说话人的情感解耦以进行语音转换”(Decoupling Speaker-independent Emotions for Voice Conversion Via Source-Filter Networks)最新研究成果。

提出模型SFEVC的总体结构图

该研究依托内蒙古大学蒙古文智能信息处理技术国家地方联合工程研究中心、蒙古文信息处理技术自治区重点实验室,并得到2022年内蒙古大学骏马计划高层次人才引进项目的支持。

情感语音转换(VC)旨在将中性语音转换为情感声音,同时保留语言信息和说话者的身份。科研团队注意到,将情感特征与其他语音信息(例如内容、说话者身份等)的解藕是实现高质量转换效果的关键。由于情感语音中声学特征的解藕更加复杂,因此面向中性语音的特征解藕工作无法很好的工作。科研团队针对情感语音转换的声学特征解藕问题开展研究,提出了一种基于“源-滤波器”模型的情感语音转换系统。具体来说,为了解决情感语音转换的特征解藕问题,该论文提出了一种新颖的基于Source-Filter(源-滤波器)模型的情感VC模型(简称SFEVC),以从音色和音调特征中准确过滤说话人独立的情感线索。SFEVC模型由多通道编码器、情感独立编码器、预训练的说话人相关编码器和相应的解码器组成。所有编码器模块都采用信息瓶颈自动编码器。此外,为了进一步提高各种情绪的转化质量,提出了基于二维VA空间的训练策略。实验结果表明,提出的SFEVC模型以及VA训练策略的表现均优于所有基线系统,并基于非平行数据在说话人无关的情感VC场景下实现了最优性能。

论文链接:https://ieeexplore.ieee.org/document/9829916


附件:

主办单位:内蒙古自治区科学技术厅

蒙ICP备19004535号 蒙公网安备:15010502000857号

增值电信业务经营许可证:蒙B2-20090015

地址:内蒙古呼和浩特市赛罕区丰州南路78号

电话:0471-6328766/6328706 传真:0471-6923617