联系方式

E-mail:yangyuhong@whu.edu.cn

办公电话:

办公地点:武汉大学本科生院楼南7楼

杨玉红

开云在线注册 人工智能系 国家多媒体软件工程技术研究中心 副教授 (硕导)

 杨玉红

  • 姓名:杨玉红

  • 主页:

  • 性别:

  • 职称:副教授 (硕导)

  • 学历学位:博士

  • 电话:

  • 办公地点:武汉大学本科生院楼南7楼

  • E-mail:yangyuhong ▇ whu.edu.cn 请手工替换符号

  • 领域:多媒体技术与大数据分析,多媒体信号处理,音视频处理

  • 招生信息:年度招收硕士2名,招收方向:通信与信息工程(学硕),计算机技术(专硕),电子与通信工程(专硕),软件工程(专硕)。 招收博士0名,招收方向:。

研究方向

杨玉红,开云在线注册副教授,硕士生导师。主要从事语音与音频信号处理研究和教学工作,主持国家自然科学基金项目2项,湖北省自然科学基金项目1项;参与多项国家级、省部级项目;发表SCI和EI检索论文二十余篇;申请国家发明专利27项,其中21项获得授权;参与国家音视频编码标准工作组AVS音频标准的制订工作,4项国家标准提案被接受为必选项;获省部级科技进步奖2项。担任中国计算机学会(CCF)语音对话与听觉专业委员会委员。

主要研究方向:语音与音频质量评价,空间音源方位评测,语音增强,语音分离,音频场景分类,说话人验证,语音编码。


教育背景

2000/09-2007/12,武汉大学,开云在线注册,博士1997/09-2000/06,武汉测绘科技大学(现武汉大学),信息工程学院,硕士1993/09-1997/06,武汉测绘科技大学(现武汉大学),信息工程学院,学士


工作经验

2008/11-至今,武汉大学,开云在线注册,副教授2002/11-2008/10,武汉大学,开云在线注册,讲师2000/08-2002/10,武汉大学,开云在线注册,助教


教授课程

主讲数字逻辑与数字电路、数字图像处理等本科生课程;

主讲数字信号处理、专业英语等研究生课程。


  1. Digital Signal Processing (Fall 15-21)

  2. Digital Image Processing (Fall18-21)

  3. Digital Fundamentals (Spring 19-22)


发表论文

Journal Papers

  1. Tu, Weiping, Yuhong Yang, Bo Du, Wanzhao Yang, Xiong Zhang, and Jiaxi Zheng. RNN based signal classification for hybrid audio data compression. Computing (2019): 1-15.

  2. Tu, Weiping, Yuhong Yang, Bo Du, Jiaxi Zheng, and Shuangxing Zhai. Towards a real time production of immersive spatial audio of high individuality with an RBF neural network. Journal of Parallel and Distributed Computing131 (2019): 120-129.

  3. Lu, Lu, Yuhong Yang, Yuzhi Jiang, Haojun Ai, and Weiping Tu. ”Shallow Convolutional Neural Networks for Acoustic Scene Classification.” Wuhan University Journal of Natural Sciences23, no. 2 (2018): 178-184.

  4. Gao Li, Hu Ruimin, Wang Xiaochen, Li, Gang, Yang Yuhong, Tu Weiping. JND-based spatial parameter quantization of multichannel audio signals[J]. EURASIP Journal on Audio, Speech, and Music Processing, 2016(1), 13.

  5. Shi Dong, Ruimin Hu*, Xiaochen Wang, Yuhong Yang, Weiping Tu. Expanded three-channel mid/side coding for three-dimensional multichannel audio systems[J], EURASIP Journal on Audio, Speech, and Music Processing, 2014:10.


Conference Papers

  1. Yu, Hongjiang, Wei-Ping Zhu, and Yuhong Yang. ”Constrained Ratio Mask for Speech Enhancement Using DNN.” Proc. Interspeech 2020 (2020): 2427-2431

  2. Yuhong Yang, Huiyu Zhang, Weiping Tu, Haojun Ai, Linjun Cai, Ruimin Hu, and Fei Xiang. Kullback-Leibler Divergence Frequency Warping Scale for Acoustic Scene Classification Using Convolutional Neural Network, in 2019 IEEE International Conference on Acoustics, Speech, and Signal Processing, Brighton, UK, MAY 12-17, ICASSP 2019.840-844

  3. Wang Song, Hu Ruimin, Chen Shihong, Wang Xiaochen, Yang Yuhong, Tu Weiping. 3D Sound Field Reproduction at Non Central Point for NHK 22.2 System[C]. In MMM 2017, Jan. 4-6, 2017.

  4. Wang Song, Hu Ruimin, Chen Shihong, Wang Xiaochen, Yang Yuhong, Tu Weiping. 3d sound field reproduction in arbitrary listening zone for multichannel system[J]. Electronics Letters, 2016 52(24): 2013-2015.

  5. Yang Yang, Yuhong Yang, Mang Ye, Wenxin Huang, Zheng Wang, Chao Liang, Lei Yao, Chunjie Zhang. Spatial Constrained Fine-grained Color Name for Person Re-identification[C], in MMM 2016, Part I, LNCS 9516, pp. 886–897, Jan. 4-6, 2016

  6. Yuhong Yang, Yanye Wang, Ruimin Hu, Hongjiang Yu, Li Gao and Song Wang. Level Ratio Based Inter and Intra Channel Prediction with Application to Stereo Audio Frame Loss Concealment[C]. in MMM2016, Part I, LNCS 9516, pp.654–661,Jan.4-6 2016.

  7. Wang, Song, Ruimin Hu, Shihong Chen, Xiaochen Wang, Yuhong Yang, and Weiping Tu. ”A down-mixing method for 22.2 multichannel system reproduction.” In 2015 IEEE International Conference on Acoustics, Speech and Signal Processing (ICASSP), pp. 634-638. IEEE, 2015.

  8. Gao, Li, Ruimin Hu, Yuhong Yang, Xiaocheng Wang, Weiping Tu, and Tingzhao Wu. ”Az imuthal perceptual resolution model based adaptive 3D spatial parameter coding.” In Inter national Conference on Multimedia Modeling, pp. 534-545. Springer, Cham, 2015.

  9. Ke, Shanfa, Xiaochen Wang, Li Gao, Tingzhao Wu, and Yuhong Yang. ”Physical properties of sound field based estimation of phantom source in 3D.” In Pacific Rim Conference on Multimedia, pp. 699-710. Springer, Cham, 2015.

  10. Yuhong Yang, Shaolong Dong, Ruimin Hu, Yanye Wang, Li Gao, Maosheng Zhang. An Inter frame Correlation Based Error Concealment of Immittance Spectral Coefficient for Mobile Speech and Audio Codec[C], in HPCC 2014, Paris, France, pp.436-441, Aug 20-22, 2014.

  11. Wang Song, Hu Ruimin, Chen, S., Wang Xiaochen, Yang Yuhong, Tu Weiping. (2015). 3D Panning Based Sound Field Enhancement Method for Ambisonics[C]. in PCM 2015. LNCS 9314, pp.135-145, 2015.

  12. Fang, Bowei, Xiaochen Wang, Song Wang, Ruimin Hu, Yuhong Yang, and Cheng Yang. ”Simplification of 3D Multichannel Sound System Based on Multizone Soundfield Reproduc tion.” In Pacific Rim Conference on Multimedia, pp. 344-353. Springer, Cham, 2015.

  13. Ruimin Hu, Maosheng Zhang, Xiaochen Wang, Yuhong Yang and Jiang Lin. Gain factors calibration in 3D sound reproduction using VBAP[C]. in 2013 IEEE Intelligent Information Hiding and Multimedia Signal Processing, Beijing, China, October 16-18, 2013

  14. Yuhong Yang, Hongjiang Yu, Ruimin Hu, Li Gao, Wang Song, Qing Zhai, Songbo Xie. Auditory Attention Based Mobile Audio Quality Assessment[C], in ICASSP 2014, Florence, Italy, May 04-09, 2014.

  15. Li Gao, Ruimin Hu, Yuhong Yang. A spatial priority based scalable audio coding[C], in ICASSP 2014, Florence, Italy, May 04-09, 2014.

  16. Wang Song, Hu Ruimin, Peng Bo, Yang Yuhong, Wang Heng , Sound intensity and particle velocity based three-dimensional panning methods by five loudspeakers[C], in ICME 2013, San Jose, CA, Jul. 15-19, 2013.

  17. Yang Yuhong, Yu Hongjiang, Hu Ruimin, Wang Song, Xie Songbo. A New Mobile Audio Quality Assessment Using Jitter Distortion measure approach[C], in QoMEX 2013, Austria, Jul. 3-5 2013.


科研课题

  1. 国家自然科学基金面上项目,62171326,基于重叠说话人噪声对抗机理的语音分离关键技术研究,2022/01-2025/12,63万元,在研,主持

  2. 湖北省重点研发计划项目(220171406)面向智慧城市的音频智能分析关键技术与应用,2021/06-2023/12, 100万元,在研,参加

  3. 小米-武汉大学人工智能联合实验室项目,面向阵列前端算法的语音客观评价体系,2018/09-2019/08,25万元,已结题,主持

  4. 国家重点研发计划,2016YFB0502200,高可用高精度室内智能混合定位与室内GIS技术,2016/01-2022/06,5670万元,参加

  5. 国家自然科学基金青年项目,61702472,面向个人近场环境的局部3D声场合成技术研究,2018/01-2020/12,29万元,在研,参加

  6. 国家高技术研究发展计划(863计划),2015AA016306,移动终端三维声场技术,2015/01-2017/12,300万元,参加

  7. 国家自然科学基金重点项目,61231015,三维音频基础理论与关键技术研究,2013/01-2017/12,315万元,已结题,参加

  8. 国家自然科学基金青年项目,61102127,基于听觉关注度的音频质量客观评价技术研究,2011/01-2014/12,26万元,已结题,主持

  9. 国家自然科学基金重点项目,60832002,移动音频编码关键技术研究,2009/01-2012/12,200万元,参加

  10. AVS国家音视频标准工作组工作,负责语音感知加权、自适应码本搜索、可分级编码技术提案以及音频质量评价技术的研究工作,以上工作的4项技术提案工作均被AVS国家标准接受,2004-至今,参加

  11. 国家科技重大专项,2010ZX03004-003-03,新型移动多媒体音视频编解码关键技术研究,2010/01-2012/12,779万元,参加

  12. 国家多媒体软件工程技术研究中心中试基地项目,ITU-T G.729EV-SWB核心算法研究, 2007/01-2008/12,25万元,参加

  13. 国家多媒体软件工程技术研究中心中试基地项目,3G移动音频关键算法研究, 2006/01-2007/12,68万元,参加

  14. 国家863计划项目,2004AA119010,数字视音频编码、传输、测试与应用示范-音频编码算法框架与关键技术,2004/01-2005/12,20万元,参加

  15. 国家自然科学基金面上项目,60272097,基于嵌入式编码器的分组语音传输研究,2003/01-2003/12,7万元,参加


研究团队

2022年研究方向团队构成如下:

  1. 语音分离:助理实验师1名、硕士生2名、本科生1名;

  2. 空间音频定位:助理实验师1名、硕士生1名、本科生1名;

  3. 异常音频事件检测:硕士生1名;

  4. 声纹识别:硕士生1名;

  5. 鼾声检测:本科生2名;

  6. 基于音频房间定位:硕士生1名、本科生1名。


我们欢迎对音频处理感兴趣同学加入我们的研究团队!


知识产权

[1].杨玉红,胡瑞敏,江玉至,陆璐,艾浩军,涂卫平,王晓晨, 张会玉. 一种声场景分类中融合类间标准差的特征提取方法[P]. 中国专利.ZL201710472024.0.  2020.07.10.[2].   杨玉红,张会玉,冯佳倩,胡瑞敏,艾浩军,涂卫平,王晓晨. 一种基于KL散度的音频特征提取方法. 中国专利. ZL201810930863.7. 2020.06.09.
[3].胡瑞敏、杨玉红、董少龙、谢松波、余洪江、成鸿飞、高丽、王晓晨、涂卫平. 一种音频解码器中帧差错隐藏的谱代替方法[P]. 中国专利. ZL201310429973.2. 2015.10.21
[4].胡瑞敏、杨玉红、王衍业、谢松波、董少龙、余洪江、高丽、王晓晨、涂卫平、高戈. 基于音频信号特性分类的无参考音频质量评价方法和系统[P]. 中国专利. ZL201410196690.2. 2017.7.31.
[5].胡瑞敏、杨玉红、谢松波、余洪江、董少龙、张聪、高丽、李登实、王晓晨、涂卫平. 一种面向移动音频的服务质量保障方法及系统[P]. 中国专利. ZL201310034369.X. 2016.3.2
[6].胡瑞敏、杨玉红、王衍业、董少龙、谢松波、余洪江、高丽、王晓晨、涂卫平、高戈. 混合音频解码器中帧差错隐藏的谱参数代替方法及系统[P]. 中国专利. ZL201310683244.X. 2016.3.16
[7].胡瑞敏,杨玉红,李登实,成鸿飞,余洪江,赵云,翟晴,高丽,王松. 一种3D音频质量客观评价方法[P]. 中国专利. ZL201210125344.6. 2013.5.8


学术服务

AVS音频提案

[1]杨玉红, 周成, 高戈, China AVS M2394: 语音频宽带感知加权[R].2008.

[2]杨玉红,高丽,杨裕才,陈先念, China AVS M2756: AVS-S的分级增强层编码提案[R]. 2010.

[3]张勇, 刘霖, 杨玉红,China AVS M1869:宽带语音开环基音搜索[R].2006.

[4]张勇, 刘霖, 杨玉红, China AVS M1922:宽带自适应码本激励搜索方法[R].2006.

[5]张勇, 杨玉红, 张伟, China AVS  M2052: 感知加权提案的改进[R].2007.

[6]艾浩军,邓桂平,胡瑞敏,杨玉红. China AVS M1434: 一种综合基于能量和不可预测性判据的窗切换[R]. 2004.

[7]胡瑞敏, 高戈, 涂卫平, 杨玉红, 陈水仙, 张勇, 周成,China AVS M2178:  AVS-S音频框架[R]. 2007.

[8]王晓晨, 杨玉红, 周成,China AVS M2748: 适用于AVS-S 的感知加权方法[R].2010.

[9]王晓晨, 涂卫平, 杨玉红, 杭波, 马晔, 王国英, China AVS M2749: 适用于AVS-S 的带宽扩展方法[R]. 2010.

[10]杨玉红,余洪江,胡瑞敏,谢松波,王衍业,王晓晨,姜林,涂卫平,高戈,翟晴,高丽,王松,杨乘,China AVS M3223: 关于P10客观质量评价的技术提案[R]. 2013.12.


成果展示


其他