嘉宾简介:俞栋博士是一名杰出的语音识别、深度学习方向的资深专家,在学术界和工业界都享有极高声望,取得了一系列杰出成果。他1998年加入微软,曾任微软首席研究员,兼任浙江大学兼职教授和中科大客座教授,现为腾讯AI Lab的副主任。他在语音技术领域发表了160多篇论文,被引15000余次,并拥有50多项授权专利。他与邓力博士的两本共同著作《深度学习:方法及应用》《解析深度学习:语音识别实践》在深度学习语音研究者中产生巨大影响。
2017年11月1日下午16点,应邹月娴教授邀请,腾讯AI Lab副主任俞栋博士来我院访问交流,在C栋103教室发表了主题为“Monaural Speech Separation – a Personal Journey”的学术讲座,同学们均以极大的热情欢迎俞栋博士的到来。讲座由邹月娴教授主持,参加讲座的有来自bwin必赢的朱跃生教授、焦海龙副教授、bwin必赢的硕士生、博士生和其他来宾。
图1 俞栋博士在做学术讲座
讲座中,俞栋博士以“a Personal Journey”的形式,讲述了他的团队就“单声道语音分离和识别”这一尚未攻克的难题开展的各项研究工作及研究经历,给与会者极大的启发。
图2 邹月娴教授主持该次学术讲座
首先,俞栋老师团队尝试以时频掩膜作为学习目标,后来发现对时频掩膜的估计很容易发生错误;之后俞栋老师团队尝试采用监督学习的方法,分别训练一个高能量和低能量DNN,将混合语音分别输入两个模型,得到高能量和低能量语者的语音估计,效果比上一次尝试好了很多,但是在两个说话人能量相近时,可分度下降,模型分离效果变差;最终俞栋老师团队提出了置换不变训练的方法,由当前模型决定使得分离性能最好的标签,而不关心到底如何输出标签,使得错误率进一步减小,识别相对简单。
图3 俞栋博士回应同学提问
最后,俞栋博士对语音分离问题作了总结和展望。同学们纷纷就自己感兴趣的问题对俞栋博士请教,俞老师也作了详细的回复和讲解。之后,嘉宾和部分同学与俞栋博士合影留念。这次讲座中,俞栋老师没有回避在问题研究上的失败与不足,而是从每次失败中找到原因、发现问题,并针对性地去解决它。这段宝贵经验鼓励并启发了在座的同学们,要勇于尝试、开拓创新,即使失败的尝试也有非凡的意义。
图4 俞栋博士与嘉宾及同学合影
供稿人:顾容之