自动语音识别(ASR)涉及自动将录制的语音转录为文本的模型、算法和系统。这是一个很难解决的问题,因为录制的语音可能变化很大——我们不一定是说话者是谁,录制语音的地方,或者信号中是否有其他声源(如噪音或竞争性说话者)。解决语音识别问题需要对机器学习、信号处理和声学语音学有所了解。在本课程中,我们将介绍所需的理论背景,以及如何将理论转化为有用的语音识别系统。实验室课程将使用深度学习框架介绍语音识别的核心概念,并采用开源的工具包来构建和运行语音识别系统。同时,主流的生物识别技术有指纹,虹膜,人脸,静脉以及声纹等,利用人体固有的生理特性(如指纹、脸象、虹膜等)和行为特征(如笔迹、声音、步态等)来进行个人身份的鉴定。本课程通过开源的虹膜识别库,使学生了解当前各种主流生物特征信息处理的技巧与应用场景。