2025计算机·理论知识
导演:纳跃跃 等
语音是最有效的人机交互方式之一。人工智能与传统语音技术相结合使其在家居、可穿戴、机器人、车载等智能终端设备上得到了普及。终端设备具有低资源、实时性、应用场景复杂多变等特点,对算法提出了更严格的要求。 本书介绍了面向端侧设备的若干智能语音处理技术,书中主要采用了传统信号处理与深度学习相结合的方法论,并且介绍了在实际工程应用中的若干心得。针对实际工程应用中的关键问题,如噪声抑制、回声消除、房间混响处理等,本书详细讲解了几种重要的算法,包括固定波束形成、自适应波束形成、盲源分离等,并分别讨论了它们的优缺点及应用场景。此外,书中涵盖了基于自适应滤波的回声、混响、干扰联合抑制方法,以及利用深度神经网络进行语音增强、语音活动性检测和关键词检测的技术。为了使模型能够高效地部署于资源受限的终端设备上,本书也涉及模型量化的方法,该方法通过减小模型大小来节约存储空间并降低计算复杂度。 本书适合理工科高年级本科生、研究生,以及语音领域的工程师阅读。