HyperAI超神经

首页资讯最新论文教程数据集百科 SOTA LLM 模型天梯 GPU 天梯顶会

中文

HyperAI超神经

语音分离

语音分离（Speech Separation）是指从混合语音信号中提取所有重叠的语音源的任务。作为声源分离问题的一个特殊场景，语音分离主要关注于分离出多个同时发声的语音信号，而非音乐或噪声等其他干扰信号。该技术在多说话人环境下的语音识别、听力辅助设备及音频编辑等领域具有重要应用价值。

TF-Locoformer (M)

MossFormer2 (w speed perturb)

Gated DualPathRNN

Gated DualPathRNN

GRID corpus (mixed-speech)

Conformer (large)

TCD-TIMIT corpus (mixed-speech)