AI逻界
首页
AI工具大全
AI教程
AI资讯
工具测评
AI工具
AI工具
文章
AI逻界
AI写作
AI办公
AI图像
AI视频
AI训练
AI设计
AI问答
AI音频
全部标签
ResNet3DCNN
通义推出CoGenAV多模态语音表征模型 可实现音画同步感知
近日,通义大模型发布CoGenAV,以音画同步理念创新语音识别技术,有效解决语音识别中噪声干扰的难题。 传统语音识别在噪声环境下表现欠佳,CoGenAV则另辟蹊径,通过学习audio-visual-text之间的时序对齐关系,构建出更鲁棒、更通用的语音表征框架,系统性提升语音识别任务(VSR/AVSR)、语音重建任务(AVSS/AVSE)以及语音同步任务(ASD)等多个Speech-Centric…
AI资讯
0
0
发布文章
发布快讯
创建圈子
发表话题
发布供求信息
发布问答
发布AI工具
提交工单