找回密码
 立即注册
搜索
热搜: 新人报到
查看: 21|回复: 0

[论文] 《基于多尺度注意力融合的说话人识别方法》作者:刘一泽,伍淳华【PDF】

[复制链接]

用户组:分区版主

我,秦始皇,打钱

重建论坛勋章

      UID
51
      积分
1092
      回帖
239
      主题
202
      发书数
69
      威望
802
      铜币
3145
      贡献
0
      阅读权限
100
      注册时间
2025-2-27
      在线时间
228 小时
      最后登录
2025-3-15
发表于 2025-3-13 16:43 | 显示全部楼层 |阅读模式
基于多尺度注意力融合的说话人识别方法
刘一泽,伍淳华
(北京邮电大学网络空间学院,北京,100876)
摘要:RcsNet模型是说话人识别领域内的主流模型,其具有优秀的局部信息获取能力,但获取全局信息欠缺。相关领域的研究表明将全局信息引入ResNet模型能够有效提高模型性能。因此,本文向ResNet模型引入多尺度特征提取和多尺度注意力融合模块,提出了基于多尺度注意力融合的说话人识别方法,通过这两个模块可以有效建模全局信息,丰富模型对于说话人身份信息的获取。其次,使用多头注意力池化代替传统统计池化,有效提升话语级特征向量对于不同说话人的区分度。最终通过仿真实验验证了本文所提方法的有效性和优越性
关键词:说话人识别;残差网络;注意力机制
中图分类号:TN912.34





本帖子中包含更多资源

您需要 登录 才可以下载或查看,没有账号?立即注册

×

评分

参与人数 1威望 +1 铜币 +2 收起 理由
飞乌与渔 + 1 + 2 论坛有您更精彩!

查看全部评分

[发帖际遇]: 书呆熊 调戏牧羊犬,被咬,打防疫针,花费 4 铜币. 幸运榜 / 衰神榜
❤︎   做好人 · 读好书 · 得好报   ❤︎
回复

使用道具 举报

您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

Archiver|手机版|小黑屋|阡陌居

GMT+8, 2025-3-15 01:28 , Processed in 0.084812 second(s), 26 queries .

Powered by Discuz! X3.5

© 2001-2025 Discuz! Team.

快速回复 返回顶部 返回列表