阡陌居

 找回密码
 立即注册
搜索
热搜: 新人报到
查看: 69|回复: 0

[论文] 《一种基于深度强化学习的SDWN路由方法》作者:张校衔,刘绍华,孙毓声【PDF】

[复制链接]

用户组:分区版主

我,秦始皇,打钱

重建论坛爱心会员勋章重建论坛勋章版主勋章分区版主勋章

      UID
51
      积分
6865
      回帖
544
      主题
801
      发书数
333
      威望
4659
      铜币
4872
      贡献
1200
      阅读权限
100
      注册时间
2025-2-27
      在线时间
1137 小时
      最后登录
2025-4-29
发表于 2025-3-21 00:43 | 显示全部楼层 |阅读模式
一种基于深度强化学习的SDWN路由方法
张校衔,刘绍华,孙毓声
(北京邮电大学电子工程学院,北京市100876)
摘要:在移动互联网设备指数级增长和新型服务需求多样化的双重驱动下,传统无线局域网(WLAN)架构在动态资源调度和差异化服务质量(QualityofService,QoS)保障方面面临严峻挑战。作为新型网络架构,软件定义无线网络(Sofiware-DefinedWirelessNetworking,SDWN)通过控制平面与数据平面的解耦,虽然能够实现网络状态的全局感知和策略的动态部署,但在多业务并发场景下仍存在链路资源分配效率不足、流量QoS需求难以精准匹配等关键问题。为此,本文提出了一种融合深度强化学习(DeepReinforcementLeaming,DRL)的智能路由决策框架,旨在构建面向差异化QoS保障的动态资源优化机制。
本文将SDWN路由决策建模为马尔可夫决策过程(MarkovDecisionProcess,MIDP),通过精细设计状态空间和动作空间,构建基于近端策略优化(ProximalPolicyOptimization,PPO)算法的深度强化学习模型。针对多业务流的差异化QoS需求,提出动态奖励函数:综合考虑吞吐量、时延和丢包率并根据业务调整权重。为实现智能路由控制,设计基于概率转发的动态路由协议,通过OpenFlow流表项的实时更新机制,实现策略网络输出与数据平面转发的闭环控制。实验环境采用Ryu控制器与Mininet-Wifi构建的SDWN仿真平台,实验结果表明,在不同业务场景下,相较于传统几种路由算法,本文提出的方法在平均时延、丢包率和吞吐量方面均有明显提升。说明本文提出的路由算法能够根据保证多种业务类型的Qos需求,为多流共存场景下的网络资源调度问题提供了新的思路。
关键词:软件定义无线网络;流量分类;路由优化;深度强化学习
中图分类号:TP393





本帖子中包含更多资源

您需要 登录 才可以下载或查看,没有账号?立即注册

×

评分

参与人数 1威望 +1 铜币 +2 收起 理由
飞乌与渔 + 1 + 2 论坛有您更精彩!

查看全部评分

[发帖际遇]: 书呆熊 在白宫门前卖烤红薯,赚了 2 铜币. 幸运榜 / 衰神榜
❤︎   做好人 · 读好书 · 得好报   ❤︎
回复

使用道具 举报

您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

Archiver|手机版|小黑屋|阡陌居

GMT+8, 2025-4-29 07:14 , Processed in 0.066810 second(s), 26 queries .

Powered by Discuz! X3.5

© 2001-2025 Discuz! Team.

快速回复 返回顶部 返回列表