策略优化

暂无介绍

文章

0推荐

124浏览

强化学习中，如何使用大模型进行策略优化？

引言强化学习〔Reinforcement Learning, RL〕是一种通过与环境交互来学习决策策略机器学习方法，在近年来发展中，大模型〔Large Language Models, LLMs〕逐渐变成强化学习中一个热门话题，本文将探讨如何利用大模型实行策略改良，并结合当下研究成果、实际应用案例

0
admin 发布于 2025-10-25 19:00