# 训练与模拟


在训练过程中,智能体会根据所获得的经验不断更新自身参数,从而获取最佳策略。在模拟的过程中,智能体只会和环境进行互动,而不更新内部参数。

# 智能体训练

在环境中对智能体进行训练。

智能体训练

函数名 简介
train! 智能体训练
rlTrainOptions 智能体训练选项
epsilonGreedy ε 贪心探索策略
randomNoise 随机噪声探索策略
rlOptimizer 神经网络优化器
rlOptimizerOptions 神经网络优化器选项
rlEvaluator 智能体评估器
rlCustomEvaluator 自定义智能体评估器

# 智能体模拟

在环境中对智能体进行模拟。

智能体模拟

函数名 简介
rlSimulationOptions 智能体模拟选项
rlSim 智能体模拟
randomAction 获取随机动作

# 数据保存与读取

数据保存与读取。

数据保存与读取

函数名 简介
load_agent 加载智能体
save_result 保存训练结果
load_result 读取训练结果
plot_result 绘制训练结果