# 训练与模拟
在训练过程中,智能体会根据所获得的经验不断更新自身参数,从而获取最佳策略。在模拟的过程中,智能体只会和环境进行互动,而不更新内部参数。
# 智能体训练
在环境中对智能体进行训练。
智能体训练
| 函数名 | 简介 |
|---|---|
| train! | 智能体训练 |
| rlTrainOptions | 智能体训练选项 |
| epsilonGreedy | ε 贪心探索策略 |
| randomNoise | 随机噪声探索策略 |
| rlOptimizer | 神经网络优化器 |
| rlOptimizerOptions | 神经网络优化器选项 |
| rlEvaluator | 智能体评估器 |
| rlCustomEvaluator | 自定义智能体评估器 |
# 智能体模拟
在环境中对智能体进行模拟。
智能体模拟
| 函数名 | 简介 |
|---|---|
| rlSimulationOptions | 智能体模拟选项 |
| rlSim | 智能体模拟 |
| randomAction | 获取随机动作 |
# 数据保存与读取
数据保存与读取。
数据保存与读取
| 函数名 | 简介 |
|---|---|
| load_agent | 加载智能体 |
| save_result | 保存训练结果 |
| load_result | 读取训练结果 |
| plot_result | 绘制训练结果 |