深度强化学习落地指南(博文视点出品)

更新时间: 2024年10月01日访问量: 3737次大中小

图书分类 : 人工智能

图书信息

书名：深度强化学习落地指南(博文视点出品)
作者：魏宁
包装：平装
开本：16
页数：202页
出版社：电子工业出版社
出版时间：2021-8

图书简介

《深度强化学习落地指南》是工业界一线算法工作者的实践之作，对深度强化学习的落地实践中的核心环节进行了完整复盘。本书旨在跳出传统叙述模式，提供一个横向的视角，让读者从需求分析和算法选择的方法、动作空间、状态空间和回报函数设计的理念、训练调试和性能冲刺的技巧等方面，系统学习深度强化学习的落地实践。优秀章对需求分析进行了详细的讨论，强调了需求分析的重要性，并提醒读者要避免成为“DRL铁锤人”。该章节分为四个部分，分别是需求分析基本概念、试试规则和启发式搜索、DRL的理由以及场景固定与数据廉价的问题。第二章主要介绍了动作空间的设计，详细讲解了常见动作空间类型、动作空间设计的基本原则以及动作空间的完备性、高效性和合法性等。此外，该章节还提到了非法动作屏蔽机制和Agent的知情权等问题。第三章介绍了状态空间设计，详细探讨了状态空间设计的两种常见误区、与动作空间和回报函数的协同设计以及状态空间设计的四个步骤。通过该章节的学习，读者可以掌握状态空间设计的关键技能。第四章重点讨论了回报函数设计问题，包括稀疏回报问题和最优回报问题等。该章节还介绍了辅助回报、回报函数设计的常见陷阱以及基于学习的回报函数等相关知识，使读者能够深入理解回报函数，并掌握回报函数设计的关键技能。第五章着重介绍了算法选择问题，展示了DRL算法的发展脉络，并对DRL算法进行了分类、比较和评估，让读者在面对各种算法选择问题时做出明智的选择。第六章主要探讨了训练调试问题，介绍了训练前的准备工作、训练进行时的注意事项以及数据预处理等相关技术。此外，该章节还给出了初学者的建议，使读者能够快速成长为一名优秀的算法工作者。第七章重点介绍了性能冲刺问题，包括课程学习、额外监督信号和进化策略等相关知识。该章节还提到了源任务及其分类、应用方式和关键细节等，使读者能够对DRL的性能进行进一步优化和提升。总的来说，本书对深度强化学习的落地实践问题进行了全面深入的探讨，讲解了多个难点问题，并提供了丰富的实践技能和经验分享。作为目前市面上重要的DRL实战指南，非常值得一读。

深度强化学习落地指南(博文视点出品)

图书信息

图书简介

推荐理由

魏宁的书,魏宁作品集