深度强化学习落地指南(博文视点出品)
图书信息
书名:深度强化学习落地指南(博文视点出品)作者:魏宁
包装:平装
开本:16
页数:202页
出版社:电子工业出版社
出版时间:2021-8
图书简介
《深度强化学习落地指南》是工业界一线算法工作者的实践之作,对深度强化学习的落地实践中的核心环节进行了完整复盘。本书旨在跳出传统叙述模式,提供一个横向的视角,让读者从需求分析和算法选择的方法、动作空间、状态空间和回报函数设计的理念、训练调试和性能冲刺的技巧等方面,系统学习深度强化学习的落地实践。优秀章对需求分析进行了详细的讨论,强调了需求分析的重要性,并提醒读者要避免成为“DRL铁锤人”。该章节分为四个部分,分别是需求分析基本概念、试试规则和启发式搜索、DRL的理由以及场景固定与数据廉价的问题。第二章主要介绍了动作空间的设计,详细讲解了常见动作空间类型、动作空间设计的基本原则以及动作空间的完备性、高效性和合法性等。此外,该章节还提到了非法动作屏蔽机制和Agent的知情权等问题。第三章介绍了状态空间设计,详细探讨了状态空间设计的两种常见误区、与动作空间和回报函数的协同设计以及状态空间设计的四个步骤。通过该章节的学习,读者可以掌握状态空间设计的关键技能。第四章重点讨论了回报函数设计问题,包括稀疏回报问题和最优回报问题等。该章节还介绍了辅助回报、回报函数设计的常见陷阱以及基于学习的回报函数等相关知识,使读者能够深入理解回报函数,并掌握回报函数设计的关键技能。第五章着重介绍了算法选择问题,展示了DRL算法的发展脉络,并对DRL算法进行了分类、比较和评估,让读者在面对各种算法选择问题时做出明智的选择。第六章主要探讨了训练调试问题,介绍了训练前的准备工作、训练进行时的注意事项以及数据预处理等相关技术。此外,该章节还给出了初学者的建议,使读者能够快速成长为一名优秀的算法工作者。第七章重点介绍了性能冲刺问题,包括课程学习、额外监督信号和进化策略等相关知识。该章节还提到了源任务及其分类、应用方式和关键细节等,使读者能够对DRL的性能进行进一步优化和提升。总的来说,本书对深度强化学习的落地实践问题进行了全面深入的探讨,讲解了多个难点问题,并提供了丰富的实践技能和经验分享。作为目前市面上重要的DRL实战指南,非常值得一读。
推荐理由
本书从工业界一线算法工作者的视角,对深度强化学习的多个重要问题进行了全面深入的探讨和讲解,让读者了解深度强化学习的落地实践中所面临的多种难题,并提供了大量实践技能和经验分享,是一本具有较高实践价值的指南。