Joy RL：强化学习实践教程最新章节全文无弹窗在线阅读-QQ阅读男频历史网

QQ阅读玄幻男生网

玄幻男生网

达人推广书架浏览历史

登录 | 注册

书籍简介

本书是继《EasyRL：强化学习教程》（俗称“蘑菇书”）之后，为强化学习的读者专门打造的一本深入实践的全新教程。全书大部分内容基于3位作者的实践经验，涵盖马尔可夫决策过程、动态规划、免模型预测、免模型控制、深度学习基础、DQN算法、DQN算法进阶、策略梯度、Actor-Critic算法、DDPG与TD3算法、PPO算法等内容，旨在帮助读者快速入门强化学习的代码实践，并辅以一套开源代码框架“JoyRL”，便于读者适应业界应用研究风格的代码。与“蘑菇书”不同，本书对强化学习核心理论进行提炼，并串联知识点，重视强化学习代码实践的指导而不是对理论的详细讲解。本书适合具有一定编程基础且希望快速进入实践应用阶段的读者阅读。

品牌：人邮图书

上架时间：2025-04-01 00:00:00

出版社：人民邮电出版社

本书数字版权由人邮图书提供，并由其授权上海阅文信息技术有限公司制作发行

最新章节

江季王琦杨毅远

最新上架

会员
AIGC提示工程师精进之道
本书是一本关于AIGC提示工程师的实用指南，讲解了成为优秀AIGC提示工程师所需的技术特长和知识、沟通和协作能力、持续学习和自我提升方法等。本书分为3篇，共13章。第1篇为AIGC提示工程师基础，内容包括AI崛起下的新职业──AIGC提示工程师、设计高效提示的基本原则、常用的提示方法以及提示工程实践中的常见问题等；第2篇为提示进阶技巧，内容包括优化提示的除错过程、解决复杂问题的高级提示技巧、提升提
周喜平董丽莎编著计算机12万字
会员
AI原生应用开发：提示工程原理与实战
本书结合AI原生应用落地的大量实践，系统讲解提示工程的核心原理、相关案例分析和实战应用，涵盖提示工程概述、结构化提示设计、NLP任务提示、内容创作提示、生成可控性提示、提示安全设计、形式语言风格提示、推理提示和智能体提示等内容。本书的初衷不是告诉读者如何套用各种预设的提示模板，而是帮助读者深入理解和应用提示设计技巧，以找到决定大语言模型输出的关键因子，进而将提示工程的理论知识应用到产品设计中。本书
魏承东计算机18.2万字
智能涌现：AI时代的思考与探索
当前世界正处于百年变局，人类社会已经进入数字经济3.0时代：数字内容迭代，从1.0时代逐步迈入3.0时代；人工智能技术飞跃，从符号推理、深度学习走向知识+数据驱动的3.0时代；产业拓展更深更广，走向智能+3.0时代。随着大模型、ChatGPT、DeepSeek等智能涌现，我们该如何触发AI时代其他的突破性技术涌现？这些技术又该怎样反哺产业升级？本书阐述了人工智能技术演变的大趋势、算力驱动计算体系的
张亚勤计算机13.1万字
会员
社交网络信息传播模型、算法及应用
本书系统地阐述信息传播问题中所涉及的各种传播模型、数学优化方法以及计算方法等，并通过对大量信息传播的实际问题进行了建模与分析。该著作将为人工智能、大数据、管理科学、运筹学、人文社会科学等领域开展相关研究的本科生、研究生以及学者提供重要的参考。
朱建明计算机16万字
会员
AI虚拟仿真从入门到参赛
本书全面探讨人工智能三维仿真竞赛，包括竞赛的立意、类型和流程，并详细介绍人工智能三维仿真软件的核心功能，如编程、控制、循迹、定位等的应用。本书首先介绍人工智能三维仿真竞赛的基础知识，为读者打下坚实的理论基础；其次转向人工智能三维仿真软件的详细教学，通过具体案例强化读者的学习效果；最后总结人工智能三维仿真竞赛中的常见任务类型，并结合历史竞赛案例，为读者提供实际参考。本书适合准备参加人工智能三维仿真竞
李博金鑫主编计算机4.4万字
会员
人工智能数学基础与Python机器学习实战
本书分为3个部分：第1章和第2章是人工智能的数学基础，主要介绍了机器学习的概念、Python开发环境的搭建、机器学习bibei的数学知识，以及线性代数和概率论的相关知识；第3~12章主要介绍了回归模型、分类模型、聚类模型、半监督模型的建立和相关算法的理论，以及如何使用sklearn具体实现相关算法模型的搭建；第13章介绍了Spark机器学习，笔者认为对于机器学习，不能只限于Python中的skle
刘润森计算机0字
会员
秒懂AI辅助论文写作
本书是一本深入探讨AI在论文写作中应用的指南。本书通过九章内容，全面介绍如何在论文选题、前言写作、大纲写作、正文写作、数据分析、摘要写作、结语撰写、文稿翻译与润色、答辩PPT制作、查重投稿等环节借助AI提高效率和质量。本书不仅讨论了AI的使用伦理，还针对论文写作的具体问题，提供了提示词示例（已全部收录到秋叶AI智能鼠标平台），为论文写作提供了广阔的视角和新的方法。本书可作为缺少学术论文写作经验的大
秋叶佘有缘计算机7.3万字
会员
AI高手速成：DeepSeek让你工作变轻松
这是一本全面介绍AI应用的实用工具书，旨在为不同行业的专业人士提供实用的AI使用方法和策略。本书用简单易懂的语言解释了AI的基本工作原理，详细介绍了20多个通用AI指令，并通过案例展示如何运用这些指令解决工作问题；提供了AI在文案写作、数据处理、编程、教学和科研等场景中的实战应用案例，同时还提供了商业级解决方案和企业应用案例。本书既有AI应用的通用原则和方法，又有具体的流程步骤和样例演示，还提供了
谢志旺计算机5.5万字
会员
人工智能算法基础
本书分为4章，共20章。其中第1篇为基础算法篇，从第1章到第9章，讲述排序、查找、线性结构、树、散列、图、堆栈等基本数据结构算法；第2篇为机器学习算法篇，从第10章到第14章，讲述分类算法、回归算法、聚类算法、降维算法和集成学习算法；第3篇为强化学习算法篇，从第15章到第16章，讲述基于价值的强化学习算法和基于策略的强化学习算法；第4篇为深度学习算法篇，从第17章到第19章，讲述神经网络模型算法、
唐宇迪史卫亚罗召勇李琳侯惠芳编著计算机0字

同类书籍最近更新

会员
AIGC提示工程师精进之道
本书是一本关于AIGC提示工程师的实用指南，讲解了成为优秀AIGC提示工程师所需的技术特长和知识、沟通和协作能力、持续学习和自我提升方法等。本书分为3篇，共13章。第1篇为AIGC提示工程师基础，内容包括AI崛起下的新职业──AIGC提示工程师、设计高效提示的基本原则、常用的提示方法以及提示工程实践中的常见问题等；第2篇为提示进阶技巧，内容包括优化提示的除错过程、解决复杂问题的高级提示技巧、提升提
周喜平董丽莎编著人工智能12万字
会员
Joy RL：强化学习实践教程
本书是继《EasyRL：强化学习教程》（俗称“蘑菇书”）之后，为强化学习的读者专门打造的一本深入实践的全新教程。全书大部分内容基于3位作者的实践经验，涵盖马尔可夫决策过程、动态规划、免模型预测、免模型控制、深度学习基础、DQN算法、DQN算法进阶、策略梯度、Actor-Critic算法、DDPG与TD3算法、PPO算法等内容，旨在帮助读者快速入门强化学习的代码实践，并辅以一套开源代码框架“Joy
江季王琦杨毅远人工智能7.8万字
会员
高效用DeepSeek：职场逆袭的实战指南
本书以DeepSeek应用为基础，讲解了DeepSeek在自媒体、咨询、营销、教育、翻译、职场、编程等多个领域的应用。书中通过丰富的案例和详细的指导，展示了DeepSeek如何帮助自媒体人打造“爆款”内容，如何为咨询提供高效决策支持，如何在营销中实现流量裂变，如何重塑未来学习范式，以及如何助力职场人和企业实现业务增效等。本书内容通俗易懂，案例丰富，无论是AI（ArtificialIntellig
李艮基曹方咏峥肖灵儿编著人工智能8.2万字

关于腾讯About Tencent服务协议开放平台广告服务腾讯招聘腾讯公益客服中心违规举报

达人推广合作：https://kol.yuewen.com

网站合作：傅女士 fuli.a@yuewen.com

双新用户（设备和账号都新为双新用户）下载并登录后1-20天最多可免费领取20本会员/单订书且可免费读10天

Copyright (C) 2025 dwn.qq.com All Rights Reserved 上海阅文信息技术有限公司版权所有
粤公网安备 44030002000001号增值电信业务经营许可证：粤B2-20090059 互联网ICP备案号：粤B2-20090059-5 沪ICP备14016804号-3 举报电话：010-59357051 营业执照
网络文化经营许可证：沪网文 (2023) 3296-228号网络出版服务许可证：（署）网出证（沪）字第055号互联网宗教信息服务许可证：沪（2023）0000015