
会员
强化学习:原理与Python实战
肖智清更新时间:2023-10-19 17:44:38
最新章节:封底开会员,本书免费读 >
本书从原理和实战两个方面介绍了强化学习。原理方面,深入介绍了主流强化学习理论和算法,覆盖资格迹等经典算法和MuZero等深度强化学习算法;实战方面,每章都配套了编程案例,以方便读者学习。全书从逻辑上分为三部分。第1章:从零开始介绍强化学习的背景知识,介绍环境库Gym的使用。第2~15章:基于折扣奖励离散时间Markov决策过程模型,介绍强化学习的主干理论和常见算法。采用数学语言推导强化学习的基础理论,进而在理论的基础上讲解算法,并为算法提供配套代码实现。基础理论的讲解突出主干部分,算法讲解全面覆盖主流的强化学习算法,包括经典的非深度强化学习算法和近年流行的强化学习算法。Python实现和算法讲解一一对应,还给出了深度强化学习算法的TensorFlow和PyTorch对照实现。第16章:介绍其他强化学习模型,包括平均奖励模型、连续时间模型、非齐次模型、半Markov模型、部分可观测模型等,以便更好了解强化学习研究的全貌。
品牌:机械工业出版社
上架时间:2023-08-01 00:00:00
出版社:机械工业出版社
本书数字版权由机械工业出版社提供,并由其授权上海阅文信息技术有限公司制作发行
强化学习:原理与Python实战最新章节
查看全部- 封底
- 作者简介
- 16.8 练习与模拟面试
- 16.7 本章小结
- 16.6 案例:老虎
- 16.5 部分可观测Markov决策过程
- 16.4 半Markov决策过程
- 16.3 非齐次Markov决策过程
- 16.2 连续时间Markov决策过程
- 16.1 平均奖励离散时间Markov决策过程
肖智清
主页
最新上架
深度探索:解码DeepSeek及人工智能的未来
本书深入剖析了中国人工智能崛起的神秘力量——DeepSeek,全面解读了其背后的技术逻辑、商业模式以及对未来社会的深远影响。通过对开源与闭源之争的探讨,以及对中美人工智能领域领袖人物不同战略思考的剖析,作者揭示了人工智能技术背后的复杂性,勾勒出技术进化的脉络,并勾画出产业未来发展的路径。书中还特别关注了中国在成本结构等方面的独特优势,展现了中国在全球人工智能竞争中的地位与潜力。本书会深入浅出地介绍计算机15.2万字- 会员
MindSpore科学计算
本书全面、系统地探讨科学计算的背景、机器学习的重要性以及昇思MindSpore框架在科学计算中的广泛应用。科学计算作为一门交叉学科,融合了数学、计算机科学与技术等领域的专业知识,在现代科学研究和工程实践中起着关键作用。本书以MindSpore为平台,深入研究这一全场景AI框架在科学计算中的探索与实践,通过对基础理论、行业应用和实际案例的详细介绍,为读者提供全方位的学习和参考资料。全书共8章,首先详计算机15.7万字 心智的10大模型
如今,人工智能的迅速发展给人们的日常生活和工作带来了巨大的影响。要想让人工智能朝着人类智能的方向持续迈进,我们就应该让我们创造的硅基大脑像人类大脑一样有感知、有记忆、有决策、有行动。问题的难点在于,人类大脑由约1000亿个神经元构成,神经元间交流复杂,大脑掌管认知、意识,影响我们生活的方方面面。我们如何破解如此庞大的复杂系统的运行机制呢?在《心智的10大模型》中,计算神经科学家格蕾丝·林赛深入探讨计算机19.9万字- 会员
生成:AI生产力重构营销新范式
从电台、电视、互网联到人工智能,每一次技术迭代总能为营销带来广泛的机会,并促使营销自身产生翻天覆地的变化。作为新技术的代表,生成式AI正以其强大的功能和广泛的应用场景,塑造着人们对于未来的憧憬。其对于世界的影响越巨大,对于营销范式的重塑会越深刻。本书基于技术和营销的关系,阐述了生成式AI技术条件下营销演变的底层逻辑,并进一步明确了未来的营销新趋势。通过深入分析生成式AI的洞察、创意和媒介能力,本书计算机12.8万字 - 会员
AI赋能项目经理:10倍提升项目管理效率
本书通过具体的实操案例,构建了一套针对项目管理的智能工具协同网络,使项目经理、产品经理及相关职业人群,理解并掌握AIGC技术,并且重塑面向未来的工作方式。本书共9章,主要内容如下:首先,介绍AIGC发展简史以及核心概念、技术场景。其次,结合项目管理的核心事项,阐述AIGC技术是如何赋能项目经理的,即项目经理如何通过构建数字工具协同体系,在智能技术的加持下提升职业竞争力。再次,结合实践介绍常用数字工计算机8.9万字 - 会员
图解大模型:生成式AI原理与实战
本书全程图解式讲解,通过大量全彩插图拆解概念,让读者真正告别学习大模型的枯燥和复杂。全书分为三部分,依次介绍语言模型的原理、应用及优化。第一部分理解语言模型(第1~3章),解析语言模型的核心概念,包括词元、嵌入向量及Transformer架构,帮助读者建立基础认知。第二部分使用预训练语言模型(第4~9章),介绍如何使用大模型进行文本分类、聚类、语义搜索、文本生成及多模态扩展,提升模型的应用能力。第计算机16.4万字 人工智能与计算生物的未来
这是一本探讨人工智能与生物技术的融合颠覆传统医疗,并会对未来药物研发产生重大影响的书。作者凭借其在生物科学方面的专业背景,以及在生物技术和制药行业的从业经验,为读者呈现了对于医疗科技这一前沿领域的深刻见解。书中首先概述了数据科学方法的兴起以及生物学领域的范式转变,这一转变催生了计算生物学的革命,即通过计算机模拟进行生物实验和药物研发。作者详细介绍了人工智能和深度学习领域的重大突破,并探讨了这些技术计算机18.6万字DeepSeek高效提问指南:提出好问题,才有好答案
如今,以DeepSeek为代表的AI工具迅速崛起,深刻地改变了人类获取与处理信息的方式。但在应用DeepSeek的过程中,很多人发现,向DeepSeek提出问题后,得到的回复往往不尽如人意,或是过于宽泛、缺乏针对性,或是未能切中要点、不能解决实际问题。导致这一问题的根本原因是,提问者缺乏有效的提问技巧,无法精准引导AI发挥强大的运算与分析能力。《DeepSeek高效提问指南》正是针对这一痛点,构建计算机11.4万字- 会员
AIGC提示工程师精进之道
本书是一本关于AIGC提示工程师的实用指南,讲解了成为优秀AIGC提示工程师所需的技术特长和知识、沟通和协作能力、持续学习和自我提升方法等。本书分为3篇,共13章。第1篇为AIGC提示工程师基础,内容包括AI崛起下的新职业──AIGC提示工程师、设计高效提示的基本原则、常用的提示方法以及提示工程实践中的常见问题等;第2篇为提示进阶技巧,内容包括优化提示的除错过程、解决复杂问题的高级提示技巧、提升提计算机12万字