强化学习:原理与Python实战在线阅读
会员

强化学习:原理与Python实战

肖智清
开会员,本书免费读 >

计算机网络人工智能17.2万字

更新时间:2023-10-19 17:44:38 最新章节:封底

立即阅读
加书架
下载
听书

书籍简介

本书从原理和实战两个方面介绍了强化学习。原理方面,深入介绍了主流强化学习理论和算法,覆盖资格迹等经典算法和MuZero等深度强化学习算法;实战方面,每章都配套了编程案例,以方便读者学习。全书从逻辑上分为三部分。第1章:从零开始介绍强化学习的背景知识,介绍环境库Gym的使用。第2~15章:基于折扣奖励离散时间Markov决策过程模型,介绍强化学习的主干理论和常见算法。采用数学语言推导强化学习的基础理论,进而在理论的基础上讲解算法,并为算法提供配套代码实现。基础理论的讲解突出主干部分,算法讲解全面覆盖主流的强化学习算法,包括经典的非深度强化学习算法和近年流行的强化学习算法。Python实现和算法讲解一一对应,还给出了深度强化学习算法的TensorFlow和PyTorch对照实现。第16章:介绍其他强化学习模型,包括平均奖励模型、连续时间模型、非齐次模型、半Markov模型、部分可观测模型等,以便更好了解强化学习研究的全貌。
品牌:机械工业出版社
上架时间:2023-08-01 00:00:00
出版社:机械工业出版社
本书数字版权由机械工业出版社提供,并由其授权上海阅文信息技术有限公司制作发行

最新章节

肖智清
主页
  • 会员
    全书分为三个部分。第一部分了解强化学习应用,了解强化学习基本知识,搭建强化学习测试环境。该部分包括:强化学习的概况、强化学习简单示例、强化学习算法的常见思想、强化学习的应用、强化学习测试环境的搭建。第二部分介绍强化学习理论与深度强化学习算法。强化学习理论部分:Markov决策过程的数学描述、MonteCarlo方法和时序差分方法的数学理论;深度强化学习算法部分:详细剖析全部具有重要影响力的深度强
    肖智清程序设计12.2万字

最新上架

  • 我们当下正在经历一场AI革命。现在有创纪录的310万个机器人在工厂工作,从事从组装电脑到包装货物以及监测空气质量等各种工作。数量庞大的智能机器以各种各样的方式影响着我们的生活,如提高外科医生的手术精确度,清洁我们的家等等,我们正处于机器智能带来的令人兴奋的可能性当中。下一个万亿规模的企业,也许正在AI机器人领域诞生。当下的机器人产业,远远超出常人的想象。你会看到全世界最先锋的机器人研究团队如何开发
    (美)丹妮拉·鲁斯 (美)格雷戈里·莫内计算机13.5万字
  • 会员
    本书介绍了人工智能概览、机器学习、深度学习、人工智能主流开发框架、华为全栈全场景AI战略—EI、HiAI、昇腾,以及人工智能综合实验等内容?这是一本华为ICT学院人工智能课程培训的教材。本书是作者和华为的工作人员共同完成的,其间参阅了国内外现有教材和相关文献后编写的?全书注重理论与实践的结合,注重算法与框架的实际应用与实现方法,注重创新思维的训练与培养?本书既可作为高等院校人工智能课程的培训教材,
    华为技术有限公司编著计算机13.6万字
  • 会员
    本书以第一人称视角,讲述AI的来龙去脉,表达AI的技术原理。从历史到未来,跨越百年时空;从理论到实践,解读AI大爆炸;从技术到哲学,穿越多个维度;从语言到绘画,落地实战演练。ChatGPT的诞生,引发了奇点降临,点亮了AGI(通用人工智能),并涉及大模型、深度神经网络、Transformer、AIGC、涌现效应等一系列技术前沿。
    量子学派@ChatGPT计算机8.6万字
  • 会员
    本书共分为8章,分别讲解了常见的人工智能以及人工智能影响下的广告流量变现、商业合作变现、直播变现、私域变现和IP变现等。此外,还对未来的人工智能与新媒体变现做了趋势分析。
    刘丙润计算机10.5万字
  • 这是一本探讨人工智能与生物技术的融合颠覆传统医疗,并会对未来药物研发产生重大影响的书。作者凭借其在生物科学方面的专业背景,以及在生物技术和制药行业的从业经验,为读者呈现了对于医疗科技这一前沿领域的深刻见解。书中首先概述了数据科学方法的兴起以及生物学领域的范式转变,这一转变催生了计算生物学的革命,即通过计算机模拟进行生物实验和药物研发。作者详细介绍了人工智能和深度学习领域的重大突破,并探讨了这些技术
    (美)布赖恩·希尔布什计算机18.6万字
  • 这是一本从实践角度系统且深入地讲解智能汽车软件功能安全和智能汽车软件研发的著作,得到了中国工程院院士李克强等13位产业界和学术界专家的一致推荐。作者在功能安全领域深耕10余年,有扎实的理论基础、丰富的实践经验,用挖掘本质的思维方法来撰写本书,从研发体系、架构设计、开发流程、开发方法、安全措施、创新研究等维度对智能汽车软件功能安全做了深入的讲解。全书共11章,分为3个部分。第一部分(第1~3章)智能
    吴丹丹计算机25.9万字
  • 会员
    本书介绍提示工程的基本概念和实践,旨在帮助读者了解如何构建高质量的提示内容。内容包括:认识大语言模型、ChatGPT应用体验、ChatGPTAPI、PythonChatGPTAPI库、提示工程、提示类型、基于提示工程应用Python数据分析等。
    兰一杰 于辉计算机14万字
  • 会员
    本书通过81个官方案例解析、120个知识点梳理,深入浅出介绍了Sora的技术原理、特色功能、创新之处、优势特点、文案工具、脚本创作、提示词技巧、绘画工具、创意应用、变现方式等,帮助读者一本书全面精通Sora的AI视频生成技术。10大专题内容、108分钟视频,手机扫码可看精华内容,同时赠送了9大超值资源:74组AI绘画提示词、104个效果文件、165页PPT课件、31集《AI摄影》教学视频、40集《
    智发编著计算机6.8万字
  • 会员
    本书共16章,内容包括人工智能、OpenAI、ChatGPT的概述及其操作技巧。生动展示了ChatGPT在教育与学术、商业管理、新媒体、办公、求职等12个领域的实际运用,同时探讨了ChatGPT当前面临的挑战以及大模型的未来发展方向。
    江涵丰计算机12万字