技术教育社区
www.teccses.org

智能计算系统

封面

作者:霁等

页数:380

出版社:机械工业出版社

出版日期:2020

ISBN:9787111646235

电子书格式:pdf/epub/txt

内容简介

《智能计算系统》由深度学习处理器芯片研究的开拓者陈云霁领衔,中科院计算所、软件所的专家学者倾心写就。智能领域系统能力培养大成之作!
领衔作者陈云霁带领的团队曾研制了国际上首个深度学习处理器芯片“寒武纪1号”,本书凝聚了作者团队多年的科研和教学成果,是前沿研究与技术实践结合,快速提升智能领域系统能力的教材和技术参考书。

作者简介

陈云霁 中国科学院计算技术研究所研究员、博导、智能处理器研究中心主任,中国科学院大学岗位教授,教育部高等学校计算机类专业教学指导委员会计算机系统专委会委员。他带领其团队研制了国际上首个深度学习处理器芯片“寒武纪1号”。他的研究成果已经应用在近亿台智能手机和服务器中。他的学术论文多次获得计算机体系结构顶级国际会议最佳论文奖,受到上百个国际知名机构跟踪引用。因此,他被Science杂志刊文评价为深度学习处理器研究的“先驱”和“引领者”。
他曾获国家杰出青年科学基金、中国青年科技奖、全国创新争先奖、教育部“青年长江学者”、国家自然科学基金委“优秀青年基金”、国家万人计划“青年拔尖人才”,并被《MIT科技评论》评为全球35位杰出青年创新者(2015年度)。他还是北京智源人工智能研究院智能体系结构与芯片方向首席科学家。

李玲 中科院软件所研究员、博导,CCF高级会员。研究方向为智能计算及视频处理。在相关领域发表多篇CCF A类期刊和会议论文,获得了CCF A类会议MICRO’14的最佳论文奖(这是50年来唯一一次美国以外的国家在该会议上获此奖)。作为负责人主持过多项国家自然科学基金项目、国家重点研发计划课题等。陈云霁 中国科学院计算技术研究所研究员、博导、智能处理器研究中心主任,中国科学院大学岗位教授,教育部高等学校计算机类专业教学指导委员会计算机系统专委会委员。他带领其团队研制了国际上首个深度学习处理器芯片“寒武纪1号”。他的研究成果已经应用在近亿台智能手机和服务器中。他的学术论文多次获得计算机体系结构顶级国际会议最佳论文奖,受到上百个国际知名机构跟踪引用。因此,他被Science杂志刊文评价为深度学习处理器研究的“先驱”和“引领者”。
他曾获国家杰出青年科学基金、中国青年科技奖、全国创新争先奖、教育部“青年长江学者”、国家自然科学基金委“优秀青年基金”、国家万人计划“青年拔尖人才”,并被《MIT科技评论》评为全球35位杰出青年创新者(2015年度)。他还是北京智源人工智能研究院智能体系结构与芯片方向首席科学家。

李玲 中科院软件所研究员、博导,CCF高级会员。研究方向为智能计算及视频处理。在相关领域发表多篇CCF A类期刊和会议论文,获得了CCF A类会议MICRO’14的最佳论文奖(这是50年来唯一一次美国以外的国家在该会议上获此奖)。作为负责人主持过多项国家自然科学基金项目、国家重点研发计划课题等。
李威 中科院计算所副研究员。研究方向为高性能智能计算系统设计技术,先后参与了多项国家重点研发计划项目、国家科技重大专项项目、863项目、中科院国际合作项目等。作为核心成员参与了多款深度学习处理器的研发,发表或录用学术论文近30篇,申请专利近20项。
郭崎 中科院计算所研究员。长期从事智能计算系统相关研究。在ISCA、MICRO、HPCA、IJCAI等国际会议及ACM/IEEE汇刊上发表学术论文多篇。授权发明专利多项,曾入选国家知识产权局“百件优秀中国专利”。先后入选中国科协首届“青年人才托举工程”、中科院青年创新促进会、国家“万人计划”青年拔尖人才。
杜子东 中科院计算所副研究员。长期从事人工智能和计算机体系结构交叉研究,他在深度学习处理器方向做出了多项有国际影响力的研究成果。他在中国计算机学会认定的顶级会议/期刊(CCF A类)上发表了近20篇论文,曾获得ASPLOS’14最佳论文奖(这是亚洲机构首次获计算机体系结构领域的顶级国际会议最佳论文奖),入选IEEE Micro杂志评选的国际计算机体系结构领域年度十佳论文。

相关资料

专家评论
陈国良 中国科学院院士
原中国科大计算机系主任,首届全国高校教学名师
培养具有系统思维的人工智能人才必须要有好的教材。在中国乃至整个国际上,对当代人工智能计算系统进行全局系统介绍的教材十分稀少。因此,这本《智能计算系统》教材就显得尤为及时和重要。

李国杰 中国工程院院士
中科院大学计算机学院院长,中国计算机学会名誉理事长
懂不懂系统知识带来的工作成效差别巨大。这本教材以“图像风格迁移”这一具体的智能应用为牵引,对智能计算系统的软硬件技术栈各层的奥妙和相互联系进行精确、扼要的介绍,使学生对系统全貌有一个深刻印象。

孙凝晖 中国工程院院士
中科院计算所所长,国家智能计算机研发中心主任
计算所的学科优势是计算机系统与算法。计算所智能处理器中心在智能方向打通了系统与算法,再将这些科研优势辐射到教学,写出了这本代表计算所学派特色的教材。读者从中不仅能学到知识,也能一窥计算所做学问的方法。

张宏江 ACM/IEEE会士
北京智源人工智能研究院理事长,源码资本合伙人
作为北京智源研究院智能体系结构方向首席科学家,陈云霁领衔编写的这本教材,深入浅出地介绍了当代智能计算系统软硬件技术栈,其系统性、全面性在国内外都非常难得,值得每位人工智能方向的同学阅读。

张旭 中国科学院院士
中科院上海分院副院长,中国神经科学学会理事长
《智能计算系统》是最部致力于培养人工智能计算系统思维能力的优秀教材,使学生能够融会贯通地理解智能计算系统的完整软硬件技术体系,在科研道路上拥有更宽广的发展空间。

张亚勤 美国艺术与科学院院士
原百度公司总裁,清华大学智能科学讲席教授
这本教材深层次、全栈性的解析了AI的关键理论和技术,又通过一个图像风格迁移的实例生动地演示了AI的实践。《智能计算系统》是本好书,尤其适合作为本科高年级/研究生教材和科技人员的参考书,我大力推荐!

郑纬民 中国工程院院士
清华大学计算机系教授,原中国计算机学会理事长
本书对人工智能软硬件技术栈(包括智能算法、智能编程框架、智能芯片结构、智能编程语言等)进行了全方位、系统性的介绍,非常适合培养学生的系统思维。到目前为止,国内外少有同类书。

周志华 AAAI/AAAS/ACM/IEEE会士
南京大学人工智能学院院长,南京大学计算机系主任
本书覆盖了神经网络基础算法、深度学习编程框架、芯片体系结构等,是国内最本关于深度学习计算系统的书籍。主要作者是寒武纪深度学习处理器基础研究的开拓者,基于一流科研水平成书,值得期待。

本书特色

本书通过一个贯穿始终的应用案例——图像风格迁移,全面系统地介绍智能计算系统的软硬件技术栈,涵盖神经网络基础算法、深度学习编程框架、智能芯片体系结构、智能编程语言等。领衔作者陈云霁带领的团队曾研制了国际上首个深度学习处理器芯片“寒武纪1号”,本书凝聚了作者团队多年的科研和教学成果,是前沿研究与技术实践结合,快速提升智能领域系统能力的教材和技术参考书。
《智能计算系统》首先概述人工智能和智能计算系统(第1章);接下来介绍完成应用所必要的神经网络和深度学习算法知识(第2、3章);然后介绍支撑算法在智能芯片上运行的编程框架(第4、5章);再往下是智能芯片,即引导学生设计一款满足图像风格迁移应用需求的深度学习处理器(第6、7章);接下来介绍如何利用智能编程语言BCL提升开发智能应用的效率(第8章);最后以具体实验把所学知识点串联起来,打通知识结构的“任督二脉”(第9章)。

目录

序言一
序言二
前 言第1章 概述11.1 人工智能11.1.1 什么是人工智能11.1.2 人工智能的发展历史11.1.3 人工智能的主要方法41.2 智能计算系统81.2.1 什么是智能计算系统81.2.2 为什么需要智能计算系统81.2.3 智能计算系统的发展81.3 驱动范例111.4 本章小结13习题13
第2章 神经网络基础142.1 从机器学习到神经网络142.1.1 基本概念142.1.2 线性回归152.1.3 感知机172.1.4 两层神经网络——多层感知机192.1.5 深度学习(深层神经网络)202.1.6 神经网络发展历程212.2 神经网络训练232.2.1 正向传播242.2.2 反向传播252.3 神经网络设计原则272.3.1 网络的拓扑结构272.3.2 激活函数272.3.3 损失函数302.4 过拟合与正则化322.4.1 过拟合332.4.2 正则化342.5 交叉验证372.6 本章小结39习题39
第3章 深度学习413.1 适合图像处理的卷积神经网络413.1.1 卷积神经网络的组成423.1.2 卷积层433.1.3 池化层483.1.4 全连接层493.1.5 softmax层503.1.6 卷积神经网络总体结构503.2 基于卷积神经网络的图像分类算法523.2.1 AlexNet533.2.2 VGG563.2.3 Inception593.2.4 ResNet663.3 基于卷积神经网络的图像目标检测算法693.3.1 评价指标693.3.2 R睠NN系列723.3.3 YOLO783.3.4 SSD813.3.5 小结83
3.4 序列模型:循环神经网络833.4.1 RNN843.4.2 LSTM883.4.3 GRU893.4.4 小结903.5 生成对抗网络913.5.1 模型组成913.5.2 GAN训练923.5.3 GAN结构943.6 驱动范例963.6.1 基于卷积神经网络的图像风格迁移算法963.6.2 实时图像风格迁移算法983.7 本章小结100习题100
第4章 编程框架使用1014.1 为什么需要编程框架1014.2 编程框架概述1024.2.1 通用编程框架概述1024.2.2 TensorFlow概述1024.3 TensorFlow编程模型及基本用法1034.3.1 计算图1044.3.2 操作1054.3.3 张量1064.3.4 会话1104.3.5 变量1144.3.6 占位符1164.3.7 队列1174.4 基于TensorFlow实现深度学习预测1174.4.1 读取输入样本1184.4.2 定义基本运算单元1184.4.3 创建神经网络模型1224.4.4 计算神经网络模型输出1234.5 基于TensorFlow实现深度学习训练1234.5.1 加载数据1234.5.2 模型训练1294.5.3 模型保存1354.5.4 图像风格迁移训练的实现1374.6 本章小结139习题139
第5章 编程框架机理1415.1 TensorFlow设计原则1415.1.1 高性能1415.1.2 易开发1425.1.3 可移植1425.2 TensorFlow计算图机制1425.2.1 一切都是计算图1435.2.2 计算图本地执行1505.2.3 计算图分布式执行1545.3 TensorFlow系统实现1555.3.1 整体架构1555.3.2 计算图执行模块1565.3.3 设备抽象和管理1615.3.4 网络和通信1625.3.5 算子实现1675.4 编程框架对比1695.4.1 TensorFlow1705.4.2 PyTorch1715.4.3 MXNet1715.4.4 Caffe1725.5 本章小结172习题172
第6章 深度学习处理器原理1746.1 深度学习处理器概述1746.1.1 深度学习处理器的意义1746.1.2 深度学习处理器的发展历史1756.1.3 设计思路1776.2 目标算法分析1786.2.1 计算特征1786.2.2 访存特征1816.3 深度学习处理器DLP结构1866.3.1 指令集1866.3.2 流水线1906.3.3 运算部件1906.3.4 访存部件1936.3.5 算法到芯片的映射1946.3.6 小结1956.4 优化设计1956.4.1 基于标量MAC的运算部件1956.4.2 稀疏化1986.4.3 低位宽1996.5 性能评价2016.5.1 性能指标2016.5.2 测试基准程序2026.5.3 影响性能的因素2036.6 其他加速器2036.6.1 GPU架构简述2046.6.2 FPGA架构简述2046.6.3 DLP与GPU、FPGA的对比2056.7 本章小结206习题206
第7章 深度学习处理器架构2077.1 单核深度学习处理器2077.1.1 总体架构2087.1.2 控制模块2097.1.3 运算模块2127.1.4 存储单元2157.1.5 小结2157.2 多核深度学习处理器2167.2.1 总体架构2167.2.2 Cluster架构2177.2.3 互联架构2237.2.4 小结2247.3 本章小结225习题225
第8章 智能编程语言2278.1 为什么需要智能编程语言2278.1.1 语义鸿沟2288.1.2 硬件鸿沟2308.1.3 平台鸿沟2328.1.4 小结2338.2 智能计算系统抽象架构2348.2.1 抽象硬件架构2348.2.2 典型智能计算系统2358.2.3 控制模型2368.2.4 计算模型2368.2.5 存储模型2378.3 智能编程模型2388.3.1 异构编程模型2398.3.2 通用智能编程模型2428.4 智能编程语言基础2478.4.1 语法概述2478.4.2 数据类型2488.4.3 宏、常量与内置变量2508.4.4 I/O操作语句2508.4.5 标量计算语句2528.4.6 张量计算语句2528.4.7 控制流语句2528.4.8 串行程序示例2538.4.9 并行程序示例2548.5 智能应用编程接口2558.5.1 Kernel函数接口2558.5.2 运行时接口2578.5.3 使用示例2598.6 智能应用功能调试2628.6.1 功能调试方法2628.6.2 功能调试接口2668.6.3 功能调试工具2698.6.4 精度调试方法2728.6.5 功能调试实践2728.7 智能应用性能调优2808.7.1 性能调优方法2808.7.2 性能调优接口2828.7.3 性能调优工具2868.7.4 性能调优实践2878.8 基于智能编程语言的系统开发2948.8.1 高性能库算子开发2948.8.2 编程框架算子开发3008.8.3 系统开发与优化实践304习题321
第9章 实验3239.1 基础实验:图像风格迁移3239.1.1 基于智能编程语言的算子实现3239.1.2 图像风格迁移的实现3269.1.3 风格迁移实验的操作步骤3309.2 拓展实验:物体检测3339.2.1 基于智能编程语言的算子实现3339.2.2 物体检测的实现3379.3 拓展练习337
附录A 计算机体系结构基础340
附录B 实验环境说明345
参考文献348
后记356

下载地址

立即下载

(解压密码:www.teccses.org)

Article Title:《智能计算系统》
Article link:https://www.teccses.org/1130300.html