GPU高性能运算之CUDA
正在读(1人), 已读过(24人) |   放入书架
作  者: 张舒,褚艳利 主编
出 版 社: 水利水电出版社
  • 出版时间: 2009-10-1
  • 字  数: 438000
  • 版  次: 1
  • 页  数: 276
  • 印刷时间: 2009-10-1
  • 开  本: 16开
  • 印  次: 1
  • 纸  张: 胶版纸
  • I S B N : 9787508465432
  • 包  装: 平装
定价:¥38.00 当当价:¥32.00 折扣:84折 节省:¥6.00 钻石vip价:¥30.40
送积分:320 积分说明
 共有商品评论0查看评论摘要

最佳拍档

GPU高性能运算之CUDA

与此 1 件拍档商品一同购买

总定价:¥74.00

总当当价:¥62.30
请至少保留一件商品。

编辑推荐

精选典型实用例程,详解CUDA使用细节,重视理论结合实际,介绍并行程序设计方法,深入分析硬件架构,揭示模型与底层映射关系,精心总结优化经验,解析高性能编程技巧。

内容简介

本书是全国第一本全面介绍CUDA软硬件体系架构的书籍。全面介绍使用CUDA进行通用计算所需要的语法、硬件架构、程序优化技巧等知识,是进行GPU通用计算程序开发的入门教材和参考书。
本书共分5章。第1章介绍GPU通用计算的发展历程,介绍并行计算的历史、现状以及面临的问题;第2章介绍CUDA的使用方法,帮助读者理解CUDA的编程模型、存储器模型和执行模型,掌握CUDA程序的编写方法;第3章探讨CUDA硬件架构,深入分析Tesla GPU架构与CUDA通用计算的相互作用:第4章总结CUDA的高级优化方法,对任务划分、存储器访问、指令流效率等课题进行探讨;第5章以丰富的实例展示如何使用CUDA的强大性能解决实际问题。
本书可作为CUDA的学习入门和编程参考书,主要面向从事高性能计算的程序员与工程师,使用GPU加速专业领域计算的科研人员,以及对GPU通用计算感兴趣的程序员。开设相关课程的高等院校与科研机构也可选用本书作为教材。

作者简介

张舒,电子科技大学信息与通信工程专业硕士,现任NvIDIA深圳有限公司系统设计验证工程师,CUDA技术顾问。曾实现基于CUDA的神经网络、聚类分析、主分量分析等模式识别算法,以及信号仿真、密码破解、字符串匹配等应用。

目录

前言
第1章 GPU通用计算
1.1 多核计算的发展
1.1.1 CPU多核并行
1.1.2 超级计算机、集群与分布式计算
1.1.3 CPU+GPU异构并行
1.2 GPU发展简介
1.2.1 GPU渲染流水线
1.2.2 着色器模型
1.2.3 NVIDIA GPU发展简介
1.3 从GPGPU到CUDA
1.3.1 传统GPGPU开发
1.3.2 CUDA开发
第2章 CUDA基础
2.1 CUDA编程模型
2.1.1 主机与设备
2.1.2 Kernel函数的定义与调用
2.1.3 线程结构
2.1.4 硬件映射
2.1.5 deviceQuery示例
2.1.6 matrixAssign示例
2.2 CUDA软件体系
2.2.1 CUDA C语言
2.2.2 nvcc编译器
2.2.3 运行时APl与驱动APl
2.2.4 CUDA函数库
2.3 CUDA存储器模型
2.3.1 寄存器
2.3.2 局部存储器
2.3.3 共享存储器
2.3.4 全局存储器
2.3 5 主机端内存
2.3.6 主机端页锁定内存
2.3.7 常数存储器
2.3.8 纹理存储器
2.4 CUDA通信机制
2.4.1 同步函数
2.4.2 Volatile关键字
2.4.3 ATOM操作
2.4.4 VOTE操作
2.5 异步并行执行
2.5.1 流
2.5.2 事件
2.6 CUDA与图形学APl互操作
2.6.1 CUDA与OpenGL的互操作
2.6.2 CUDA与Direct3D互操作
2.7 多设备与设备集群
2.7.1 CUDA设备控制
2.7.2 CUDA与openMP
2.7.3 CUDA与集群
第3章 CUDA硬件架构
3.1 NVIDIA显卡构造简介
3.1.1 图形显卡概览
3.1.2 PCI—E总线
3.1.3 显存
3.1.4 GPU芯片
3.2 Tesla图形与计算架构
3.2.1 SPA—TPC—SM
3.2.2 主流GPU架构
3.3 Tesla通用计算模型
3.3.1 数据与指令的加载
3.3.2 warp指令的发射与执行
3.3.3 纹理、渲染和存储器流水线
第4章 CUDA程序的优化
4.1 CUDA程序优化概述
4.2 测量程序运行时间
4.2.1 设备端测时
4.2.2 主机端测时
4.3 任务划分
……
第5章 综合应用
附录A 安装、配置、编译及调试
附录B 常见问题与解答
附录C 技术规范
附录D C扩展
附录E 数学函数
附录F 纹理拾取
附录G 着色器模型

书摘插图

第1章 GPU通用计算
目前,主流计算机中的处理器主要是中央处理器CPU和图形处理器GPU。传统上,GPU只负责图形渲染,而大部分的处理都交给了CPU。
21世纪人类所面临的重要科技问题,如卫星成像数据的处理、基因工程、全球气候准确预报、核爆炸模拟等,数据规模已经达到TB甚至PB量级,没有万亿次以上的计算能力是无法解决的。与此同时,我们在日常应用中(如游戏、高清视频播放)面临的图形和数据计算也越来越复杂,对计算速度提出了严峻挑战。
GPU在处理能力和存储器带宽上相对CPU有明显优势,在成本和功耗上也不需要付出太大代价,从而为这些问题提供了新的解决方案。由于图形渲染的高度并行性,使得GPU可以通过增加并行处理单元和存储器控制单元的方式提高处理能力和存储器带宽。GPU设计者将更多的晶体管用作执行单元,而不是像CPU那样用作复杂的控制单元和缓存并以此来提高少量执行单元的执行效率。图1—1对CPU与GPU中晶体管的数量以及用途进行了比较。
……
书摘与插图

插图

商品评论 共22 (查看所有评论)

购买过的顾客平均评分

4星半
心情指数:14人 开心
阅读场所:10人 书桌旁
心情指数:  开心 阅读场所:  图书馆
发表于 2009-11-26 08:03
GPU作为未来CPU的协处理器的趋势已经非常明显了 ,GPU非常擅长数据密集型的应用计算。CUDA是GPU在通用计算领域的一个API,虽然不具备开放性,还是作为学习和初级探索是足够了!本书可谓是中国CUDA第一书! 
 
对于图形处理来说,未来的GPU一定是基于的Software Graphcis Pipeline编程的。当然,并不是所有程序员都有机会实现自己的软件流水线。而DX11的DirectCompute和CUDA也非常接近,CUDA2.x相当于前者的子集。所以学习CUDA对于图形处理中的Postprocessing的理解会更加深刻。这有助于提搞自己,从而成为最资深的图形工程师:〉 
 
当然,GPU的研究有很多领域,比如: 
* GPU Architec***e(图形处理器体系结构) 
* Graphics Algorithm(图形算法) 
* GPGPU Programming (通用的图形处理器编程) 
* Open Source Rendering Engine(开源渲染器) 
* Open Source GPU Simulator/RTL Implement(开源GPU模拟器) 
 
这本书讲述的CUDA主要聚焦在GPGPU编程领域,对GPU体系结构也作了些许介绍。如果对本书和GPGPU编程兴趣的可以来下面这个论坛看看: 
 
http://********gpu.org/bbs/ 
 
OpenGPU Graphics Open Source community(图形开源社区) 
本书的CUDA的官方QQ群是:48077444
还没有人对此评论进行投票。
个人评分: 心情指数:  伤感 阅读场所:  办公室
发表于 2009-11-29 16:07
给朋友捎的书 
自己不是软件方向的,不过听他说这书还行。现在OpenCL也开始了,CUDA不知道还能走多远。 
比较感慨的是这本书的作者们,年轻有为啊,残念啊……
1人认为此评论有用。
心情指数: 阅读场所:
发表于 2010-02-02 13:09
http://www.hpctech.com
还没有人对此评论进行投票。
个人评分: 心情指数:  开心 阅读场所:  书桌旁 图书馆
发表于 2010-01-22 14:26
由浅及深,值得一读~
还没有人对此评论进行投票。
个人评分: 心情指数:  开心 阅读场所:  办公室
发表于 2010-01-01 18:02
不错,书本很整洁,内容也不错。
还没有人对此评论进行投票。
  • 14人 开心
  • 2人 伤感
  • 0人 感动
  • 1人 没感觉
  • 0人 沉重
  • 0人 催眠
  • 0人 过瘾
  • 3人 受益匪浅
  • 2人 床上
  • 0人 公车上
  • 0人 咖啡馆
  • 10人 书桌旁
  • 0人 沙发
  • 8人 办公室
  • 2人 图书馆
  • 0人 厕所

顾客评分详情(20人)

  • 11人
  • 7人
  • 2人
  • 0人
  • 0人

 

  • 只有您在当当网购买过这件商品,并在“我的当当”里完成了确认收货之后,才可对它发表评论和评分。
  • 您可以通过“我的当当”里面“写评论”或“我要评论”的链接看到您可以评论的商品,并开始评论和评分。
更多内容请查看《商品评论FAQ
商品问答 共0
用户对此商品的提问与回复
暂时没有问答。