您好,欢迎访问PDF电子书资源免费下载网

上传文档

当前位置:首页 > PDF图书 > 畅销书 > 小蜜蜂全站 > 科学计算与企业级应用的并行优化

科学计算与企业级应用的并行优化

二扫码支付 微信
二扫码支付 支付宝

还剩... 页未读,继续阅读

免费阅读已结束,点击付费阅读剩下 ...

¥ 0 元,已有0人购买

免费阅读

阅读已结束,您可以下载文档离线阅读

¥ 1 元,已有0人下载

付费下载
文档简介:

高性能计算技术丛书 科学计算与企业级应用的并行优化 刘文志 著 ISBN:978-7-111-50628-7 本书纸版由机械工业出版社于2015年出版,电子版由华章分社(北京华 章图文信息有限公司,北京奥维博世图书发行有限公司)全球范围内制 作与发行。 版权所有,侵权必究 客服热线:+ 86-10-68995265 客服信箱:service@bbbvip.com 官方网址:www.hzmedia.com.cn 新浪微博 @华章数媒 腾讯微博 @yanfabook 微信公众号 华章电子书(微信号:hzebook) 目录 序 前言 第1章 多核向量处理器架构 1.1 众核系统结构 1.2 众核架构的一致性 1.3 多核向量处理器架构 1.3.1 Intel Haswell CPU架构 1.3.2 ARM A15多核向量处理器架构 1.3.3 AMD GCN GPU架构 1.3.4 NVIDIA Kepler和Maxwell GPU架构 1.4 Intel MIC架构 1.4.1 整体架构 1.4.2 计算单元 1.4.3 存储器单元 1.4.4 MIC架构上一些容易成为瓶颈的设计 1.5 OpenCL程序在多核向量处理器上的映射 1.5.1 OpenCL程序在多核向量CPU上的映射 1.5.2 OpenCL程序在NVIDIA GPU上的映射 1.5.3 OpenCL程序在AMD GCN上的映射 1.6 OpenCL程序在各众核硬件上执行的区别 1.7 众核编程模式 1.8 众核性能优化 1.9 MIC和GPU编程比较 1.10 本章小结 第2章 常见线性代数算法优化 2.1 稀疏矩阵与向量乘法 2.1.1 稀疏矩阵的存储格式 2.1.2 CSR格式稀疏矩阵与向量乘法 2.1.3 ELL格式稀疏矩阵与向量乘 2.2 对称矩阵与向量乘积 2.2.1 串行代码 2.2.2 向量化对称矩阵与向量乘积 2.2.3 OpenMP并行化 2.2.4 CUDA代码 2.3 三角线性方程组的解法 2.3.1 串行算法 2.3.2 串行算法优化 2.3.3 AVX优化实现 2.3.4 NEON优化实现 2.3.5 如何提高并行度 2.3.6 CUDA算法实现 2.4 矩阵乘法 2.4.1 AVX指令计算矩阵乘法 2.4.2 NEON指令计算矩阵乘法 2.4.3 GPU计算矩阵乘法 2.5 本章小结 第3章 优化偏微分方程的数值解法 3.1 热传递问题 3.1.1 C代码及性能 3.1.2 OpenMP代码及性能 3.1.3 OpenACC代码及性能 3.1.4 CUDA代码......

资料大王PDF
资料大王PDF
  • 84971

    文档
  • 85.825

    金币
Ta的主页 发私信

84971篇文档

评论

发表评论
< /0 > 付费下载 ¥ 1 元

Powered by 阿里PDF-免费文档电子书下载

Copyright © PDF电子书资源免费下载网 All Rights Reserved. 皖ICP备2021018472号-4
×
保存成功