R并行编程实战
- 资料大王PDF
-
0 次阅读
-
0 次下载
-
2023-11-19 22:57:43
微信
赏
支付宝
文档简介:
译者序
并行计算是一种通过执行多条指令来解决大型复杂计算问题的有效算法,可以显著提高计算机系统的计算速度和处理能力。R语言是目前非常流行的一种开源程序语
言,在统计学和生物学等学科中得到了广泛应用。本书成功地借助于R语言实现了并行计算的多种有效算法,并且通过案例分析了如何运用R语言执行并行计算。同时详细
介绍了并行计算中的R程序包的使用,如SPRINT包提供了一套从R中调用并行计算的MPI函数。全书案例简单易懂,程序翔实,叙述清晰。本书4位作者都是计算机专业的
资深专家和学者,从事并行计算多年,发表了众多优秀成果。本书的引进有益于读者运用R语言进行并行计算的研究,读者可以结合实际应用来学习本书中讨论的算法和
模型。
本书的翻译得到了国家自然科学基金(项目编号71461005)和广西高校数据分析与计算重点实验室的资助。特别感谢桂林电子科技大学研究生姚家进、郭梦菲、秦文
哲在翻译本书中所做的出色工作。
由于时间和水平所限,难免会有不当之处,希望同行和读者多加指正和批评。
前言
我们正处于信息爆炸时代。从个人到全世界,生活中的一切都变得越来越与物联网实时关联。据预测,到2020年,世界上的数据将超过现在的10倍,达到惊人的44泽
字节(1泽字节相当于2500亿张DVD)。为了解决大数据的规模和速度问题,我们需要巨大的计算、内存和磁盘资源,而为此就需要并行计算。
尽管使用的时间不长,但R作为一种开源统计编程语言,逐渐成为人们分析数据的关键基础技术之一。我敢说R现在是“数据科学家”的主流编程语言之一。
当然,数据科学家可能会部署许多其他工具来处理大数据的一些困难问题,如Python、SAS、SPSS或MATLAB。然而,自从1997年以来,随着开源语言的深入发展,R
语言非常流行,在20年中开发了许多存放于CRAN镜像站点的R添加包,这些添加包适用于几乎所有形式的数据分析,从小型数值矩阵到庞大的符号数据集,如生物分子
DNA。事实上,我认为R语言正成为“事实上”的数据科学脚本语言,它可以融合许多不同类型的高度复杂数据的分析方法。
R语言自身总是按照单线程来实现的,而且其原有的程序设计并没有应用并行机制。然而,为了达到某些功能的并行目的以及使用并行处理框架,R语言需要借助于某
些特别开发的外部添加包。我们将重点关注一些目前技术范围内可用的最好的并行算法。
在本书中,我们将介绍并行计算的各个方面,从单程序多数据(SPMD)到单指令多数据(SIMD)向量处理,包括用R添加包parallel来利用R内置的多核功能、用消息
传递接口(MPI)进行消息传递、用OpenCL处理通用GPU(GPGPU)的并行性。我们还将探讨并行性的不同框架方法,从利用任务分配的负载均......
评论
发表评论