题名:	大规模数据分析和建模 da gui mo shu ju fen xi he jian mo / (美) Javier Luraschi, Kevin Kuo, Edgar Ruiz著 , 魏博译
ISBN:	978-7-111-66101-6 价格： CNY89.00
语种:	chi
载体形态:	245页图 24cm
出版发行:	出版地：北京出版社：机械工业出版社出版日期： 2020.7
内容提要:	R语言以其对于统计分析、建模和可视化的有力支持, 成为很多数据科学家、算法人员和机器学习从业者的首选语言。而Spark则得益于其高效的计算性能和良好的接口, 成为人们处理大数据问题的利器。但两者一直以来都在各自的领域开疆拓土; 本书的目的是通过R语言使用Apache Spark, 以使两者发挥出更大的效能。本书第1-5章简单地介绍了如何大规模执行数据科学和机器学习项目。第6-9章介绍了使用Spark进行集群计算时令人激动的基本概念。第10-13章涵盖一些高级主题, 包括分布式R、数据流和社区贡献等。
主题词:	数据处理
中图分类法:	TP274 版次： 5
主要责任者:	卢拉辛 lu la xin 著
主要责任者:	郭 guo 著
主要责任者:	鲁伊斯 lu yi si 著
次要责任者:	魏博 wei bo 译
责任者附注:	Javier Luraschi, 是一名软件工程师。Kevin Kuo, 为机器学习和模型部署构建了开源代码库。Edgar Ruiz, 具有部署企业报告和商业智能解决方案的背景。
责任者附注:	责任者Luraschi规范汉译姓: 卢拉辛; 责任者Kuo规范汉译姓: 郭; 责任者Ruiz规范汉译姓: 鲁伊斯