题名:
大规模数据分析和建模   da gui mo shu ju fen xi he jian mo / (美) Javier Luraschi, Kevin Kuo, Edgar Ruiz著 , 魏博译
ISBN:
978-7-111-66101-6 价格: CNY89.00
语种:
chi
载体形态:
245页 图 24cm
出版发行:
出版地: 北京 出版社: 机械工业出版社 出版日期: 2020.7
内容提要:
R语言以其对于统计分析、建模和可视化的有力支持, 成为很多数据科学家、算法人员和机器学习从业者的首选语言。而Spark则得益于其高效的计算性能和良好的接口, 成为人们处理大数据问题的利器。但两者一直以来都在各自的领域开疆拓土; 本书的目的是通过R语言使用Apache Spark, 以使两者发挥出更大的效能。本书第1-5章简单地介绍了如何大规模执行数据科学和机器学习项目。第6-9章介绍了使用Spark进行集群计算时令人激动的基本概念。第10-13章涵盖一些高级主题, 包括分布式R、数据流和社区贡献等。 
主题词:
数据处理  
中图分类法:
TP274 版次: 5
主要责任者:
卢拉辛 lu la xin 著
主要责任者:
guo 著
主要责任者:
鲁伊斯 lu yi si 著
次要责任者:
魏博 wei bo 译
责任者附注:
Javier Luraschi, 是一名软件工程师。Kevin Kuo, 为机器学习和模型部署构建了开源代码库。Edgar Ruiz, 具有部署企业报告和商业智能解决方案的背景。 
责任者附注:
责任者Luraschi规范汉译姓: 卢拉辛; 责任者Kuo规范汉译姓: 郭; 责任者Ruiz规范汉译姓: 鲁伊斯