|
题名:
|
基于Python的Web大数据爬取实战指南 / 夏换, 杨秀璋, 于小民编著 , |
|
ISBN:
|
978-7-03-060637-2 价格: CNY142.00 |
|
语种:
|
chi |
|
载体形态:
|
275页 图 24cm |
|
出版发行:
|
出版地: 北京 出版社: 科学出版社 出版日期: 2019 |
|
内容提要:
|
本书主要是基于Python的Web大数据爬取实战指南, 选题内容包括基础知识和通过Python爬取Web网页数据两大部分。下图是PythonWeb数据采集的结构图, 主要包括三个部分: 网络传播技术、信息提取技术和数据存储技术。网络传播通常是使用HTTP进行, 常用的传播方式包括HTML、XML、Json、Ajax和纯文本等; 信息提取技术主要可以通过Python语言、R语言、Java语言等进行获取, 其中主要包括的技术包括: 正则表达式、XPath技术、Selenium、BeautifulSoup等; 数据存储技术主要是存储爬取的数据信息, 主要包括SQL数据库、纯文本格式等。 |
|
主题词:
|
软件工具 程序设计 |
|
中图分类法:
|
TP311.561 版次: 5 |
|
主要责任者:
|
夏换 编著 |
|
主要责任者:
|
杨秀璋 编著 |
|
主要责任者:
|
于小民 编著 |
|
附注:
|
贵州省普通高等学校科技拔尖人才支持计划项目“定向钻机远程实时监控大数据分析评价系统”(黔教合KY字 [2016] 068) 贵州省教育厅青年科技人才成长项目“实体和属性对齐方法的研究与实现”(黔教合KY字 [2016] 172) 贵州省教育厅青年科技人才成长项目“无线校园网络建设中Mesh网关负载均衡问题研究”(黔教合KY字 [2016] 178) 资助贵州省科技计划项目重点项目“圆形地下连续墙结构时变性仿真研究”(黔科合基础 [2019] 1403号) 贵州省科技计划项目“多源地理数据融合知识图谱构建方法在舆情分析中的应用-以 贵州省为例”(黔科合基础 [2019] 1041号) |