干净的数据:数据清洗入门与实践
- 资料大王PDF
-
0 次阅读
-
0 次下载
-
2024-03-10 17:59:36
微信
赏
支付宝
文档简介:
版权信息
书名:干净的数据:数据清洗入门与实践
作者:[美] Megan Squire
译者:任政委
ISBN:978-7-115-42047-3
本书由北京图灵文化发展有限公司发行数字版。版权所有,侵权必
究。
您购买的图灵电子书仅供您个人使用,未经授权,不得以任何方式复制
和传播本书内容。
我们愿意相信读者具有这样的良知和觉悟,与我们共同保护知识产权。
如果购买者有侵权行为,我们可能对该用户实施包括但不限于关闭该帐
号等维权措施,并可能追究法律责任。
图灵社区会员 麦嘉豪(852245696@qq.com) 专享 尊重版权
版权声明
前言
本书内容
你需要准备些什么
本书的目标读者
本书排版约定
读者反馈
客户支持
彩色图片下载
勘误表
关于盗版
问题反馈
第 1 章 为什么需要清洗数据
1.1 新视角
1.2 数据科学过程
1.3 传达数据清洗工作的内容
1.4 数据清洗环境
1.5 入门示例
1.6 小结
第 2 章 基础知识——格式、类型与编码
2.1 文件格式
2.1.1 文本文件与二进制文件
2.1.2 常见的文本文件格式
2.1.3 分隔格式
2.2 归档与压缩
2.2.1 归档文件
2.2.2 压缩文件
2.3 数据类型、空值与编码
2.3.1 数据类型
2.3.2 数据类型间的相互转换
2.3.3 转换策略
2.3.4 隐藏在数据森林中的空值
2.3.5 字符编码
2.4 小结
第 3 章 数据清洗的老黄牛——电子表格和文本编辑器
3.1 电子表格中的数据清洗
3.1.1 Excel的文本分列功能
3.1.2 字符串拆分
3.1.3 字符串拼接
3.2 文本编辑器里的数据清洗
3.2.1 文本调整
3.2.2 列选模式
3.2.3 加强版的查找与替换功能
3.2.4 文本排序与去重处理
3.2.5 Process Lines Containing
3.3 示例项目
3.3.1 第一步:问题陈述
3.3.2 第二步:数据收集
3.3.3 第三步:数据清洗
3.3.4 第四步:数据分析
3.4 小结
第 4 章 讲通用语言——数据转换
4.1 基于工具的快速转换
4.1.1 从电子表格到CSV
4.1.2 从电子表格到JSON
4.1.3 使用phpMyAdmin从SQL语句中生成CSV或JSON
4.2 使用PHP实现数据转换
4.2.1 使用PHP实现SQL到JSON的数据转换
4.2.2 使用PHP实现SQL到CSV的数据转换
4.2.3 使用PHP实现JSON到CSV的数据转换
4.2.4 使用PHP实现CSV到JSO......
评论
发表评论