拥有 数据分析 标签的文章 共 16 条数据

NumPy攻略:Python科学计算与数据分析 [印尼] Ivan Idris著 张崇明译 PDF下载
编程书籍

NumPy攻略:Python科学计算与数据分析 [印尼] Ivan Idris著 张崇明译 PDF下载

676次浏览 0条评论

本书带领读者了解熟悉当下最流行的科学计算库NumPy的方方面面。书中不仅介绍了NumPy的安装、使用和各种相关概念,还介绍了如何利用这一最新的开源软件库,以尽可能接近传统数学语言的方式,编写可读性好、实现效率高和运行速度快的代码。最后还探究了几个和NumPy相关的科学计算项目。此外,本书将为你掌握NumPy数组和通用函数打下坚实的基础,也会通过实例教你用Matplotlib绘图,并了解和SciPy相关的项目。本书将帮助你:• 学习高级索引技术和线性代数知识• 了解数组形状及图像大小的调整• 探察广播机制和直方图• 分析NumPy代码并用可视化的方式表示分析结果• 用Cython为代码提速• 使用数组接口共享数据• 使用通用函数和互操作功能• 学习Matplotlib以及经常和NumPy同时使用的SciPy目 录 第1章 使用IPython  1 1.1  引言  1 1.2  安装IPython  2 1.2.1  具体步骤  2 1.2.2  攻略小结  3 1.3  使用IPython的shell  4 1.3.1  具体步骤  4 1.3.2  攻略小结  6 1.4  阅读手

图灵原创 人人都是数据分析师:Tableau应用实战 高清文字版PDF下载
编程书籍

图灵原创 人人都是数据分析师:Tableau应用实战 高清文字版PDF下载

538次浏览 0条评论

本书基于Tabelau最新版本9.1编写,全面介绍了Tableau的核心功能,包括数据连接与编辑、图形展示与编辑功能,如何与R等工具进行集成,如何在服务器上进行发布管理等内容,而且广泛覆盖数据获取与管理、基础与高级图形分析、地图分析、交互分析与数据挖掘、图表集成整合与分享发布等主要内容,方便大家快速掌握敏捷分析方法与技术。第1章 Tableau入门  11.1 敏捷商务智能  11.2 数据可视化明星Tableau  21.3 Tableau的主要特性  31.4 Tableau的产品体系  51.5 Tableau的工作区  61.5.1 工作表工作区  61.5.2 仪表板工作区  81.5.3 故事工作区  91.5.4 菜单栏和工具栏  101.6 Tableau的文件管理  12第2章 典型应用场景  142.1 数据准备  142.2 认识Tableau数据  162.2.1 数据角色  162.2.2 字段类型  182.2.3 字段类型转换  182.3 创建视图  192.3.1 行列功能区  202.3.2 标记卡  232.3.3 筛选器  292.3.4 页面 

图灵新知 统计学七支柱 高清文字版PDF下载
编程书籍

图灵新知 统计学七支柱 高清文字版PDF下载

734次浏览 0条评论

本书介绍了统计学的七个基本思想——聚合、信息、似然、相互比较、回归、设计、残差,从其由来到引入,从基本概念到对“统计”这门学科的深远影响,并由此深入阐述统计学的科学本质。版权声明 阅读 献词 阅读 前言 阅读 第 1 章 聚合:从表格和均值到最小二乘 第 2 章 信息:度量与变化率 第 3 章 似然:概率尺度上的校准 第 4 章 相互比较:作为标准的样本内变异 第 5 章 回归:多元分析、贝叶斯推断和因果推断 第 6 章 设计:实验方案和随机化的作用 第 7 章 残差:科学逻辑、模型比较以及诊断展示 结论

图灵新知 别拿相关当因果!因果关系简易入门 高清文字版PDF下载
编程书籍

图灵新知 别拿相关当因果!因果关系简易入门 高清文字版PDF下载

573次浏览 0条评论

本书是写给普通人的因果逻辑入门书,旨在帮助读者培养严谨的思维方式,在不借助任何专业知识的前提下,准确定位问题。主要内容包括:认识原因,对原因的理解和运用,如何只通过观察找到原因,大数据集与原因的关系,因果关系相关实验,如何利用因果关系来制定有效的干预措施,研究因果关系的意义。本书适合所有对探究事件真相感兴趣的读者,无须统计学等专业背景。前言  ix 第1章 引子  1 因果关系的概念以及寻找因果关系的方法从何而来? 1.1 何为原因  5 1.2 怎样才能找到原因  10 1.3 为什么需要原因  14 1.4 接下来……  19 第2章 心理  21 人们是如何寻找原因的? 2.1 原因的寻找与使用  23 2.1.1 感知  24 2.1.2 推理与论证  27 2.2 责任的划分  34 2.3 文化  37 2.4 人的局限性  40 第3章 相关性  45 为什么有那么多因果关系被搞错? 3.1 相关性是什么  48 3.1.1 没有变化就没有相关性  49 3.1.2 相关性的测量与解释  51 3.2 相关性的用途  58 3.3 为什么相关性不是因果关系  61 3.4

图灵程序设计丛书《学习R》高清文字版PDF下载
编程书籍

图灵程序设计丛书《学习R》高清文字版PDF下载

552次浏览 0条评论

本书分为上下两部分,旨在指导你如何使用R,并提供练习的机会。上半部分主要介绍R的技术细节和使用技巧。每章都简要介绍了一组不同的数据类型(例如第4章介绍向量、矩阵和数组)或概念(例如第8章介绍分支和循环)。下半部分更侧重实践,展示了从输入数据到发布结果这一标准的数据分析流程。即使你没有任何编程基础,也能顺利阅读本书。编写简单的R程序,知道R语言能做什么使用向量、数组、列表、数据框和字符串等数据类型掌握条件语句以及分支和循环控制语句应用R的扩展包,将你自己的工作成果打包发给其他人清理从各种来源导入的数据通过可视化和汇总统计理解数据使用统计模型传递关于数据的定量判断并进行预测了解编写数据分析代码时出现错误的应对措施译者序  XII 前言  XIII 第一部分 R语言 第1章 简介  2 1.1 本章目标  2 1.2 R是什么  2 1.3 安装R  3 1.4 选择一个IDE  4 1.4.1 Emacs+ESS  4 1.4.2 Eclipse/Architect  4 1.4.3 RStudio  5 1.4.4 Revolution-R  5 1.4.5 Live-R  5 1.4.

图灵程序设计丛书《Python数据分析基础教程(第2版):NumPy学习指南》高清文字版PDF下载
编程书籍

图灵程序设计丛书《Python数据分析基础教程(第2版):NumPy学习指南》高清文字版PDF下载

572次浏览 0条评论

NumPy是一个优秀的科学计算库,提供了很多实用的数学函数、强大的多维数组对象和优异的计算性能,不仅可以取代Matlab和Mathematica的许多功能,而且业已成为Python科学计算生态系统的重要组成部分。但与这些商业产品不同,它是免费的开源软件。本书从NumPy安装讲起,逐渐过渡到数组对象、常用函数、矩阵运算、线性代数、金融函数、窗函数、质量控制等内容,致力于向初中级Python编程人员全面讲述NumPy及其使用。另外,通过书中丰富的示例,你还将学会Matplotlib绘图,并结合使用其他Python科学计算库(如SciPy和Scikits),让工作更有成效,让代码更加简洁而高效。主要内容:在不同平台安装NumPy;用简洁高效的NumPy代码实现高性能计算;使用功能强大的通用函数;使用NumPy数组和矩阵;用NumPy模块轻松执行复杂的数值计算;Matplotlib绘图;NumPy代码测试。第1章 NumPy快速入门  1 1.1  Python  1 1.2  动手实践:在不同的操作系统上安装Python  1 1.3  Windows  2 1.4  动手实践:在Windo

图灵程序设计丛书《Python数据科学手册》高清文字版PDF下载
编程书籍

图灵程序设计丛书《Python数据科学手册》高清文字版PDF下载

709次浏览 0条评论

本书是对以数据深度需求为中心的科学、研究以及针对计算和统计方法的参考书。本书共五章,每章介绍一到两个Python数据科学中的重点工具包。首先从IPython和Jupyter开始,它们提供了数据科学家需要的计算环境;第2章讲解能提供ndarray对象的NumPy,它可以用Python高效地存储和操作大型数组;第3章主要涉及提供DataFrame对象的Pandas,它可以用Python高效地存储和操作带标签的/列式数据;第4章的主角是Matplotlib,它为Python提供了许多数据可视化功能;第5章以Scikit-Learn为主,这个程序库为最重要的机器学习算法提供了高效整洁的Python版实现。本书适合有编程背景,并打算将开源Python工具用作分析、操作、可视化以及学习数据的数据科学研究人员。译者序 xiii 前言 xv 第1 章 IPython:超越Python 1 1.1 shell还是Notebook 1 1.1.1 启动IPython shell 2 1.1.2 启动Jupyter Notebook 2 1.2 IPython的帮助和文档 3 1.2.1 用符号? 获取文档

图灵程序设计丛书《Python数据分析基础》高清文字版PDF下载
编程书籍

图灵程序设计丛书《Python数据分析基础》高清文字版PDF下载

614次浏览 0条评论

想深入应用手中的数据?还是想在上千份文件上重复同样的分析过程?没有编程经验的非程序员们如何能在最短的时间内学会用当今炙手可热的Python语言进行数据分析?来自Facebook的数据专家Clinton Brownley可以帮您解决上述问题。在他的这本书里,读者将能掌握基本Python编程方法,学会编写出处理电子表格和数据库中的数据的脚本,并了解使用Python模块来解析文件、分组数据和生成统计量的方法。学习基础语法,创建并运行自己的Python脚本读取和解析CSV文件读取多个Excel工作表和工作簿执行数据库操作搜索特定记录、分组数据和解析文本文件建立统计图并绘图生成描述性统计量并估计回归模型和分类模型在Windows和Mac环境下按计划自动运行脚本前言  xi 第1章 Python 基础  1 1.1 创建 Python 脚本  1 1.2 运行 Python 脚本  3 1.3 与命令行进行交互的几项技巧  6 1.4 Python 语言基础要素  10 1.4.1 数值  10 1.4.2 字符串  12 1.4.3 正则表达式与模式匹配  16 1.4.4 日期  19 1.4

图灵程序设计丛书《Python数据处理》 张亮译 高清文字版PDF下载
编程书籍

图灵程序设计丛书《Python数据处理》 张亮译 高清文字版PDF下载

619次浏览 0条评论

本书采用基于项目的方法,介绍用Python完成数据获取、数据清洗、数据探索、数据呈现、数据规模化和自动化的过程。主要内容包括:Python基础知识,如何从CSV、Excel、XML、JSON和PDF文件中提取数据,如何获取与存储数据,各种数据清洗与分析技术,数据可视化方法,如何从网站和API中提取数据。前言  xiii 第1章 Python 简介  1 1.1 为什么选择Python  4 1.2 开始使用Python  4 1.2.1 Python 版本选择  5 1.2.2 安装Python  6 1.2.3 测试Python  9 1.2.4 安装pip  11 1.2.5 安装代码编辑器  12 1.2.6 安装IPython(可选)  13 1.3 小结  13 第2章 Python 基础  14 2.1 基本数据类型  15 2.1.1 字符串  15 2.1.2 整数和浮点数  15 2.2 数据容器  18 2.2.1 变量  18 2.2.2 列表  21 2.2.3 字典  22 2.3 各种数据类型的用途  23 2.3.1 字符串方法:字符串能做什么  24 2

图灵程序设计丛书《数据分析实战》高清文字版PDF下载
编程书籍

图灵程序设计丛书《数据分析实战》高清文字版PDF下载

767次浏览 0条评论

本书由实战经验丰富的两位数据分析师执笔,首先介绍了商业领域里通用的数据分析框架,然后根据该框架,结合8个真实的案例,详细解说了通过数据分析解决各种商业问题的流程,让读者在解决问题的过程中学习各种数据分析方法,包括柱状图、交叉列表统计、A/B测试、多元回归分析、逻辑回归分析、主成分分析、聚类、决策树分析、机器学习等。特别是书中使用的数据都是未经清洗的原始数据,能够让读者了解真实的数据分析流程,避免纸上谈兵。第1章 数据科学家的工作  1 1.1 什么是数据科学家  2 1.2 3种类型的数据科学家  5 1.3 数据科学家的现状  8 第2章 商业数据分析流程  9 2.1 数据分析的5个流程  10 2.2 现状和预期  12 2.3 发现问题  13 2.4 数据的收集和加工  19 2.5 数据分析  24 2.6 解决对策  27 2.7 小结  29 [分析基础]篇 第3章 案例1—柱状图 为什么销售额会减少  35 3.1 现状和预期  36 3.2 发现问题  38 3.3 数据的收集和加工  39 3.4 数据分析  46 3.5 解决对策  49 3.6 小结  50

图灵程序设计丛书《数据科学入门》高清文字版PDF下载
编程书籍

图灵程序设计丛书《数据科学入门》高清文字版PDF下载

737次浏览 0条评论

数据科学是一个蓬勃发展、前途无限的行业,有人将数据科学家称为“21世纪头号性感职业”。本书从零开始讲解数据科学工作,教授数据科学工作所必需的黑客技能,并带领读者熟悉数据科学的核心知识——数学和统计学。作者选择了功能强大、简单易学的Python语言环境,亲手搭建工具和实现算法,并精心挑选了注释良好、简洁易读的实现范例。书中涵盖的所有代码和数据都可以在GitHub上下载。通过阅读本书,你可以:学到一堂Python速成课;学习线性代数、统计和概率论的基本方法,了解它们是怎样应用在数据科学中的;掌握如何收集、探索、清理、转换和操作数据;深入理解机器学习的基础;运用k-近邻、朴素贝叶斯、线性回归和逻辑回归、决策树、神经网络和聚类等各种数据模型;探索推荐系统、自然语言处理、网络分析、MapReduce和数据库。前言  xiii 第1章 导论  1 1.1 数据的威力  1 1.2 什么是数据科学  1 1.3 激励假设:DataSciencester  2 1.3.1 寻找关键联系人  3 1.3.2 你可能知道的数据科学家  5 1.3.3 工资与工作年限  8 1.3.4 付费账户  10 1

图灵程序设计丛书《数据科学实战》高清文字版PDF下载
编程书籍

图灵程序设计丛书《数据科学实战》高清文字版PDF下载

884次浏览 0条评论

• 统计推断、探索性数据分析(EDA)及数据科学工作流程• 算法• 垃圾邮件过滤、朴素贝叶斯和数据清理• 逻辑回归• 金融建模• 推荐引擎和因果关系• 数据可视化• 社交网络与数据新闻• 数据工程、MapReduce、Pregel和Hadoop作者介绍   XII 关于封面图  XIII 前言  XIV 第1章 简介:什么是数据科学  1 1.1 大数据和数据科学的喧嚣  1 1.2 冲出迷雾  2 1.3 为什么是现在  3 1.4 数据科学的现状和历史  5 1.5 数据科学的知识结构  8 1.6 思维实验:元定义  10 1.7 什么是数据科学家  11 1.7.1 学术界对数据科学家的定义  12 1.7.2 工业界对数据科学家的定义  12 第2章 统计推断、探索性数据分析和数据科学工作流程  14 2.1 大数据时代的统计学思考  14 2.1.1 统计推断  15 2.1.2 总体和样本  16 2.1.3 大数据的总体和样本  17 2.1.4 大数据意味着大胆的假设  19 2.1.5 建模  21 2.2 探索性数据分析  26 2.2.1 探索性数据分析的哲学 

图灵程序设计丛书《干净的数据:数据清洗入门与实践》高清文字版PDF下载
编程书籍

图灵程序设计丛书《干净的数据:数据清洗入门与实践》高清文字版PDF下载

574次浏览 0条评论

数据清洗是数据挖掘与分析过程中不可缺少的一个环节,但因为数据类型极其复杂,传统的清洗脏数据工作单调乏味且异常辛苦。如果能利用正确的工具和方法,就可以让数据清洗工作事半功倍。本书从文件格式、数据类型、字符编码等基本概念讲起,通过真实的示例,探讨如何提取和清洗关系型数据库、网页文件和PDF文档中的数据。最后提供了两个真实的项目,让读者将所有数据清洗技术付诸实践,完成整个数据科学过程。如果你是一位数据科学家,或者从事数据科学工作,哪怕是位新手,只要对数据清洗有兴趣,那么本书就适合你阅读!第1章  为什么需要清洗数据  1 1.1  新视角  1 1.2  数据科学过程  2 1.3  传达数据清洗工作的内容  3 1.4  数据清洗环境  4 1.5  入门示例  5 1.6  小结  9 第2章  基础知识——格式、 类型与编码  11 2.1  文件格式  11 2.1.1  文本文件与二进制文件  11 2.1.2  常见的文本文件格式  14 2.1.3  分隔格式  14 2.2  归档与压缩  20 2.2.1  归档文件  20 2.2.2  压缩文件  21 2.3  数据类

豆瓣高分 图灵程序设计丛书《R数据科学》高清文字版PDF下载
编程书籍

豆瓣高分 图灵程序设计丛书《R数据科学》高清文字版PDF下载

580次浏览 0条评论

本书的目标是教会读者使用最重要的数据科学工具,从而为实施数据科学奠定坚实的基础。读完本书后,你将掌握R语言的精华,并能够熟练使用多种工具来解决各种数据科学难题。每一章都按照这样的顺序组织内容:先给出一些引人入胜的示例,以便你可以整体了解这一章的内容,然后再深入细节。本书的每一节都配有习题,以帮助你实践所学到的知识。前言  XV 第一部分 探索 第1章 使用ggplot2进行数据可视化  3 1.1 简介  3 1.2 第一步  4 1.2.1 mpg数据框  4 1.2.2 创建ggplot图形  5 1.2.3 绘图模板  5 1.2.4 练习  6 1.3 图形属性映射  6 1.4 常见问题  10 1.5 分面  11 1.6 几何对象  13 1.7 统计变换  18 1.8 位置调整  21 1.9 坐标系  25 1.10 图形分层语法  27 第2章 工作流:基础  29 2.1 代码基础  29 2.2 对象名称  30 2.3 函数调用  30 第3章 使用dplyr进行数据转换  33 3.1 简介  33 3.1.1 准备工作  33 3.1.2 nycflig

图灵程序设计丛书《R语言实战(第2版)》 高清文字版PDF下载
编程书籍

图灵程序设计丛书《R语言实战(第2版)》 高清文字版PDF下载

579次浏览 0条评论

本书注重实用性,是一本全面而细致的R指南,高度概括了该软件和它的强大功能,展示了使用的统计示例,且对于难以用传统方法处理的凌乱、不完整和非正态的数据给出了优雅的处理方法。作者不仅仅探讨统计分析,还阐述了大量探索和展示数据的图形功能。新版做了大量更新和修正,新增了近200页内容,介绍数据挖掘、预测性分析和高级编程。第一部分 入门 第1章 R语言介绍  3 1.1 为何要使用R  4 1.2 R的获取和安装  6 1.3 R的使用  6 1.3.1 新手上路  7 1.3.2 获取帮助  10 1.3.3 工作空间  10 1.3.4 输入和输出  12 1.4 包  13 1.4.1 什么是包  14 1.4.2 包的安装  14 1.4.3 包的载入  14 1.4.4 包的使用方法  14 1.5 批处理  15 1.6 将输出用为输入:结果的重用  16 1.7 处理大数据集  16 1.8 示例实践  16 1.9 小结  18 第2章 创建数据集  19 2.1 数据集的概念  19 2.2 数据结构  20 2.2.1 向量  21 2.2.2 矩阵  22 2.2.3 数组

图灵程序设计丛书《Hadoop数据分析》高清文字版PDF下载
编程书籍

图灵程序设计丛书《Hadoop数据分析》高清文字版PDF下载

807次浏览 0条评论

通过提供分布式数据存储和并行计算框架,Hadoop已经从一个集群计算的抽象演化成了一个大数据的操作系统。本书旨在通过以可读且直观的方式提供集群计算和分析的概览,为数据科学家深入了解特定主题领域铺平道路,从数据科学家的视角介绍Hadoop集群计算和分析。本书分为两大部分,第一部分从非常高的层次介绍分布式计算,讨论如何在集群上运行计算;第二部分则重点关注数据科学家应该了解的工具和技术,意在为各种分析和大规模数据管理提供动力。前言  ix 第一部分 分布式计算入门 第1章 数据产品时代  2 1.1 什么是数据产品  2 1.2 使用Hadoop构建大规模数据产品  4 1.2.1 利用大型数据集  4 1.2.2 数据产品中的Hadoop  5 1.3 数据科学流水线和Hadoop生态系统  6 1.4 小结  8 第2章 大数据操作系统  9 2.1 基本概念  10 2.2 Hadoop架构  11 2.2.1 Hadoop集群  12 2.2.2 HDFS  14 2.2.3 YARN  15 2.3 使用分布式文件系统  16 2.3.1 基本的文件系统操作  16 2.3.2 H