技术教育社区
www.teccses.org

数据科学入门

封面

作者:Sam Lau,Joseph Gonza

页数:20,573页

出版社:东南大学出版社

出版日期:2024

ISBN:9787576612240

电子书格式:pdf/epub/txt

内容简介

本书是 本兼顾编程和统计学基础技能的书籍,内容涵盖了整个数据科学生命周期。它面向那些希望成为数据科学家或与数据科学家合作的读者,以及希望跨越“技术/非技术”界限的数据分析师。如果具备基本的Python编程知识,你将学到如何使用像pandas这样的行业标准工具来处理数据。

作者简介

山姆·刘,Sam Lau是加州大学圣地亚哥分校HaIicioglu数据科学研究所的助理教学教授。Sam拥有十年的教学经验,并曾在加州大学伯克利分校和加州大学圣地亚哥分校设计并教授一流的数据科学课程。

本书特色

作为一名有抱负的数据科学家,你理解为什么组织机构的重要决策都依赖于数据 —— 无论是设计网站的公司、决定如何改善服务的城市,还是致力于阻止疾病传播的科学家组织。你需要具备将一堆杂乱的数据提炼成可操作的洞见所需的技能。我们称之为数据科学生命周期:收集、整理、分析数据并从中得出结论的过程。

目录

Preface
Part I.The Data Science Lifecycle
1.The Data Science Lifecycle
2.Questions and Data Scope
3.Simulation and Data Design
4.Modeling with Summary Statistics
5.Case Study: Why Is My Bus Always Late
Part II.Rectangular Data
6.Working with Dataframes Using pandas
7.Working with Relations Using SQL
Part III.Understanding The Data
8.Wrangling Files
9.Wrangling Dataframes
10.Exploratory Data Analysis
11.Data Visualization
12.Case Study: How Accurate Are Air Quality Measurements
Part IV.Other Data Sources
13.Working with Text
14.Data Exchange

下载地址

立即下载

(解压密码:www.teccses.org)

Article Title:《数据科学入门》
Article link:https://www.teccses.org/1578773.html