數據科學概論——從概念到應用

                      數據科學概論——從概念到應用
                      分享
                      掃描下方二維碼分享到微信
                      打開微信,點擊右上角”+“,
                      使用”掃一掃“即可將網頁分享到朋友圈。
                      作者:
                      2022-08
                      版次: 1
                      ISBN: 9787121441332
                      定價: 79.00
                      裝幀: 其他
                      頁數: 448頁
                      • 本書引導讀者從數據科學基本概念出發,全面了解數據科學相關知識,掌握數據科學中數據處理的流程和方法。本書在理論上突出可讀性和完整性,力求兼具一定的廣度和深度;在實踐上強調對常用技術工具的操作性,力求體現數據科學應用的多樣性和代表性。全書共12章,可分為三大部分:第1、2章是數據科學概述部分;第3~6章是數據科學理論基礎和重點工具部分;第7~12章是數據科學全流程的技術與方法部分(包括數據采集、數據存儲與管理、數據可視化、數據分析、數據安全與倫理,以及數據科學的應用與案例)。登錄華信教育資源網(www.hxedu.com.cn)可下載本書涉及的案例與示例的全部代碼和數據集,以及各章PPT和教學大綱等資料。本書可作為高等院校數據科學相關專業的教學用書,也可作為數據科學相關研究從業人員的參考用書。 薛薇,工學碩士,經濟學博士,中國人民大學應用統計學科研究中心研究員,中國人民大學統計學院副教授。主要研究領域:機器學習和文本挖掘、復雜網絡建模等。關注統計和數據挖掘算法及軟件應用。涉足企業客戶終身價值測算,基于文本挖掘的熱點事件主題提取和分類,金融、貿易等復雜網絡動態建模等方面。主要代表性教材:《SPSS統計分析方法及應用》《R語言數據挖掘方法及應用》《R語言:大數據分析中的統計方法及應用》《SPSS Modeler數據挖掘方法及應用》《數據科學概論——從概念到應用》等。 目錄

                          第1章  數據與信息概述1

                        1.1  數據的概念、特征和作用1

                        1.1.1  數據的概念1

                        1.1.2  數據的特征2

                        1.1.3  數據的作用3

                        1.2  數據的尺度與類型3

                        1.2.1  定性數據和定量數據4

                        1.2.2  離散數據和連續數據5

                        1.2.3  結構化數據和非結構化數據5

                        1.3  數據的表格化8

                        1.3.1  個體數據的表格化8

                        1.3.2  批量匯總數據的表格化9

                        1.3.3  統計指標11

                        1.4  數據的數字化12

                        1.4.1  二進制與數字化12

                        1.4.2  文本的數字化13

                        1.4.3  數字的數字化15

                        1.4.4  多媒體的數字化17

                        1.4.5  數字化轉型與數字化經濟18

                        1.5  信息與信息熵19

                        1.5.1  信息熵:不確定性的度量19

                        1.5.2  信息增益:不確定性減少的度量20

                          第2章  數據科學概述22

                        2.1  數據科學的科學觀22

                        2.1.1  從科學高度看數據科學22

                        2.1.2  通過案例初識數據科學23

                        2.2  數據科學概念25

                        2.2.1  數據科學產生的重大技術背景25

                        2.2.2  數據科學產生的典型應用背景25

                        2.2.3  數據科學的定義27

                        2.3  歷史觀察:探討數據科學的發展歷程27

                        2.3.1  古代:從結繩記事到阿拉伯數字27

                        2.3.2  古典:政治算術和國勢學29

                        2.3.3  近代:隨機現象、概率論與數理統計29

                        2.3.4  現代:抽樣與推斷統計31

                        2.3.5  計算機時代:技術革命帶來的繁榮32

                        2.3.6  大數據時代:奠定數據科學基礎33

                        2.4  數據世界:探討數據科學的對象37

                        2.4.1  數據世界和數據科學37

                        2.4.2  數據世界和數字孿生38

                        2.5  DIKW模型:探討數據科學中的若干基本概念39

                        2.5.1  DIKW模型39

                        2.5.2  從DIKW模型看數據科學41

                        2.6  維恩圖:探討數據科學的學科交叉性42

                        2.6.1  文獻中的數據科學維恩圖42

                        2.6.2  數據科學學科交叉性的總結43

                        2.7  從數據到模型:探討數據科學的一般方法45

                        2.7.1  反問題的方法45

                        2.7.2  數據驅動的方法46

                        2.7.3  模型化的方法47

                        2.8  數據處理流程:探討數據科學方法論53

                        2.8.1  傳統理念下的數據處理方法論53

                        2.8.2  計算機時代的數據處理方法論54

                        2.8.3  大數據時代的數據處理方法論56

                        2.9  三維視角:總覽數據科學58

                        2.9.1  從三維視角看數據科學58

                        2.9.2  理論方法維度58

                        2.9.3  處理流程維度60

                        2.9.4  應用領域維度60

                          第3章  數據科學中的計算機基礎61

                        3.1  計算機系統概述61

                        3.1.1  計算機的發展62

                        3.1.2  計算機的種類62

                        3.2  計算機硬件63

                        3.2.1  計算機硬件的組成63

                        3.2.2  計算機硬件的工作原理64

                        3.3  計算機軟件65

                        3.3.1  操作系統65

                        3.3.2  計算機語言66

                        3.3.3  應用軟件68

                        3.4  計算機網絡68

                        3.4.1  局域網、廣域網和因特網69

                        3.4.2  計算機網絡的通信協議71

                        3.5  計算機應用的技術模式72

                        3.5.1  主機/終端模式72

                        3.5.2  客戶機/服務器模式73

                        3.5.3  瀏覽器/服務器模式74

                        3.5.4  云計算模式75

                        3.5.5  對等模式78

                        3.6  計算機應用79

                        3.6.1  科學計算79

                        3.6.2  數據處理與大數據80

                        3.6.3  人工智能81

                        3.6.4  過程控制85

                          第4章  數據科學中的數學與統計學基礎86

                        4.1  微積分與數據科學應用87

                        4.1.1  微積分的產生背景87

                        4.1.2  微積分的基本思想方法88

                        4.1.3  梯度下降法及數據科學應用示例90

                        4.2  線性代數與數據科學應用93

                        4.2.1  向量與向量空間及應用示例93

                        4.2.2  矩陣與線性變換及應用示例95

                        4.2.3  特征值與奇異值及數據科學應用示例99

                        4.3  統計學與數據科學應用103

                        4.3.1  描述統計要點104

                        4.3.2  概率與概率分布要點107

                        4.3.3  推斷統計和多元統計分析要點108

                        4.3.4  貝葉斯思維在數據科學中的應用109

                        4.4  集合論與數據科學的應用113

                        4.4.1  集合論與羅素悖論113

                        4.4.2  粗糙集與數據科學應用示例115

                        4.5  圖論與數據科學的應用120

                        4.5.1  歐拉和哥尼斯堡七橋問題120

                        4.5.2  圖論的發展沿革121

                        4.5.3  圖論與數據科學應用示例122

                          第5章  數據科學中的SQL基礎125

                        5.1  SQL概述125

                        5.1.1  SQL的優點125

                        5.1.2  MySQL和SQL入門127

                        5.2  SQL的數據定義和應用130

                        5.2.1  SQL數據定義語句131

                        5.2.2  SQL數據定義應用133

                        5.3  SQL的數據操縱和應用137

                        5.3.1  SQL數據操縱語句137

                        5.3.2  SQL數據操縱應用137

                        5.4  SQL的數據查詢139

                        5.4.1  SELECT語句的簡單應用139

                        5.4.2  SELECT語句的進階應用145

                        5.4.3  SELECT語句的其他應用150

                        5.5  MySQL的系統管理151

                        5.5.1  MySQL的用戶管理151

                        5.5.2  MySQL的權限管理152

                        5.5.3  MySQL的事務管理153

                        5.5.4  MySQL的文件存儲和日志管理155

                        5.5.5  MySQL的客戶端數據庫管理工具Navicat158

                          第6章  數據科學中的Python基礎160

                        6.1  Python概述160

                        6.1.1  Python的特點160

                        6.1.2  Python的安裝和啟動161

                        6.1.3  第一個Python程序與幫助162

                        6.2  Python基礎164

                        6.2.1  Python的基本數據類型和組織164

                        6.2.2  Python的程序結構和流程控制169

                        6.2.3  異常處理結構173

                        6.3  Python語言進階176

                        6.3.1  面向對象程序設計176

                        6.3.2  模塊與包177

                        6.3.3  Python綜合:chaos混沌態178

                        6.4  NumPy入門181

                        6.4.1  NumPy數組的創建182

                        6.4.2  NumPy數組的訪問185

                        6.4.3  NumPy數組的計算186

                        6.5  Pandas入門190

                        6.5.1  Pandas的數據組織191

                        6.5.2  Pandas的數據加工處理194

                        6.6  Matplotlib入門196

                        6.6.1  Matplotlib的基本繪圖196

                        6.6.2  Matplotlib的參數配置198

                        6.6.3  Matplotlib的子圖設置200

                        6.6.4  Matplotlib的常見統計圖201

                        6.7  Python綜合應用示例:對空氣質量監測數據的分析206

                        6.7.1  空氣質量數據的預處理207

                        6.7.2  空氣質量數據的基本分析209

                        6.7.3  空氣質量數據的可視化212

                          第7章  數據采集217

                        7.1  傳統數據采集方式和技術218

                        7.1.1  普查和統計報表制度218

                        7.1.2  抽樣調查和問卷調查220

                        7.1.3  觀察法和實驗法221

                        7.1.4  傳統數據采集技術224

                        7.2  互聯網數據采集226

                        7.2.1  互聯網數據采集概述227

                        7.2.2  網站運營數據庫和數據分析及采集227

                        7.2.3  網頁埋點和數據采集229

                        7.2.4  開放數據庫和數據采集231

                        7.2.5  搜索引擎和數據采集233

                        7.2.6  網頁爬蟲和數據采集236

                        7.3  物聯網數據采集240

                        7.3.1  物聯網數據采集概述240

                        7.3.2  傳感器和數據采集241

                        7.3.3  衛星通信和數據采集242

                        7.3.4  射頻識別技術、條形碼和數據采集244

                        7.4  數據采集與人工智能245

                        7.4.1  數據標注與數據采集246

                        7.4.2  文本數據采集和挖掘248

                        7.4.3  圖像數據采集和識別249

                          第8章  數據存儲與管理251

                        8.1  數據文件和數據庫系統251

                        8.1.1  數據文件251

                        8.1.2  數據庫系統的概念254

                        8.1.3  關系型數據庫系統和聯機事務處理255

                        8.1.4  數據庫索引技術257

                        8.2  數據倉庫系統260

                        8.2.1  數據倉庫的概念260

                        8.2.2  數據倉庫系統的基本結構261

                        8.2.3  聯機分析處理264

                        8.2.4  知識發現與商業智能266

                        8.3  數據庫系統的技術發展268

                        8.3.1  并行數據庫技術269

                        8.3.2  分布式數據庫技術271

                        8.3.3  NoSQL數據庫系統和NewSQL數據庫系統272

                        8.4  Hadoop大數據系統275

                        8.4.1  什么是Hadoop275

                        8.4.2  HDFS276

                        8.4.3  MapReduce計算框架279

                        8.4.4  Hadoop大數據生態系統280

                        8.5  Spark大數據系統286

                        8.5.1  什么是Spark287

                        8.5.2  Spark大數據生態系統288

                        8.5.3  Spark大數據平臺databricks應用290

                        8.6  Flink大數據系統294

                        8.6.1  流數據294

                        8.6.2  Flink大數據生態系統297

                        8.7  數據湖系統300

                        8.7.1  什么是數據湖系統300

                        8.7.2  數據湖系統的基本功能301

                        8.7.3  典型的數據湖系統302

                          第9章  數據可視化305

                        9.1  數據可視化概述305

                        9.1.1  數據可視化起源和發展305

                        9.1.2  數據可視化元素307

                        9.1.3  數據可視化步驟和原則308

                        9.2  數據可視化一般方法309

                        9.2.1  電子地圖及地圖圖表309

                        9.2.2  高維數據的可視化展現312

                        9.3  數據可視化實現和Tableau應用315

                        9.3.1  數據可視化實現方式316

                        9.3.2  Tableau及其應用317

                        9.4  數據可視化的新發展325

                        9.4.1  計算機圖形學326

                        9.4.2  虛擬現實及相關技術327

                        9.4.3  增強現實技術329

                          第10章  數據分析332

                        10.1  數據分析方法、目標及軟件工具332

                        10.1.1  數據分析方法332

                        10.1.2  數據分析目標337

                        10.1.3  數據分析軟件工具:sklearn簡介338

                        10.2  數據預處理340

                        10.2.1  數據標準化處理340

                        10.2.2  缺失值處理342

                        10.2.3  特征選擇與特征提取344

                        10.3  經典聚類算法347

                        10.3.1  聚類分析概述347

                        10.3.2  層次聚類349

                        10.3.3  K-均值聚類351

                        10.3.4  DBSCAN聚類353

                        10.3.5  聚類分析應用實例355

                        10.4  數據預測:經典統計方法360

                        10.4.1  數據預測中的一般問題360

                        10.4.2  一般線性回歸分析362

                        10.4.3  二項邏輯回歸分析365

                        10.4.4  數據預測應用實例367

                        10.5  數據預測:經典機器學習方法3
                      • 內容簡介:
                        本書引導讀者從數據科學基本概念出發,全面了解數據科學相關知識,掌握數據科學中數據處理的流程和方法。本書在理論上突出可讀性和完整性,力求兼具一定的廣度和深度;在實踐上強調對常用技術工具的操作性,力求體現數據科學應用的多樣性和代表性。全書共12章,可分為三大部分:第1、2章是數據科學概述部分;第3~6章是數據科學理論基礎和重點工具部分;第7~12章是數據科學全流程的技術與方法部分(包括數據采集、數據存儲與管理、數據可視化、數據分析、數據安全與倫理,以及數據科學的應用與案例)。登錄華信教育資源網(www.hxedu.com.cn)可下載本書涉及的案例與示例的全部代碼和數據集,以及各章PPT和教學大綱等資料。本書可作為高等院校數據科學相關專業的教學用書,也可作為數據科學相關研究從業人員的參考用書。
                      • 作者簡介:
                        薛薇,工學碩士,經濟學博士,中國人民大學應用統計學科研究中心研究員,中國人民大學統計學院副教授。主要研究領域:機器學習和文本挖掘、復雜網絡建模等。關注統計和數據挖掘算法及軟件應用。涉足企業客戶終身價值測算,基于文本挖掘的熱點事件主題提取和分類,金融、貿易等復雜網絡動態建模等方面。主要代表性教材:《SPSS統計分析方法及應用》《R語言數據挖掘方法及應用》《R語言:大數據分析中的統計方法及應用》《SPSS Modeler數據挖掘方法及應用》《數據科學概論——從概念到應用》等。
                      • 目錄:
                        目錄

                          第1章  數據與信息概述1

                        1.1  數據的概念、特征和作用1

                        1.1.1  數據的概念1

                        1.1.2  數據的特征2

                        1.1.3  數據的作用3

                        1.2  數據的尺度與類型3

                        1.2.1  定性數據和定量數據4

                        1.2.2  離散數據和連續數據5

                        1.2.3  結構化數據和非結構化數據5

                        1.3  數據的表格化8

                        1.3.1  個體數據的表格化8

                        1.3.2  批量匯總數據的表格化9

                        1.3.3  統計指標11

                        1.4  數據的數字化12

                        1.4.1  二進制與數字化12

                        1.4.2  文本的數字化13

                        1.4.3  數字的數字化15

                        1.4.4  多媒體的數字化17

                        1.4.5  數字化轉型與數字化經濟18

                        1.5  信息與信息熵19

                        1.5.1  信息熵:不確定性的度量19

                        1.5.2  信息增益:不確定性減少的度量20

                          第2章  數據科學概述22

                        2.1  數據科學的科學觀22

                        2.1.1  從科學高度看數據科學22

                        2.1.2  通過案例初識數據科學23

                        2.2  數據科學概念25

                        2.2.1  數據科學產生的重大技術背景25

                        2.2.2  數據科學產生的典型應用背景25

                        2.2.3  數據科學的定義27

                        2.3  歷史觀察:探討數據科學的發展歷程27

                        2.3.1  古代:從結繩記事到阿拉伯數字27

                        2.3.2  古典:政治算術和國勢學29

                        2.3.3  近代:隨機現象、概率論與數理統計29

                        2.3.4  現代:抽樣與推斷統計31

                        2.3.5  計算機時代:技術革命帶來的繁榮32

                        2.3.6  大數據時代:奠定數據科學基礎33

                        2.4  數據世界:探討數據科學的對象37

                        2.4.1  數據世界和數據科學37

                        2.4.2  數據世界和數字孿生38

                        2.5  DIKW模型:探討數據科學中的若干基本概念39

                        2.5.1  DIKW模型39

                        2.5.2  從DIKW模型看數據科學41

                        2.6  維恩圖:探討數據科學的學科交叉性42

                        2.6.1  文獻中的數據科學維恩圖42

                        2.6.2  數據科學學科交叉性的總結43

                        2.7  從數據到模型:探討數據科學的一般方法45

                        2.7.1  反問題的方法45

                        2.7.2  數據驅動的方法46

                        2.7.3  模型化的方法47

                        2.8  數據處理流程:探討數據科學方法論53

                        2.8.1  傳統理念下的數據處理方法論53

                        2.8.2  計算機時代的數據處理方法論54

                        2.8.3  大數據時代的數據處理方法論56

                        2.9  三維視角:總覽數據科學58

                        2.9.1  從三維視角看數據科學58

                        2.9.2  理論方法維度58

                        2.9.3  處理流程維度60

                        2.9.4  應用領域維度60

                          第3章  數據科學中的計算機基礎61

                        3.1  計算機系統概述61

                        3.1.1  計算機的發展62

                        3.1.2  計算機的種類62

                        3.2  計算機硬件63

                        3.2.1  計算機硬件的組成63

                        3.2.2  計算機硬件的工作原理64

                        3.3  計算機軟件65

                        3.3.1  操作系統65

                        3.3.2  計算機語言66

                        3.3.3  應用軟件68

                        3.4  計算機網絡68

                        3.4.1  局域網、廣域網和因特網69

                        3.4.2  計算機網絡的通信協議71

                        3.5  計算機應用的技術模式72

                        3.5.1  主機/終端模式72

                        3.5.2  客戶機/服務器模式73

                        3.5.3  瀏覽器/服務器模式74

                        3.5.4  云計算模式75

                        3.5.5  對等模式78

                        3.6  計算機應用79

                        3.6.1  科學計算79

                        3.6.2  數據處理與大數據80

                        3.6.3  人工智能81

                        3.6.4  過程控制85

                          第4章  數據科學中的數學與統計學基礎86

                        4.1  微積分與數據科學應用87

                        4.1.1  微積分的產生背景87

                        4.1.2  微積分的基本思想方法88

                        4.1.3  梯度下降法及數據科學應用示例90

                        4.2  線性代數與數據科學應用93

                        4.2.1  向量與向量空間及應用示例93

                        4.2.2  矩陣與線性變換及應用示例95

                        4.2.3  特征值與奇異值及數據科學應用示例99

                        4.3  統計學與數據科學應用103

                        4.3.1  描述統計要點104

                        4.3.2  概率與概率分布要點107

                        4.3.3  推斷統計和多元統計分析要點108

                        4.3.4  貝葉斯思維在數據科學中的應用109

                        4.4  集合論與數據科學的應用113

                        4.4.1  集合論與羅素悖論113

                        4.4.2  粗糙集與數據科學應用示例115

                        4.5  圖論與數據科學的應用120

                        4.5.1  歐拉和哥尼斯堡七橋問題120

                        4.5.2  圖論的發展沿革121

                        4.5.3  圖論與數據科學應用示例122

                          第5章  數據科學中的SQL基礎125

                        5.1  SQL概述125

                        5.1.1  SQL的優點125

                        5.1.2  MySQL和SQL入門127

                        5.2  SQL的數據定義和應用130

                        5.2.1  SQL數據定義語句131

                        5.2.2  SQL數據定義應用133

                        5.3  SQL的數據操縱和應用137

                        5.3.1  SQL數據操縱語句137

                        5.3.2  SQL數據操縱應用137

                        5.4  SQL的數據查詢139

                        5.4.1  SELECT語句的簡單應用139

                        5.4.2  SELECT語句的進階應用145

                        5.4.3  SELECT語句的其他應用150

                        5.5  MySQL的系統管理151

                        5.5.1  MySQL的用戶管理151

                        5.5.2  MySQL的權限管理152

                        5.5.3  MySQL的事務管理153

                        5.5.4  MySQL的文件存儲和日志管理155

                        5.5.5  MySQL的客戶端數據庫管理工具Navicat158

                          第6章  數據科學中的Python基礎160

                        6.1  Python概述160

                        6.1.1  Python的特點160

                        6.1.2  Python的安裝和啟動161

                        6.1.3  第一個Python程序與幫助162

                        6.2  Python基礎164

                        6.2.1  Python的基本數據類型和組織164

                        6.2.2  Python的程序結構和流程控制169

                        6.2.3  異常處理結構173

                        6.3  Python語言進階176

                        6.3.1  面向對象程序設計176

                        6.3.2  模塊與包177

                        6.3.3  Python綜合:chaos混沌態178

                        6.4  NumPy入門181

                        6.4.1  NumPy數組的創建182

                        6.4.2  NumPy數組的訪問185

                        6.4.3  NumPy數組的計算186

                        6.5  Pandas入門190

                        6.5.1  Pandas的數據組織191

                        6.5.2  Pandas的數據加工處理194

                        6.6  Matplotlib入門196

                        6.6.1  Matplotlib的基本繪圖196

                        6.6.2  Matplotlib的參數配置198

                        6.6.3  Matplotlib的子圖設置200

                        6.6.4  Matplotlib的常見統計圖201

                        6.7  Python綜合應用示例:對空氣質量監測數據的分析206

                        6.7.1  空氣質量數據的預處理207

                        6.7.2  空氣質量數據的基本分析209

                        6.7.3  空氣質量數據的可視化212

                          第7章  數據采集217

                        7.1  傳統數據采集方式和技術218

                        7.1.1  普查和統計報表制度218

                        7.1.2  抽樣調查和問卷調查220

                        7.1.3  觀察法和實驗法221

                        7.1.4  傳統數據采集技術224

                        7.2  互聯網數據采集226

                        7.2.1  互聯網數據采集概述227

                        7.2.2  網站運營數據庫和數據分析及采集227

                        7.2.3  網頁埋點和數據采集229

                        7.2.4  開放數據庫和數據采集231

                        7.2.5  搜索引擎和數據采集233

                        7.2.6  網頁爬蟲和數據采集236

                        7.3  物聯網數據采集240

                        7.3.1  物聯網數據采集概述240

                        7.3.2  傳感器和數據采集241

                        7.3.3  衛星通信和數據采集242

                        7.3.4  射頻識別技術、條形碼和數據采集244

                        7.4  數據采集與人工智能245

                        7.4.1  數據標注與數據采集246

                        7.4.2  文本數據采集和挖掘248

                        7.4.3  圖像數據采集和識別249

                          第8章  數據存儲與管理251

                        8.1  數據文件和數據庫系統251

                        8.1.1  數據文件251

                        8.1.2  數據庫系統的概念254

                        8.1.3  關系型數據庫系統和聯機事務處理255

                        8.1.4  數據庫索引技術257

                        8.2  數據倉庫系統260

                        8.2.1  數據倉庫的概念260

                        8.2.2  數據倉庫系統的基本結構261

                        8.2.3  聯機分析處理264

                        8.2.4  知識發現與商業智能266

                        8.3  數據庫系統的技術發展268

                        8.3.1  并行數據庫技術269

                        8.3.2  分布式數據庫技術271

                        8.3.3  NoSQL數據庫系統和NewSQL數據庫系統272

                        8.4  Hadoop大數據系統275

                        8.4.1  什么是Hadoop275

                        8.4.2  HDFS276

                        8.4.3  MapReduce計算框架279

                        8.4.4  Hadoop大數據生態系統280

                        8.5  Spark大數據系統286

                        8.5.1  什么是Spark287

                        8.5.2  Spark大數據生態系統288

                        8.5.3  Spark大數據平臺databricks應用290

                        8.6  Flink大數據系統294

                        8.6.1  流數據294

                        8.6.2  Flink大數據生態系統297

                        8.7  數據湖系統300

                        8.7.1  什么是數據湖系統300

                        8.7.2  數據湖系統的基本功能301

                        8.7.3  典型的數據湖系統302

                          第9章  數據可視化305

                        9.1  數據可視化概述305

                        9.1.1  數據可視化起源和發展305

                        9.1.2  數據可視化元素307

                        9.1.3  數據可視化步驟和原則308

                        9.2  數據可視化一般方法309

                        9.2.1  電子地圖及地圖圖表309

                        9.2.2  高維數據的可視化展現312

                        9.3  數據可視化實現和Tableau應用315

                        9.3.1  數據可視化實現方式316

                        9.3.2  Tableau及其應用317

                        9.4  數據可視化的新發展325

                        9.4.1  計算機圖形學326

                        9.4.2  虛擬現實及相關技術327

                        9.4.3  增強現實技術329

                          第10章  數據分析332

                        10.1  數據分析方法、目標及軟件工具332

                        10.1.1  數據分析方法332

                        10.1.2  數據分析目標337

                        10.1.3  數據分析軟件工具:sklearn簡介338

                        10.2  數據預處理340

                        10.2.1  數據標準化處理340

                        10.2.2  缺失值處理342

                        10.2.3  特征選擇與特征提取344

                        10.3  經典聚類算法347

                        10.3.1  聚類分析概述347

                        10.3.2  層次聚類349

                        10.3.3  K-均值聚類351

                        10.3.4  DBSCAN聚類353

                        10.3.5  聚類分析應用實例355

                        10.4  數據預測:經典統計方法360

                        10.4.1  數據預測中的一般問題360

                        10.4.2  一般線性回歸分析362

                        10.4.3  二項邏輯回歸分析365

                        10.4.4  數據預測應用實例367

                        10.5  數據預測:經典機器學習方法3
                      查看詳情
                      12
                      相關圖書 / 更多
                      实拍会所推油54分钟免费观看