<code id="cq0yc"><menu id="cq0yc"></menu></code>
<noscript id="cq0yc"></noscript>
<center id="cq0yc"><small id="cq0yc"></small></center>
<optgroup id="cq0yc"></optgroup>
<center id="cq0yc"></center>
<optgroup id="cq0yc"></optgroup>

數據挖掘:原理與應用

數據挖掘:原理與應用
分享
掃描下方二維碼分享到微信
打開微信,點擊右上角”+“,
使用”掃一掃“即可將網頁分享到朋友圈。
作者: , ,
2021-12
版次: 1
ISBN: 9787111696308
定價: 79.00
裝幀: 其他
開本: 16開
紙張: 膠版紙
字數: 400千字
  • 目前,數據挖掘類課程已成為我國新工科教育的數據科學思維提升課程,成為信息、電子等各類工科專業本科生與研究生的必修課。本書深入淺出地介紹了數據挖掘和數據分析的知識、常用的各類算法;系統梳理與比較各類算法的優缺點與適用場景。本書內容結合作者多年的科研和教學經驗,大量案例來自作者的項目和科研成果,不僅適合作為大數據特色類專業的本科生和研究生教材,同時也適合機械、航空等其他工科專業的入門與自學教材,還可作為各專業本科生與研究生考試復習的參考資料。 前言

    第1章 緒論1

    1.1 數據挖掘的出現1

    1.2 為什么要學習數據挖掘1

    1.2.1 數據爆炸但知識貧乏1

    1.2.2 從商業數據到商業智能的進化2

    1.2.3 科學發展范式2

    1.3 什么是數據挖掘3

    1.3.1 數據挖掘的出現3

    1.3.2 數據挖掘的定義3

    1.3.3 數據的含義4

    1.3.4 信息的含義4

    1.3.5 知識的含義5

    1.3.6 數據、信息、知識的關系5

    1.3.7 數據挖掘過程5

    1.3.8 數據挖掘的關聯課程6

    1.4 數據挖掘的內容7

    1.4.1 關聯規則挖掘7

    1.4.2 分類7

    1.4.3 聚類9

    1.4.4 回歸10

    1.5 本章小結10

    第2章 認識數據11

    2.1 數據的基本概念11

    2.1.1 數據對象11

    2.1.2 數據屬性12

    2.1.3 屬性的類型13

    2.1.4 屬性類型的對比14

    2.1.5 離散屬性與連續屬性14

    2.2 數據的基本統計方法15

    2.2.1 中心化趨勢統計量:均值、中位數和眾數15

    2.2.2 離散度度量16

    2.2.3 分布形狀度量17

    2.3 數據的基本可視化方法18

    2.3.1 箱線圖可視化18

    2.3.2 直方圖可視化19

    2.3.3 散點圖可視化19

    2.4 數據相似性的計算方法20

    2.4.1 數據相似性和相異性度量的基本概念20

    2.4.2 標稱屬性的鄰近性度量21

    2.4.3 二值屬性的鄰近性度量22

    2.4.4 序數屬性的鄰近性度量23

    2.4.5 數值屬性的鄰近性度量23

    2.4.6 混合類型屬性的鄰近性度量25

    2.4.7 余弦相似性25

    2.5 本章小結26

    第3章 數據預處理27

    3.1 數據質量27

    3.2 數據預處理的主要任務27

    3.2.1 數據清理27

    3.2.2 數據集成28

    3.2.3 數據規約32

    3.2.4 數據規范化和數據離散化37

    3.3 特征構造38

    3.3.1 為什么需要特征構造38

    3.3.2 基本特征構造法38

    3.3.3 時間類型數據特征構造法39

    3.3.4 時間序列數據特征構造法41

    3.3.5 離散數據特征啞編碼42

    3.4 本章小結43

    第4章 分類的基本概念與樸素貝葉斯分類器44

    4.1 分類的基本概念44

    4.2 樸素貝葉斯分類的基礎理論45

    4.2.1 貝葉斯示例45

    4.2.2 貝葉斯定理46

    4.2.3 極大后驗假設46

    4.2.4 多維屬性的聯合概率47

    4.2.5 獨立性假設47

    4.2.6 訓練集介紹47

    4.3 貝葉斯分類的案例48

    4.3.1 案例一:購買電腦預測48

    4.3.2 案例二:垃圾郵件分類49

    4.4 連續類型數據分類50

    4.5 本章小結50

    第5章 決策樹分類51

    5.1 決策樹51

    5.2 決策樹構建的兩個問題52

    5.2.1 如何構建決策樹52

    5.2.2 構造什么樣的決策樹是合適的53

    5.3 決策樹算法54

    5.3.1 Hunt算法54

    5.3.2 構建決策樹的關鍵問題56

    5.3.3 信息增益算法57

    5.3.4 C4.5算法59

    5.3.5 CART算法61

    5.4 本章小結64

    第6章 規則和近鄰分類器66

    6.1 基于規則的分類66

    6.1.1 基于規則的分類示例66

    6.1.2 規則的質量68

    6.1.3 規則分類器的特征68

    6.1.4 基于規則的分類器的建立69

    6.1.5 規則分類的特點76

    6.2 急切學習與惰性學習76

    6.3 近鄰分類器77

    6.3.1 近鄰算法的定義77

    6.3.2 K近鄰分類算法78

    6.4 本章小結79

    第7章 回歸算法80

    7.1 線性回歸的案例:房價預測80

    7.2 線性回歸算法81

    7.2.1 線性回歸的提出81

    7.2.2 線性回歸建模81

    7.2.3 小二乘法82

    7.3 優化求解方法83

    7.3.1 梯度下降83

    7.3.2 梯度下降法求解83

    7.3.3 學習率分析84

    7.3.4 梯度下降法收斂85

    7.3.5 梯度下降法的變體86

    7.4 邏輯回歸87

    7.4.1 邏輯回歸函數87

    7.4.2 邏輯回歸的特點87

    7.4.3 優勢比88

    7.4.4 邏輯回歸參數估計89

    7.4.5 邏輯回歸正則化90

    7.4.6 邏輯回歸數值優化91

    7.4.7 邏輯回歸訓練方法的優化93

    7.5 決策樹回歸94

    7.5.1 決策樹回歸的基本概念94

    7.5.2 決策樹分類劃分點的選擇94

    7.5.3 決策樹回歸算法96

    7.6 本章小結96

    第8章 模型的評價97

    8.1 分類模型的評價指標97

    8.1.1 混淆矩陣97

    8.1.2 準確率97

    8.1.3 精確率與召回率98

    8.1.4 ROC曲線99

    8.2 不平衡分類102

    8.2.1 基于抽樣的方法103

    8.2.2 兩階段學習104

    8.2.3 代價敏感學習104

    8.3 過擬合與欠擬合105

    8.3.1 訓練誤差和泛化誤差105

    8.3.2 噪聲導致的過擬合107

    8.3.3 缺乏代表性樣本導致的過擬合107

    8.3.4 解決過擬合的方法一:減少泛化誤差109

    8.3.5 解決過擬合的方法二:使用確認集估計泛化誤差110

    8.4 其他模型評價指標113

    8.4.1 回歸模型113

    8.4.2 聚類模型114

    8.4.3 關聯規則模型115

    8.5 本章小結117

    第9章 支持向量機分類器118

    9.1 支持向量機的提出118

    9.1.1 支持向量機簡介118

    9.1.2 傳統分類方法的不足118

    9.1.3 支持向量機的總體思想119

    9.1.4 從Logistic回歸到SVM分析119

    9.1.5 支持向量機的應用120

    9.2 深入支持向量機121

    9.2.1 支持向量機算法的原理121

    9.2.2 支持向量機建模122

    9.2.3 支持向量機求解123

    9.3 非線性支持向量機126

    9.3.1 基于軟間隔的C-SVM126

    9.3.2 非線性SVM與核變換129

    9.3.3 支持向量機二分類推廣131

    9.4 本章小結131

    第10章 神經網絡分類器132

    10.1 人工神經網絡出現的背景 132

    10.1.1 發展歷程132

    10.1.2 端到端的學習133
  • 內容簡介:
    目前,數據挖掘類課程已成為我國新工科教育的數據科學思維提升課程,成為信息、電子等各類工科專業本科生與研究生的必修課。本書深入淺出地介紹了數據挖掘和數據分析的知識、常用的各類算法;系統梳理與比較各類算法的優缺點與適用場景。本書內容結合作者多年的科研和教學經驗,大量案例來自作者的項目和科研成果,不僅適合作為大數據特色類專業的本科生和研究生教材,同時也適合機械、航空等其他工科專業的入門與自學教材,還可作為各專業本科生與研究生考試復習的參考資料。
  • 目錄:
    前言

    第1章 緒論1

    1.1 數據挖掘的出現1

    1.2 為什么要學習數據挖掘1

    1.2.1 數據爆炸但知識貧乏1

    1.2.2 從商業數據到商業智能的進化2

    1.2.3 科學發展范式2

    1.3 什么是數據挖掘3

    1.3.1 數據挖掘的出現3

    1.3.2 數據挖掘的定義3

    1.3.3 數據的含義4

    1.3.4 信息的含義4

    1.3.5 知識的含義5

    1.3.6 數據、信息、知識的關系5

    1.3.7 數據挖掘過程5

    1.3.8 數據挖掘的關聯課程6

    1.4 數據挖掘的內容7

    1.4.1 關聯規則挖掘7

    1.4.2 分類7

    1.4.3 聚類9

    1.4.4 回歸10

    1.5 本章小結10

    第2章 認識數據11

    2.1 數據的基本概念11

    2.1.1 數據對象11

    2.1.2 數據屬性12

    2.1.3 屬性的類型13

    2.1.4 屬性類型的對比14

    2.1.5 離散屬性與連續屬性14

    2.2 數據的基本統計方法15

    2.2.1 中心化趨勢統計量:均值、中位數和眾數15

    2.2.2 離散度度量16

    2.2.3 分布形狀度量17

    2.3 數據的基本可視化方法18

    2.3.1 箱線圖可視化18

    2.3.2 直方圖可視化19

    2.3.3 散點圖可視化19

    2.4 數據相似性的計算方法20

    2.4.1 數據相似性和相異性度量的基本概念20

    2.4.2 標稱屬性的鄰近性度量21

    2.4.3 二值屬性的鄰近性度量22

    2.4.4 序數屬性的鄰近性度量23

    2.4.5 數值屬性的鄰近性度量23

    2.4.6 混合類型屬性的鄰近性度量25

    2.4.7 余弦相似性25

    2.5 本章小結26

    第3章 數據預處理27

    3.1 數據質量27

    3.2 數據預處理的主要任務27

    3.2.1 數據清理27

    3.2.2 數據集成28

    3.2.3 數據規約32

    3.2.4 數據規范化和數據離散化37

    3.3 特征構造38

    3.3.1 為什么需要特征構造38

    3.3.2 基本特征構造法38

    3.3.3 時間類型數據特征構造法39

    3.3.4 時間序列數據特征構造法41

    3.3.5 離散數據特征啞編碼42

    3.4 本章小結43

    第4章 分類的基本概念與樸素貝葉斯分類器44

    4.1 分類的基本概念44

    4.2 樸素貝葉斯分類的基礎理論45

    4.2.1 貝葉斯示例45

    4.2.2 貝葉斯定理46

    4.2.3 極大后驗假設46

    4.2.4 多維屬性的聯合概率47

    4.2.5 獨立性假設47

    4.2.6 訓練集介紹47

    4.3 貝葉斯分類的案例48

    4.3.1 案例一:購買電腦預測48

    4.3.2 案例二:垃圾郵件分類49

    4.4 連續類型數據分類50

    4.5 本章小結50

    第5章 決策樹分類51

    5.1 決策樹51

    5.2 決策樹構建的兩個問題52

    5.2.1 如何構建決策樹52

    5.2.2 構造什么樣的決策樹是合適的53

    5.3 決策樹算法54

    5.3.1 Hunt算法54

    5.3.2 構建決策樹的關鍵問題56

    5.3.3 信息增益算法57

    5.3.4 C4.5算法59

    5.3.5 CART算法61

    5.4 本章小結64

    第6章 規則和近鄰分類器66

    6.1 基于規則的分類66

    6.1.1 基于規則的分類示例66

    6.1.2 規則的質量68

    6.1.3 規則分類器的特征68

    6.1.4 基于規則的分類器的建立69

    6.1.5 規則分類的特點76

    6.2 急切學習與惰性學習76

    6.3 近鄰分類器77

    6.3.1 近鄰算法的定義77

    6.3.2 K近鄰分類算法78

    6.4 本章小結79

    第7章 回歸算法80

    7.1 線性回歸的案例:房價預測80

    7.2 線性回歸算法81

    7.2.1 線性回歸的提出81

    7.2.2 線性回歸建模81

    7.2.3 小二乘法82

    7.3 優化求解方法83

    7.3.1 梯度下降83

    7.3.2 梯度下降法求解83

    7.3.3 學習率分析84

    7.3.4 梯度下降法收斂85

    7.3.5 梯度下降法的變體86

    7.4 邏輯回歸87

    7.4.1 邏輯回歸函數87

    7.4.2 邏輯回歸的特點87

    7.4.3 優勢比88

    7.4.4 邏輯回歸參數估計89

    7.4.5 邏輯回歸正則化90

    7.4.6 邏輯回歸數值優化91

    7.4.7 邏輯回歸訓練方法的優化93

    7.5 決策樹回歸94

    7.5.1 決策樹回歸的基本概念94

    7.5.2 決策樹分類劃分點的選擇94

    7.5.3 決策樹回歸算法96

    7.6 本章小結96

    第8章 模型的評價97

    8.1 分類模型的評價指標97

    8.1.1 混淆矩陣97

    8.1.2 準確率97

    8.1.3 精確率與召回率98

    8.1.4 ROC曲線99

    8.2 不平衡分類102

    8.2.1 基于抽樣的方法103

    8.2.2 兩階段學習104

    8.2.3 代價敏感學習104

    8.3 過擬合與欠擬合105

    8.3.1 訓練誤差和泛化誤差105

    8.3.2 噪聲導致的過擬合107

    8.3.3 缺乏代表性樣本導致的過擬合107

    8.3.4 解決過擬合的方法一:減少泛化誤差109

    8.3.5 解決過擬合的方法二:使用確認集估計泛化誤差110

    8.4 其他模型評價指標113

    8.4.1 回歸模型113

    8.4.2 聚類模型114

    8.4.3 關聯規則模型115

    8.5 本章小結117

    第9章 支持向量機分類器118

    9.1 支持向量機的提出118

    9.1.1 支持向量機簡介118

    9.1.2 傳統分類方法的不足118

    9.1.3 支持向量機的總體思想119

    9.1.4 從Logistic回歸到SVM分析119

    9.1.5 支持向量機的應用120

    9.2 深入支持向量機121

    9.2.1 支持向量機算法的原理121

    9.2.2 支持向量機建模122

    9.2.3 支持向量機求解123

    9.3 非線性支持向量機126

    9.3.1 基于軟間隔的C-SVM126

    9.3.2 非線性SVM與核變換129

    9.3.3 支持向量機二分類推廣131

    9.4 本章小結131

    第10章 神經網絡分類器132

    10.1 人工神經網絡出現的背景 132

    10.1.1 發展歷程132

    10.1.2 端到端的學習133
查看詳情
12
相關圖書 / 更多
數據挖掘:原理與應用
數據庫原理與應用項目化教程(MySQL)(胡巧兒)
李慧清 主編;胡巧兒
數據挖掘:原理與應用
數據結構——C語言描述(第四版)
陳慧南
數據挖掘:原理與應用
數據庫系統及應用(第9版微課版十三五職業教育國家規劃教材)
屈武江、張宏、霍艷飛 編
數據挖掘:原理與應用
數據挖掘技術與應用教程(普通高等院校新工科人工智能+系列教材)
柴欣、李娟、朱懷忠 編
數據挖掘:原理與應用
數據分析基礎與實戰(微課版)
朱德軍 仲崇麗 張勝南
數據挖掘:原理與應用
數據庫應用實戰與課程設計教程——基于VisualFoxPro9.0
張正新 著;張正新 編
數據挖掘:原理與應用
數據科學與智能技術概論(常東超)
盧紫微 主編;張國玉 副主編;常東超;蘇金芝
數據挖掘:原理與應用
數據科學統計計算(數據科學與大數據技術叢書)
許王莉 朱利平
數據挖掘:原理與應用
數據庫原理及應用秦海菲
秦海菲 著
數據挖掘:原理與應用
數據庫技術與應用----SQL Server 2019教程
詹英;林蘇映;顏慧佳;郭賢海
數據挖掘:原理與應用
數據包絡分析方法基本模型及其MATLAB算法
木仁
數據挖掘:原理與應用
數據庫原理及應用教程(MySQL版)
陳志泊
在线观看免费AV无码不卡
<code id="cq0yc"><menu id="cq0yc"></menu></code>
<noscript id="cq0yc"></noscript>
<center id="cq0yc"><small id="cq0yc"></small></center>
<optgroup id="cq0yc"></optgroup>
<center id="cq0yc"></center>
<optgroup id="cq0yc"></optgroup>