幫助中心 | 我的帳號 | 關於我們

數據挖掘(高等學校大數據技術與應用規劃教材)

  • 作者:編者:宋萬清//楊壽淵//陳劍雪//高永彬
  • 出版社:中國鐵道
  • ISBN:9787113251673
  • 出版日期:2019/01/01
  • 裝幀:平裝
  • 頁數:180
人民幣:RMB 38 元      售價:
放入購物車
加入收藏夾

內容大鋼
    宋萬清、楊壽淵、陳劍雪、高永彬編著的《數據挖掘(高等學校大數據技術與應用規劃教材)》著力于介紹數據挖掘基礎知識、基本原理、常用演算法,主要內容包括數據挖掘概述、數據的描述與可視化、數據的採集和預處理、數據的歸約、關聯規則挖掘、分類與預測、非線性預測模型、聚類分析、深度學習簡介、使用Weka進行數據挖掘。本書通俗易懂,注重基礎知識、基本原理和基本方法,注重啟發和引申,以培養學生獨立思考和獨立發現的能力。
    本書適合作為數據科學與大數據、信息管理、統計等專業的本科層次基礎課教材,也可作為相關專業研究生層次的參考用書。

作者介紹
編者:宋萬清//楊壽淵//陳劍雪//高永彬

目錄
第1章  數據挖掘概述
  1.1  什麼是數據挖掘
    1.1.1  數據、信息和知識
    1.1.2  數據挖掘的定義
    1.1.3  數據挖掘的發展簡史
  1.2  數據挖掘的基本流程及方法概述
    1.2.1  數據挖掘的基本流程
    1.2.2  數據挖掘的任務和方法概述
  1.3  數據挖掘的應用
    1.3.1  數據挖掘在商務領域的應用
    1.3.2  數據挖掘在醫療和醫學領域的應用
    1.3.3  數據挖掘在銀行和保險領域的應用
    1.3.4  數據挖掘在社交媒體領域的應用
  習題
第2章  數據的描述與可視化
  2.1  概述
  2.2  數據對象與屬性類型
    2.2.1  什麼是屬性
    2.2.2  標稱屬性
    2.2.3  二元屬性
    2.2.4  序數屬性
    2.2.5  數值屬性
    2.2.6  離散屬性與連續屬性
  2.3  數據的基本統計描述
    2.3.1  中心趨勢度量
    2.3.2  度量數據散布:極差、四分位數、方差、標準差和四分位數極差
    2.3.3  數據基本統計的圖形描述
  2.4  數據可視化
    2.4.1  基於像素的可視化
    2.4.2  幾何投影可視化
    2.4.3  基於圖符的可視化
    2.4.4  層次可視化
    2.4.5  可視化複雜對象和關係
  2.5  數據相似性和相異性度量
    2.5.1  數據矩陣與相異性矩陣
    2.5.2  標稱屬性的鄰近性度量
    2.5.3  二元屬性的鄰近性度量
    2.5.4  數值屬性的相異性閔可夫斯基距離
    2.5.5  序數屬性的鄰近性度量
    2.5.6  混合類型屬性的相異性
    2.5.7  餘弦相似性
  習題
第3章  數據的採集和預處理
  3.1  概述
    3.1.1  大數據採集的特點
    3.1.2  大數據採集的方法
  3.2  數據預處理的目的和任務
  3.3  數據清洗
    3.3.1  缺失值清洗
    3.3.2  異常值清洗

    3.3.3  格式內容清洗
    3.3.4  邏輯錯誤清洗
    3.3.5  非需求數據清洗
    3.3.6  關聯性驗證
  3.4  數據集成
  3.5  數據變換
  習題
第4章  數據的歸約
  4.1  概述
  4.2  屬性的選擇與數值歸約
    4.2.1  屬性的評估準則
    4.2.2  屬性子集選擇方法
    4.2.3  數值歸約
  4.3  線性回歸
  4.4  主成分分析
  習題
第5章  關聯規則挖掘
  5.1  概述
  5.2  關聯規則的分類
  5.3  關聯規則的研究步驟
    5.3.1  關聯規則挖掘演算法的分類
    5.3.2  各種演算法類型的對比
  5.4  Apriori演算法分析
  5.5  實例分析
  5.6  關聯規則的推廣(GRI)
  5.7  關聯規則的深入挖掘
  習題
第6章  分類與預測
  6.1  概述
    6.1.1  基本概念
    6.1.2  數據分類的一般方法
  6.2  決策樹模型
    6.2.1  決策樹的工作原理
    6.2.2  決策樹的適用問題
    6.2.3  ID3演算法
    6.2.4  決策樹的結點劃分
  6.3  貝葉斯分類模型
    6.3.1  貝葉斯定理
    6.3.2  貝葉斯模型的特點
  6.4  線性判別模型
  6.5  邏輯回歸模型
    6.5.1  邏輯回歸模型概述
    6.5.2  邏輯回歸模型的基本概念
  6.6  模型的評估與選擇
    6.6.1  評估分類器性能的度量
    6.6.2  保持方法和隨機二次抽樣
    6.6.3  交叉驗證
    6.6.4  自助法
    6.6.5  使用統計顯著性檢驗選擇模型
  習題

第7章  非線性預測模型
  7.1  概述
  7.2  支持向量機
    7.2.1  支持向量機分類原理
    7.2.2  非線性支持向量機
    7.2.3  支持向量機回歸預測
    7.2.4  基於支持向量機的預測分析
  7.3  神經網路
    7.3.1  人工神經網路模型與分類
    7.3.2  BP神經網路
    7.3.3  RBF神經網路
    7.3.4  基於神經網路的預測分析
  習題
第8章  聚類分析
  8.1  概述
  8.2  k-均值聚類
  8.3  k-中心聚類
  8.4  聚類評估
    8.4.1  外部法
    8.4.2  內部法
    8.4.3  可視化方法
  習題
第9章  深度學習簡介
  9.1  概述
  9.2  來自人類視覺機理的啟發
  9.3  深層神經網路
  9.4  卷積神經網路
    9.4.1  卷積和池化
    9.4.2  CNN網路框架
    9.4.3  CNN的應用
  9.5  RNN循環神經網路
    9.5.1  RNN的結構
    9.5.2  RNN的缺陷
    9.5.3  RNN的應用
  9.6  生成對抗網路
    9.6.1  GAN的原理與架構
    9.6.2  GAN的應用
  習題
第10章  使用Weka進行數據挖掘
  10.1  概述
  10.2  Weka關聯數據挖掘的基本操作
  10.3  數據格式
  10.4  關聯規則挖掘
  10.5  分類與回歸
  10.6  聚類分析
  習題
附錄 A 拉格朗日優化法
參考文獻

  • 商品搜索:
  • | 高級搜索
首頁新手上路客服中心關於我們聯絡我們Top↑
Copyrightc 1999~2008 美商天龍國際圖書股份有限公司 臺灣分公司. All rights reserved.
營業地址:臺北市中正區重慶南路一段103號1F 105號1F-2F
讀者服務部電話:02-2381-2033 02-2381-1863 時間:週一-週五 10:00-17:00
 服務信箱:bookuu@69book.com 客戶、意見信箱:cs@69book.com
ICP證:浙B2-20060032