幫助中心 | 我的帳號 | 關於我們

數據倉庫與數據挖掘(第2版21世紀高等學校電腦專業核心課程規劃教材)

  • 作者:編者:陳志泊
  • 出版社:清華大學
  • ISBN:9787302483991
  • 出版日期:2017/11/01
  • 裝幀:平裝
  • 頁數:250
人民幣:RMB 39 元      售價:
放入購物車
加入收藏夾

內容大鋼
    陳志泊主編的《數據倉庫與數據挖掘(第2版21世紀高等學校電腦專業核心課程規劃教材)》主要介紹數據倉庫和數據挖掘技術的基本原理和應用方法。全書共分為12章,主要內容包括數據倉庫的概念和體系結構、數據倉庫的數據存儲和處理、數據倉庫系統的設計與開發、關聯規則、數據分類、數據聚類、貝葉斯網路、粗糙集、神經網路、遺傳演算法、統計分析、文本和Web挖掘。
    本書既重視理論知識的講解,又強調應用技能的培養。每章首先介紹演算法的主要思想和理論基礎,之後利用演算法去解決實例中給出的任務,而且對於數據倉庫的組建方法和多數章節中的數據挖掘演算法,書中都使用Microsoft SQL Server 2005進行了操作實現。通過對具體實例的學習和實踐,使讀者掌握數據倉庫和數據挖掘中必要的知識點,達到學以致用的目的。
    本書每章均配有習題,習題形式為選擇題、簡答題和操作題,可以幫助讀者進一步掌握和鞏固所學知識。此外,本書提供多媒體教學課件和習題參考答案,讀者可到清華大學出版社網站http://www.tup.com.cn/下載。
    本書可以作為高等學校電腦及相關專業本科、研究生的數據倉庫和數據挖掘教材,也可供相關領域的廣大科技工作人員和高校師生參考。

作者介紹
編者:陳志泊

目錄
第1章  數據倉庫的概念與體系結構
  1.1  數據倉庫的概念、特點與組成
    1.1.1  數據倉庫的特點
    1.1.2  數據倉庫的組成
  1.2  數據挖掘的概念與方法
    1.2.1  數據挖掘的分析方法
    1.2.2  數據倉庫與數據挖掘的關係
  1.3  數據倉庫的技術、方法與產品
    1.3.1  OLAP技術
    1.3.2  數據倉庫實施的關鍵環節和技術
    1.3.3  數據倉庫實施方法論
    1.3.4  常用的數據倉庫產品
  1.4  數據倉庫系統的體系結構
    1.4.1  獨立的數據倉庫體系結構
    1.4.2  基於獨立數據集市的數據倉庫體系結構
    1.4.3  基於依賴型數據集市和操作型數據存儲的數據倉庫體系結構
    1.4.4  基於邏輯型數據集市和實時數據倉庫的體系結構
  1.5  數據倉庫的產生、發展與未來
    1.5.1  數據倉庫的產生
    1.5.2  數據倉庫的發展
    1.5.3  數據倉庫的未來
    1.5.4  新一代數據倉庫技術
  1.6  小結
  1.7  習題
第2章  數據倉庫的數據存儲與處理
  2.1  數據倉庫的數據結構
  2.2  數據倉庫的數據特徵
    2.2.1  狀態數據與事件數據
    2.2.2  當前數據與周期數據
    2.2.3  元數據
  2.3  數據倉庫的數據ETL過程
    2.3.1  ETL的目標
    2.3.2  ETL過程描述
    2.3.3  數據抽取
    2.3.4  數據清洗
    2.3.5  數據轉換
    2.3.6  數據載入和索引
  2.4  多維數據模型
    2.4.1  多維數據模型及其相關概念
    2.4.2  多維數據模型的實現
    2.4.3  多維建模技術
    2.4.4  星型模式舉例
  2.5  小結
  2.6  習題
第3章  數據倉庫系統的設計與開發
  3.1  數據倉庫系統的設計與開發概述
    3.1.1  建立數據倉庫系統的步驟
    3.1.2  數據倉庫系統的生命周期
    3.1.3  建立數據倉庫系統的思維模式
    3.1.4  數據倉庫資料庫的設計步驟

  3.2  基於SQL Server 2005的數據倉庫資料庫設計
    3.2.1  分析組織的業務狀況及數據源結構
    3.2.2  組織需求調研,收集分析需求
    3.2.3  採用信息包圖法設計數據倉庫的概念模型
    3.2.4  利用星型圖設計數據倉庫的邏輯模型
    3.2.5  數據倉庫的物理模型設計
  3.3  使用SQL Server 2005建立多維數據模型
    3.3.1  SQL Server 2005示例數據倉庫環境的配置與使用
    3.3.2  基於SQL Server 2005示例資料庫的多維數據模型
  3.4  小結
  3.5  習題
第4章  關聯規則
  4.1  概述
  4.2  引例
  4.3  經典演算法
    4.3.1  Apriori演算法
    4.3.2  FP-growth演算法
  4.4  相關研究與應用
    4.4.1  分類
    4.4.2  SQL Server 2005中的關聯規則應用
  4.5  小結
  4.6  習題
第5章  數據分類
  5.1  引例
  5.2  分類問題概述
    5.2.1  分類的過程
    5.2.2  分類的評價準則
  5.3  決策樹
    5.3.1  決策樹的基本概念
    5.3.2  決策樹演算法ID3
    5.3.3  ID3演算法應用舉例
    5.3.4  決策樹演算法C4.5
    5.3.5  SQL Server 2005中的決策樹應用
    5.3.6  決策樹剪枝
  5.4  支持向量機
  5.5  近鄰分類方法
    5.5.1  最近鄰分類方法
    5.5.2  k-近鄰分類方法
    5.5.3  近鄰分類方法應用舉例
  5.6  小結
  5.7  習題
第6章  數據聚類
  6.1  引例
  6.2  聚類分析概述
  6.3  聚類分析中相似度的計算方法
    6.3.1  連續型屬性的相似度計算方法
    6.3.2  二值離散型屬性的相似度計算方法
    6.3.3  多值離散型屬性的相似度計算方法
    6.3.4  混合類型屬性的相似度計算方法
  6.4  K-means聚類演算法

    6.4.1  K-means聚類演算法的基本概念
    6.4.2  SQL server 2005中的K-means應用
  6.5  層次聚類方法
    6.5.1  層次聚類方法的基本概念
    6.5.2  層次聚類方法應用舉例
  6.6  小結
  6.7  習題
第7章  貝葉斯網路
  7.1  引例
  7.2  貝葉斯概率基礎
    7.2.1  先驗概率、后驗概率和條件概率
    7.2.2  條件概率公式
    7.2.3  全概率公式
    7.2.4  貝葉斯公式
  7.3  貝葉斯網路概述
    7.3.1  貝葉斯網路的組成和結構
    7.3.2  貝葉斯網路的優越性
    7.3.3  貝葉斯網路的三個主要議題
  7.4  貝葉斯網路的預測、診斷和訓練演算法
    7.4.1  概率和條件概率數據
    7.4.2  貝葉斯網路的預測演算法
    7.4.3  貝葉斯網路的診斷演算法
    7.4.4  貝葉斯網路預測和診斷的綜合演算法
    7.4.5  貝葉斯網路的建立和訓練演算法
  7.5  SQL Server 2005中的貝葉斯網路應用
  7.6  小結
  7.7  習題
第8章  粗糙集
  8.1  引例
  8.2  分類與知識
    8.2.1  等價關係和等價類
    8.2.2  分類
  8.3  粗糙集
    8.3.1  分類的運算
    8.3.2  分類的表達能力
    8.3.3  上近似集和下近似集
    8.3.4  正域、負域和邊界
    8.3.5  粗糙集應用舉例
    8.3.6  粗糙集的性質
  8.4  辨識知識的簡化
    8.4.1  集合近似精度的度量
    8.4.2  分類近似的度量
    8.4.3  等價關係的可省略、獨立和核
    8.4.4  等價關係簡化舉例
    8.4.5  知識的相對簡化
    8.4.6  知識的相對簡化舉例
  8.5  決策規則簡化
    8.5.1  知識依賴性的度量
    8.5.2  簡化決策規則
    8.5.3  可辨識矩陣

  8.6  小結
  8.7  習題
第9章  神經網路
  9.1  引例
  9.2  人工神經網路
    9.2.1  人工神經網路概述
    9.2.2  神經元模型
    9.2.3  網路結構
  9.3  BP演算法
    9.3.1  網路結構和數據示例
    9.3.2  有序導數
    9.3.3  計算誤差信號對參數的有序導數
    9.3.4  梯度下降
    9.3.5  BP演算法描述
  9.4  SQL Server 2005中的神經網路應用
  9.5  小結
  9.6  習題
第10章  遺傳演算法
  10.1  概述
  10.2  相關概念
  10.3  基本步驟
    10.3.1  概述
    10.3.2  引例
  10.4  演算法設計
    10.4.1  編碼方式
    10.4.2  種群規模
    10.4.3  適應度函數
    10.4.4  遺傳運算元
    10.4.5  終止條件
  10.5  相關研究與應用
  10.6  小結
  10.7  習題
第11章  統計分析
  11.1  線性回歸模型
    11.1.1  線性回歸模型的參數估計
    11.1.2  線性回歸方程的判定係數
    11.1.3  線性回歸方程的檢驗
    11.1.4  統計軟體中的線性回歸分析
    11.1.5  SQL Server 2005中的線性回歸應用
  11.2  Logistic回歸模型
    11.2.1  Logistic回歸模型的參數估計
    11.2.2  統計軟體中Logistic回歸的結果分析
    11.2.3  SQL Server 2005中的Logistic回歸應用
  11.3  時間序列模型
    11.3.1  ARIMA模型
    11.3.2  建立ARIMA模型的步驟
    11.3.3  使用統計軟體估計ARIMA模型
    11.3.4  SQL Server 2005中的時間序列分析
  11.4  小結
  11.5  習題

第12章  文本和Web挖掘
  12.1  引例
  12.2  文本挖掘
    12.2.1  文本信息檢索概述
    12.2.2  基於關鍵字的關聯分析
    12.2.3  文檔自動聚類
    12.2.4  自動文檔分類
    12.2.5  自動摘要
  12.3  Web挖掘
    12.3.1  Web內容挖掘
    12.3.2  Web結構挖掘
    12.3.3  Web使用挖掘
  12.4  小結
  12.5  習題
參考文獻

  • 商品搜索:
  • | 高級搜索
首頁新手上路客服中心關於我們聯絡我們Top↑
Copyrightc 1999~2008 美商天龍國際圖書股份有限公司 臺灣分公司. All rights reserved.
營業地址:臺北市中正區重慶南路一段103號1F 105號1F-2F
讀者服務部電話:02-2381-2033 02-2381-1863 時間:週一-週五 10:00-17:00
 服務信箱:bookuu@69book.com 客戶、意見信箱:cs@69book.com
ICP證:浙B2-20060032