幫助中心 | 我的帳號 | 關於我們

小白學數據挖掘與機器學習(SPSS Modeler案例篇)

  • 作者:張浩彬
  • 出版社:電子工業
  • ISBN:9787121338434
  • 出版日期:2018/07/01
  • 裝幀:平裝
  • 頁數:216
人民幣:RMB 79 元      售價:
放入購物車
加入收藏夾

內容大鋼
    張浩彬著的《小白學數據挖掘與機器學習(SPSS Modeler案例篇)》用生活中常見的例子、有趣的插圖和通俗的語言,把看上去晦澀難懂的數據挖掘與機器學習知識以通俗易懂的方式分享給讀者,讓讀者從入門學習階段就發現,原來數據挖掘與機器學習不但有用,還很有趣。本書以IBM SPSS Modeler作為案例實踐工具,首先介紹了數據挖掘的基本概念及數據挖掘方法,然後介紹了IBM SPSS Modeler工具的基本使用、數據探索、統計檢驗、回歸分析、分類演算法、聚類演算法、關聯規則、神經網路以及集成學習。每一章都會以漫畫形式介紹一些日常小例子並作為切入點,用通俗的語言介紹具體的演算法理論,同時在每章最後都附上應用案例,讓讀者更輕鬆地閱讀本書並掌握對應的演算法和實踐操作。全書內容循序漸進,完整覆蓋了數據挖掘與機器學習的主要知識點,適合數據挖掘與機器學習入門讀者閱讀。

作者介紹
張浩彬
    張浩彬,人稱浩彬老撕,曾任IBM大中華區商業智能事業部SPSS分析工程師,認知解決方案事業部數據分析專家;現任廣東柯內特環境科技有限公司首席數據科學家。致力機器學習及SPSS技術分享,專註於人工智能技術與應用。微信公眾號:探數尋理(wetalkdata)。

目錄
第1章 數據挖掘那些事兒
  1.1  當我們在談數據挖掘時,其實在討論什麼
  1.2  從 CRISP-DM 開啟數據挖掘實踐
第2章 數據挖掘之利器:SPSS
  2.1  SPSS Modeler 簡介
  2.2  SPSS Modeler 的下載與安裝
  2.3  SPSS Modeler 的主界面及基本操作
    2.3.1  SPSS Modeler 主界面介紹
    2.3.2  滑鼠基本操作
  2.4  將 SPSS Modeler 連接到伺服器端
第3章 巧婦難為無米之炊:數據,數據!
  3.1  數據的身份
    3.1.1  變數的測量級別
    3.1.2  變數的角色
  3.2  數據的讀取
    3.2.1  讀取 Excel 文件數據
    3.2.2  讀取變數文件數據
    3.2.3  讀取 SPSS Statistics(.sav)文件數據
    3.2.4  讀取資料庫數據
  3.3  數據的基本設定
    3.3.1  變數角色的設定
    3.3.2  欄位的篩選及命名
  3.4  數據的集成
    3.4.1  數據的變數集成:合併節點
    3.4.2  數據的記錄集成:追加節點
第4章 一點都不簡單的描述性統計分析
  4.1  分類變數的基本分析: 「矩陣」節點
  4.2  連續變數的基本分析:數據審核節點
    4.2.1  連續變數基本分析指標介紹
    4.2.2  「數據審核」節點
第5章 何為足夠大的差異:常用的統計檢驗
  5.1  假設檢驗
    5.1.1  假設檢驗的基本原理
    5.1.2  假設檢驗的一般步驟
  5.2  連續變數與分類變數之間的關係: t 檢驗
    5.2.1  兩組獨立樣本均值比較
    5.2.2  兩組配對樣本均值比較
    5.2.3  使用 t 檢驗的前提條件
    5.2.4  案例:使用均值比較分析電信客戶的流失情況
  5.3  兩個連續變數之間的關係:相關分析
    5.3.1  相關分析理論
    5.3.2  案例:使用相關分析研究居民消費水平與國內生產總值的相關關係
  5.4  兩個分類變數之間的關係:卡方檢驗
    5.4.1  卡方檢驗的原理
    5.4.2  卡方檢驗的前提條件
    5.4.3  案例:使用卡方檢驗研究兩個分類欄位之間的關係
第6章 從身高和體重的關係談起:回歸分析
  6.1  一元線性回歸分析
    6.1.1  分析因變數與自變數的關係,構建回歸模型
    6.1.2  估計模型係數,求解回歸模型

    6.1.3  對模型係數進行檢驗,確認模型有效性
    6.1.4  擬合優度檢驗,判斷模型解釋能力
    6.1.5  借助回歸模型進行預測
  6.2  多元線性回歸分析
    6.2.1  估計模型係數,求解回歸模型
    6.2.2  對模型參數進行檢驗,確認模型有效性
    6.2.3  擬合優度檢驗,判斷模型解釋能力
    6.2.4  模型的變數選擇
  6.3  使用線性回歸分析的注意事項
  6.4  案例:使用回歸分析研究影響房屋價格的重要因素
第7章 回歸豈止這麼簡單:回歸模型的進一步擴展
  7.1  曲線回歸
  7.2  Logistic 回歸
    7.2.1  Logistic 回歸理論
    7.2.2  案例:使用 Logistic 回歸模型分析個人收入水平影響因素
第8章 模型評估那些事兒:過擬合與欠擬合
  8.1  過擬合與欠擬合
  8.2  留出法與交叉驗證
    8.2.1  留出法與分層抽樣
    8.2.2  交叉驗證
第9章 從看電影的思考到決策樹的生成
  9.1  決策樹概述
  9.2  決策樹生成
    9.2.1  從 ID3 演算法到 C5.0 演算法
    9.2.2  CART 演算法
  9.3  決策樹的剪枝
    9.3.1  預剪枝策略
    9.3.2  后剪枝策略
    9.3.3  代價敏感學習
  9.4  案例:用決策樹分析客戶違約情況
  9.5  關於信息熵的擴展
第10章 人工神經網路:從人腦神經元開始
    10.1  從人腦神經元到人工神經網路
    10.2  感知機
    10.3  人工神經網路
    10.3.1  隱藏層的作用
    10.3.2  人工神經網路演算法
  10.4  案例:利用人工神經網路分析某電信運營商的客戶流失情況
第11章 物以類聚,人以群分:聚類分析
  11.1  聚類思想的概述
  11.2  聚類方法的關鍵:距離
  11.3  K-Means 演算法
    11.3.1  K-Means 演算法原理
    11.3.2  輪廓係數(Silhouette coefficient)
  11.4  案例:利用 K-Means 演算法對不同型號汽車的屬性進行聚類分群研究
第12章 啤酒+尿布=關聯分析?
  12.1  一個關於關聯分析的傳說
  12.2  關聯分析的基本概念
  12.3  關聯規則的有效性指標
  12.4  Apriori 演算法

    12.4.1  生成頻繁項集
    12.4.2  生成關聯規則
  12.5  案例:利用 Apriori 演算法對顧客的個人信息及購買記錄進行關聯分析
第13章 三個臭皮匠,賽過諸葛亮:集成學習演算法
  13.1  集成學習演算法概述
  13.2  3 種不同的集成學習演算法
    13.2.1  Bagging 演算法
    13.2.2  Boosting 演算法
    13.2.3  隨機森林
  13.3  集成學習演算法實踐
    13.3.1  Bagging 演算法和 Boosting 演算法
    13.3.2  隨機森林
    13.3.3  集成學習演算法結果比較

  • 商品搜索:
  • | 高級搜索
首頁新手上路客服中心關於我們聯絡我們Top↑
Copyrightc 1999~2008 美商天龍國際圖書股份有限公司 臺灣分公司. All rights reserved.
營業地址:臺北市中正區重慶南路一段103號1F 105號1F-2F
讀者服務部電話:02-2381-2033 02-2381-1863 時間:週一-週五 10:00-17:00
 服務信箱:bookuu@69book.com 客戶、意見信箱:cs@69book.com
ICP證:浙B2-20060032