我(wǒ)分(fēn)類故我(wǒ)在。大(dà)數據也要大(dà)思維!思維革新比數據技術更重要!
在商(shāng)業分(fēn)析和商(shāng)業智慧的場景下(xià),人們需要的是建構大(dà)數據,而不是從巨量資(zī)料當中(zhōng)“大(dà)海撈針”。
如果隻是把資(zī)料變多,認知(zhī)學習能力的維度卻沒有變高,接下(xià)來會如何?從少量數據都學習不到的價值,大(dà)數據隻會讓它更遙不可及。
本書(shū)内容豐富,從多個角度切入,探讨大(dà)數據所必備的工(gōng)具,例如Rcommander、決策樹(shù)、随機森(sēn)林與R語言強大(dà)的視覺化功能。除了概念解析之外(wài),作者更逐行解析專業程序語言,再加碼實際操作與應用功能說明。本書(shū)非常适合作爲R語言的基礎自學書(shū)。
何宗武,現任中(zhōng)國台灣師範大(dà)學全球經營與策略研究所教授,曾任中(zhōng)國台灣世新大(dà)學特聘教授、财務金融學系教授、數量方法研究暨發展中(zhōng)心主任。擅長财務經濟學、金融大(dà)數據、計量經濟資(zī)料科學及程序語言等,曾出版《R語言:深入淺出财經計量》《R資(zī)料采礦與數據分(fēn)析:以GuI套件Rattle結合程序語言實作》《資(zī)料分(fēn)析輕松學:R commander高手捷徑》《Eviews高手:财經計量應用手冊》等多部著作。
在未來,容易上手的程序語言與免費(fèi)的教材隻會越來越普及,唯有資(zī)料素養和決策分(fēn)析能力,才能真正讓你出類拔萃!
◎内行引入門→本書(shū)作者實力雄厚,擁有多年教學經驗,更是R語言中(zhōng)文版的編譯者。
◎功力就大(dà)增→解析型企業、時間序列、決策樹(shù)、随機森(sēn)林等十個大(dà)數據核心講題幫你全方位大(dà)提升!
◎思維超展開(kāi)→程序語言專業講解與發人省思的分(fēn)析探讨同步幫你掌握關鍵。
◎展望大(dà)未來→每講皆以國際化的大(dà)數據時事開(kāi)頭,引發學習興趣,增進視野高度!
第1講 分(fēn)析型企業的概念
大(dà)數據有大(dà)用
數據分(fēn)析過程涉及的兩個大(dà)數據環境
算法的概念
數據分(fēn)析之信息概論
測量的哲學——自我(wǒ)學習之路
本書(shū)内容安排
第2講 統計分(fēn)布的數字特征
統計圖
平均值
四分(fēn)位距
标準差
偏度
峰度
分(fēn)析大(dà)數據時需要注意的問題
商(shāng)業模式的數字挑戰
第3講 時間序列
時間序列的概念
時間序列的特點
時間序列分(fēn)析之低頻(pín)分(fēn)析
時間序列的分(fēn)類分(fēn)析
時間序列分(fēn)析之日高頻(pín)分(fēn)析
分(fēn)類分(fēn)析
時間序列分(fēn)析之日内高頻(pín)分(fēn)析
分(fēn)析大(dà)數據時需要注意的問題
預測失靈
第4講 期望值與信賴區間
期望的概念
簡單的統計原理
R Commander項目實戰
殘差診斷
R語言程序實戰
分(fēn)析大(dà)數據時需要注意的問題
基于區塊鏈的決策思考
第5講 二元選擇模型與Logstic模型
二元選擇模型
R Commander項目實戰
R語言程序實戰
分(fēn)析大(dà)數據時需要注意的問題
大(dà)數據的經濟預測
第6講 主成分(fēn)分(fēn)析
主成分(fēn)分(fēn)析的概念
R Commander項目實戰
R語言程序實戰
分(fēn)析大(dà)數據時需要注意的問題
都是預測惹的禍
第7講 聚類分(fēn)析
聚類分(fēn)析的基本概念
R Commander項目實戰
R語言程序實戰
分(fēn)析大(dà)數據時需要注意的問題
平台經濟的數據決策
第8講 決策樹(shù)
決策樹(shù)的概念
決策樹(shù)的分(fēn)類原理
R Commander項目實戰
R語言程序實戰
分(fēn)析大(dà)數據時需要注意的問題
當數據變成噪聲
第9講 随機森(sēn)林
随機森(sēn)林的概念
随機森(sēn)林的特點
R Commander項目實戰
R語言程序實戰
分(fēn)析大(dà)數據時需要注意的問題
都是随機惹的禍
第10講 購物(wù)車(chē)分(fēn)析
購物(wù)車(chē)分(fēn)析的概念
關聯分(fēn)析的原理
R Cornmander項目實戰
R語言程序實戰
分(fēn)析大(dà)數據時需要注意的問題
數據産品化——大(dà)數據決策的最後一(yī)段路
附錄A 關于R語言的安裝
R語言簡介及安裝
R Cornnmader簡介
安裝R Commander
附錄B rattle包的安裝
加載外(wài)部數據
加載R語言内置數據
附錄C 數據文件的讀取和MySQL數據庫的使用
數據的讀取
使用數據庫讀取數據
常用的數據處理函數
數據計算函數apply()家族