首頁 搜尋 我的知識庫
大數據淘金術:Python機器學習高手實彈演練

大數據淘金術:Python機器學習高手實彈演練

作者: 謝彥
出版社: 深智數位
出版日期: 2021/01/21
ISBN-13: 9789865501747
書店 1






內容描述


◎ 從系統角度出發

  ◎ 理論與實務結合

  ◎ 主次分明通俗易懂

 

  人工智慧和巨量資料技術已成為IT企業的發展趨勢,而技術的高速發展和需求的不斷增加也產生極大的人才缺口。

 

  本書致力於有系統地闡釋Python大數據和機器學習技術,從資料的擷取、儲存、清洗,到建立模型、統計分析,最後用前端程式呈現給使用者資料展示以及後台的系統服務支援。本書結合Python資料工具使用、演算法原理以及典型實例各個層面,希望讀者透過閱讀本書,少走冤枉路,以最小的學習成本獲得最大的知識收益。

 

  程式設計師透過閱讀本書可以學習大數據和機器學習企業的實際技能和方法;創業者和產品設計人員透過閱讀本書可以了解資料建模的功能、相關的技術點,以便更進一步地設計產品。

 

  全書共16 章,第1 章 Python 程式設計介紹作為巨量資料工程師需要掌握的基本技術。

 

   第2 ∼ 4 章 Python 資料分析工具 詳細介紹資料處理使用的科學計算函數庫Numpy、資料操作函數庫Pandas、資料視覺化工具Matplotlib 和Seaborn,以及互動作圖工具PyEcharts的資料處理邏輯和常用方法範例。

 

  第5 ∼ 10 章 Python 資料處理與機器學習演算法 將理論、實例和Python 程式結合在一起,分別說明資料處理的每一個子模組。

 

  第11 ∼ 16 章 Python 實戰  介紹決策問題、遷移學習、影像分割、時序分析、自然語言處理、定義問題的方法等幾種典型的機器學習問題,兼顧使用場景分析、原理、程式解析等層面,和讀者一起探討在實戰中解決問題的想法和方法。

 

  適合讀者群  學習Python演算法和資料分析的工程師、往人工智慧和巨量資料方向發展的工程師、對人工智慧和巨量資料開發有興趣者。

 

本書特色

 

  巨量資料-->演算法-->機器學習-->預測未來,這是現在雲端時代最重要範式,也是人類進入數位時代後最重要的一次工業革命,集未來科技之大成,智慧家居、無人車、帶我們上火星,靠著就是這些暗黑科學。


目錄大綱


前言
01 Python 巨量資料開發入門
1.1 巨量資料工程師必備技能
1.2 Python 開發環境
1.3 Python 開發工具
1.4 Python 資料類型
1.5 Python 函數和類別
1.6 Python 常用函數庫
1.7 Python 技巧
1.8 Python 常見問題

02 科學計算Numpy
2.1 多維陣列
2.2 陣列元素運算 
2.3 常用函數

03 資料操作Pandas
3.1 資料物件
3.2 資料存取
3.3 分組運算
3.4 日期時間處理

04 資料視覺化
4.1 Matplotlib 繪圖函數庫
4.2 Seaborn 進階資料視覺化
4.3 PyEcharts 互動圖

05 獲取資料
5.1 讀寫檔案
5.2 讀寫資料庫
5.3 讀寫資料倉儲
5.4 取得網路資料
5.5 選擇資料儲存方式

06 資料前置處理
6.1 資料類型識別與轉換
6.2 資料清洗
6.3 資料精簡
6.4 資料抽樣
6.5 資料組合
6.6 特徵分析

07 資料分析
7.1 入門實例
7.2 假設檢驗
7.3 參數檢驗與非參數檢驗
7.4 T 檢驗
7.5 方差分析
7.6 秩和檢驗
7.7 卡方檢定
7.8 相關性分析
7.9 變數分析
7.10 TableOne 工具
7.11 統計方法歸納

08 機器學習基礎知識
8.1 基本概念
8.2 評價模型

09 機器學習模型與工具
9.1 以距離為基礎的演算法
9.2 線性回歸與邏輯回歸
9.3 支援向量機
9.4 資訊熵和決策樹
9.5 連結規則
9.6 貝氏模型
9.7 隱馬可夫模型
9.8 整合演算法

10 模型選擇與相關技術
10.1 資料準備與模型選擇
10.2 自動機器學習架構
10.3 自然語言處理
10.4 建模相關技術

11 巨量資料競賽平台
11.1 定義問題
11.2 演算法競賽

12 決策問題:幸福感採擷
12.1 賽題解讀
12.2 模型初探
12.3 模型最佳化
12.4 模型輸出
12.5 XGBoost 模型

13 遷移學習:貓狗圖片分類
13.1 深度學習神經網路
13.2 使用現有的神經網路模型
13.3 遷移學習
13.4 解決貓狗分類問題 

14 影像分割:識別圖中物體
14.1 Mask R-CNN 演算法
14.2 Mask R-CNN 原始程式
14.3 訓練模型與預測

15 時間序列分析
15.1 時序問題處理流程
15.2 趨勢分析工具ARIMA
15.3 傅立葉和小波轉換
15.4 Prophet 時序模型

16 自然語言處理:微博互動預測
16.1 賽題分析
16.2 中文分析


作者介紹


作者簡介

 

謝 彥 

 

  多年軟體開發和演算法研發經驗,曾任職聯想研究院、元心科技等公司。參與研發機上盒、智慧手機作業系統,工作涉及上層應用、集群構建、圖形底層優化、語音合成與識別、資料採擷、深度學習演算法等。

 

  目前專注於醫療大數據應用研發。






相關書籍

作業系統精論

Illustrator設計幫幫忙[CC/CS6/CS5/CS4/CS3] (增訂版):解決現場問題的速查即效事典

TQC+ 電腦繪圖設計認證指南解題秘笈-Illustrator CC(第二版)

重新認識Vue.js:008天絕對看不完的Vue.js 3指南