首頁 搜尋 我的知識庫
AI時代的資料科學:小白到數據專家的全面指南

AI時代的資料科學:小白到數據專家的全面指南

作者: 黃朝健
出版社: 深智數位
出版日期: 2024/08/19
ISBN-13: 9786267383926
書店 1







內容描述


這本趣味的指南在探索AI與資料科學領域的奇妙世界方面,具有以下特點,並獲得學界和業界的推薦:

  ◆全面性:涵蓋從數據收集到機器學習模型構建的全過程,適合初學者和進階學習者。

  ◆工具應用:重點介紹Python及其他主要工具的應用,這些工具是當今AI與資料科學必不可少的基礎。

  ◆學界推薦:來自頂尖學術界專家的推薦,確保本書內容的學術性和專業性。

  ◆業界推薦:專業資訊人士的推薦,證明本書在實際應用和職場技能需求的價值。

  ◆實際案例和習題:提供豐富的實際案例和習題,有助於讀者從理論到實踐的無縫過渡,加深對知識的理解和應用能力。

  本書的特點使得這本指南不僅適合想要建立堅實基礎並深入研究AI與資料科學的新手,也適合希望在這些領域中追求更高專業水準的進階學習者。無論是學術研究還是商業應用,這本書都將成為讀者實現卓越的重要工具書。

名人推薦

  伽碩企業有限公司附設職業訓練中心執行長 郭明洽
  銘傳大學資訊科技與管理學程教授 尹邦嚴
  前仁寶電腦財務主管、法藍瓷行政主管、中強光電營運主管、國巨稽核主管 鄭穎臨
  日本東京農工大學 感染症未來疫学研究センター 特任助理教授 林立云
  王致遠 藥師
  國際商業機器股份有限公司 IBM 工程師 陳尚瑋
  優貝克股份有限公司資料工程師 吳俊毅


目錄大綱


第一章:簡單的雲端IDE,從Google Colaboratory 談起
1.1 IDE: VScode的設定與安裝
1.2 Pycharm社群版的設定與安裝
1.3 Anaconda 套件的安裝細節
1.4 Jupyter Notebook的設定與排錯
1.5 Spyder 的安裝
1.6 如何壓成exe檔案及錯誤排除
1.7 Google Colaboratory的操作與環境介紹
1.8如何Mount Google driver以及寫出雲端硬碟

第二章:Pandas 資料清洗的基本功夫-讀檔、資料框的操作、合併、丟回雲端
2.1 Python的基本功
2.2 流程控制、迴圈說明
2.3 range函數的應用
2.4切片的應用
2.5 四大容器的介紹
2.6 Pandas的介紹與安裝
2.7 Pandas的讀檔與位置指定
2.8 簡單取值說明
2.9 政府資料開放平台:台南旅遊景點資料集
2.10 政府資料開放平台:韓式料理資料集

第三章:Pandas 資料清洗的進階功夫-多欄位讀取、跨列讀取、資料聚合
3.1 多欄位取值
3.2 多列位取值
3.3 取頭取尾觀察資料作法
3.4 避免錯誤編碼
3.5 資料聚合的操作1: pd.concat
3.6 資料聚合的操作2: pd.merge
3.7 字串的取代以及強制轉型的用法
3.8 跨欄位字串合併技術
3.9 清洗資料的三姊妹: isnull()、fillna()、dropna()
3.10 文字編碼的做法:標準化和正規化
3.11 綜合應用

第四章:chatGPT提示工程的實作:善用生成式工具進行開發
4.1 GPT的註冊
4.2 open AI 後臺的操作:申請API
4.3 openaAI的playground用法
4.4. Claude AI的註冊
4.5 Claude AI的操作以及極限
4.6提示工程(Prompt Engineering)說明
4.7 翻譯機器人與對話機器人實作

第五章:機器學習概論: 監督式技術 VS. 非監督式技術 VS. 強化式技術
5.1  sk-learn 套件的安裝和解說
5.2. 監督式技術概念:線性回歸
5.3. 監督式技術概念:邏輯式回歸
5.4 監督式技術概念: SVM 支援向量機
5.5 監督式技術概念:Decision Tree決策樹
5.6 非監督式技術:K-means
5.7非監督式技術:PCA (主成分分析法)
5.8 強化式學習: Q-learning
5.9 深度學習: 循環神經網路的單一時序LSTM架構
5.10 深度學習: 循環神經網路的多時序LSTM架構

第六章:相依矩陣的重要性:如何解讀參數之間的關係
6.1 相依矩陣的說明
6.2 相依係數的判讀
6.3 工業數據的應用與解讀
6.4特徵值重要性的模型介紹

第七章: 評估指標的實作: 評估預測值與評估預測模型
7.1 混淆矩陣的實作-從醫療借鏡
7.2 混淆矩陣的計算和名詞
7.3 ROC曲線及AUC的繪製與判讀
7.4 MSE 判讀

第八章:ESG基本觀念與常見名詞介紹
8.1基本名詞解釋:從淨零碳排說起
8.2聯合國永續目標
8.3 ESG介紹與評級說明
8.4聯合國線上課程永續證書考取說明
8.5 英文永續考試題目解題
8.6 so14064-1 及Iso14064-2以及Iso14064-3說明

第九章:醫療應用篇
9.1心臟突發休克的實作案例
9.2糖尿病的預測
9.3 糖尿病預測進階研究
9.4病患用藥分類
9.5乳癌數據分析
9.6腎臟病數據集分析

第十章:工業應用篇
10.1工業應用:機台數據零件故障分析
10.2工業應用:製造業生產製程分析

第十一章: 永續生活篇
11.1 ESG 台灣上市公司揭露
11.2自來水質飲用分析
11.3 建築中的無人機橋樑影像檢測方法
11.4 台灣勞動力人口預測
11.5 人口出生率預測
11.6 登革熱數據集實作

第十二章: 生命教育篇
12.1中學學生輟學學生相依性分析
12.2自殺及憂鬱語意分析
12.3司法判決書查詢系統應用實作
12.4酒駕情形分析

第十三章:商業理論
13.1 分類模型評估會員卡核發
13.2 消費者的交易心態
13.3顧客忠誠度的簡單分群計數
13.4消費者的網站拜訪路徑分析
13.5 消費者的資料儲存概念

第十四章:商業應用
14.1 Google Analytics 4的介紹
14.2 Google Analytics 4的判讀

第十五章:電商平台分析
15.1常用的視覺化套件介紹(EDA)
15.2 Google Trend 基礎操作與目標
15.3 Google Trend API 製作關鍵字點擊分析
15.4 MOMO購物網站爬蟲抓取產品數據
15.5 MOMO購物網站分析產品競價策略
15.6 PCHOME購物網站爬蟲抓取產品數據
15.7 PCHOME購物網站分析產品競價策略
15.8 PTT上各版的輿論分析-以前100篇為例
15.9 PTT上各版的文字雲製作
15.10 套裝的文字雲工具與字詞記數
15.11 家樂福購物網站抓取產品資訊
15.12 愛買購物網站抓取產品資訊
15.13 大潤發購物網站抓取產品資訊
15.14 Costco 購物網站抓取產品資訊
15.15 酷彭購物網站抓取產品資訊
15.16 591租屋網爬蟲資訊抓取

第十六章:社群營運與Line的進階應用
16.1 IFTTT跨平台串接應用:基礎設定與介紹
16.2 IFTTT 跨平台串接應用:Line 和Gmail投放
16.3 Line Notify 的權杖申請
16.4 Line Notify 訊息投放
16.5 Line 貼圖和圖片投放
16.6 Line 爬蟲及時通知系統範例

第十七章: 生成式工具導入應用
17.1 Runway AI介紹
17.2 Gamma 快速投影片生成

第十八章: 無所不在的爬蟲技術
18.1如何熬一碗美麗湯(Beautifulsoup)
18.2 BS4和requests套件說明
18.3 爬蟲系統開發說明
18.4 chatGPT開發說明
18.5 維基百科文章抓取投放
18.6 蘋果基金會文章抓投放
18.7 成大醫院門診通知抓投放
18.8 原價屋賣場標題抓取投放
18.9 NBA PTT新聞抓取投放
18.10 各家新聞抓取投放
18.11 蕃薯藤文章投放
18.12 簡訊爬蟲實作
18.13 網頁爬蟲自動化

第十九章 : 資料庫應用
19.1 SQLite 的應用
19.2 MySQL 的應用
19.3 PostgreSQL 的應用
19.4 Flask 框架呈現

第二十章: 行銷證照考取與題型解析
20.1     Google Analytics 4證照考取題目解析
20.2    Gooogle 提高離線銷售認證考取題目解析
20.3 Google Adwords 取題目解析
20.4 Line 官方粉絲團證照考取題目解析


作者介紹


作者簡介

黃朝健

  早年投注於觸控IC和觸控模組的研發,從人因的互動設計開始進入科技業;後來負笈歐陸留學,指導教授為符號計算大師Burno Buchberger教授,同時也受業於Sepp Hochreiter教授的實驗室,後來在Hagenberg SoftwarePark的RISC公司實習,以醫療影像的研究為主,因疫情輾轉返台,遂協助大型製造業進行智慧製造的轉型,目前也受邀於雲嘉南分署、聯成電腦等企業界任教。

  學經歷:
  ■ 奧地利林茲大學資訊系碩士畢業
  ■ 教育部部定講師
  ■ 聯成電腦 講師
  ■ 勞動部雲嘉南分署大數據 講師
  ■ 台南失業者訓練班 講師
  ■ 勞動部產業人才投資方案課程Python、電商行銷、數據科學 講師
  ■ 高雄市勞動局產業新尖兵 講師
  ■ 台南市伽碩職訓中心講師
  ■ 數發部產業發展署 講師
  ■ AI GO講師生成對抗網路(數發部產業發展署)
  ■ AIGO 講師Kaggle 數據平台實戰 (數發部產業發展署)
  ■ 台灣產業發展協會ESG 種子師資
  ■ 國立政治大學電算中心技術師
  ■ 義隆電子研發工程師






相關書籍

無瑕的程式碼:整潔的軟體設計與架構篇

秒懂PPT|實戰技巧x特效運用x創意設計

SQL Server管理實戰(適用SQL Server 2022/2019)

ROBLOX 玩遊戲&做遊戲大寶典