激發你的創客魂!手把手建立完整的語音助理裝置,並加入RGBLED燈模擬家用設備,讓ChatGPT不再只是文字對談對象,更可以成為我們的生活小幫手。
電影裡的智慧語音助理令許多人十分嚮往,不僅對話方式與人類相像,還擅長控制各種硬體設備,而這類電影情節即將成真,如今有強大的大型語言模型可以作為AI語音的核心,聊天對話已是基本,AI語音連接真實世界的硬體設備更是未來趨勢。
本套件將會帶各位把GPT連結到ESP32中,透過語音設備跟語言模型對話;並為語言模型建立各式各樣的擴充功能:
●聲控燈:由AI根據語意判斷使用者想要的RGB燈色,不管是金鳳凰色、暖色等形容詞,AI都可以幫我們調出該顏色。
●高鐵/台鐵車次查詢:AI自動串接API,取得所需的車次資料後告訴你最合適的車次。
●即時口譯機:利用語言模型強大的理解能力,將你想翻譯的詞句轉換成別的語言,並口述給你聽。
●天氣預報員:有了連網功能的AI如虎添翼,任何資訊只要能Google到就可以餵給AI,讓他成為小小萬事通。
●YouTube音樂點播助理:AI判斷你想聽的歌曲下載並播放YouTube音樂。
如果你有更多想法與創意,都可以自行擴增功能給AI使用,例如:取得電影時刻、股價查詢、新聞快訊等等,讓他成為你個人的最強助理。
本書特色
●讓AI融入生活!!!覺得這裡光線太暗,跟AI說一聲直接幫你開燈。
●查高鐵、台鐵車次不用再親自查找網頁,語音助理自動找尋最合適的車次與資訊。
●即時口譯機,學習外文的好幫手。
●未來天氣如何?即時天氣預報員報你知。
●YouTube音樂點播助理,說出歌名就能播放音樂。
●使用ESP32控制板與獨立電池盒,只要連網就能呼叫語音助理。
●可塑性高的擴增功能,輕鬆打造個人化助理。
FLAG’S 創客‧自造者工作坊 用創客玩 ChatGPT x Python AI 語音大應用
相關推薦清單
內容描述
目錄大綱
CH01 AI語音的核心- ChatGPT 簡介
1-1 ChatGPT 的聰明之處
1-2 AI 語音助理的架構
CH02 微控制器- ESP32 與 Thonny 簡介
2-1 本套件的架構
2-2 ESP32 控制板簡介
2-3 安裝 Python 開發環境
2-4 安裝與設定 ESP32 控制板
2-5 認識硬體
2-6 ESP32 的 IO 腳位以及數位訊號輸出
LAB01 閃爍LED燈
CH03 錄放音機
3-1 按鈕開關
LAB02 按鈕控制LED燈
3-2 麥克風原理
LAB03 實作錄音機
3-3 用喇叭播放聲音
LAB04 實作回聲機
3-4 音訊插座模組
LAB05 實作音樂播放器
CH04 在本機建立伺服器
4-1 建立伺服器 - Server 端
LAB06 在本機端建立 Server
4-2 下載 Server 上的語音檔
LAB07 下載音檔
4-3 上傳語音檔至 Server
LAB08 上傳音檔
CH05 使用 OpenAI API 實作語音辨識
5-1 語音辨識原理
5-2 認識 OpenAI API
LAB09 實作語音辨識
5-3 認識 RGB LED 燈
LAB10 控制 RGB LED 燈
5-4 語音聲控燈
LAB11 語音口令聲控燈
CH06 建立 GPT 助理
6-1 AI 聊天模式
LAB12 和 GPT 聊天
6-2 文字轉語音
LAB13 實作 AI 念稿機
LAB14 GPT 語音對話
CH07 外文好夥伴-口譯機
7-1 認識 Function Calling
LAB15 實作口譯機
CH08 語言模型萬事通-連網取得更多資料
8-1 讓語言模型取得即時資訊
LAB16 取得網路搜尋結果
LAB17 即時氣象預報員
CH09 高鐵/台鐵時刻播報
9-1 TDX 服務
LAB18 取得時刻表
9-2 AI 分析時刻表
LAB19 車次規劃助手
CH10 YouTube 點歌助理
10-1 下載 YouTube 音樂
LAB20 結合 pytube 下載音樂
10-2 個人點歌助理
LAB21 點歌小幫手
CH11 客製化語音助理-擴增功能
11-1 整合功能
LAB22 AI 配色聲控燈
11-2 突破電腦連接限制- ngrok
LAB23 隨身 AI 助理
組裝產品料件:
ESP32 1 組
小喇叭 1 組
麵包板 1 片
電池盒 1 個
按壓開關 3 個
RGB LED燈 1 個
杜邦線公-公 1片
杜邦線公-母 1片
Micro USB 數據線 1 條
MAX98357 音訊放大器 1 組
INMP441 麥克風模組 1 組
TRRS 音訊插座模組 1 組