這份對話紀錄主要圍繞在講者分享 Google Gemini 及其相關生態系工具(如 NotebookLM、AI Studio)的使用經驗與實測案例,並簡短討論了 AI Coding 工具(如 Cursor、Claude Code)。
以下是根據對話內容整理的結構化摘要:
- 會議目的:講者分享個人對 AI 工具的使用心得,並記錄重點供日後參考。
- 工具比較:講者近期主要訂閱使用 Gemini(認為 CP 值高),但也曾使用 ChatGPT。講者認為兩者在日常功能上差異不大,但目前傾向使用 Gemini。
- AI 會議記錄:提到目前 AI 生成會議紀錄技術已相當成熟,能有效節省時間。
講者詳細介紹了 Gemini 的幾個核心功能及其應用場景:
-
Deep Search(深度搜尋)
- 功能:針對複雜問題進行多層次、多次的 Google 搜尋(可能多達 50-100 個連結),最後整理出詳細的研究報告。
- 案例:講者曾用此功能整理史丹佛大學某個十週課程的 syllabus,生成一份完整的內容摘要。
- 特性:過程可能需要花費 20 至 40 分鐘,適合需要深入研究的題目(如醫學、財經報告),產出內容通順且附有參考文獻。
-
Canvas(畫布功能)
- 功能:生成文件(Markdown)、網頁或互動介面,而不僅僅是純文字對話。特別澄清此功能與設計軟體 Canva 不同。
- 案例:「菜單翻譯與點餐系統」。講者展示將日文菜單拍照後,讓 AI 翻譯並直接生成一個可點擊的電子點餐網頁介面,方便旅遊時與店員溝通。
-
Guided Learning(引導式學習)
- 功能:AI 扮演家教角色,一步步引導解題而非直接給答案。
- 案例:測試高中三角函數題目,AI 能像家教一樣逐步教學,適合學生自學。
- 核心概念:使用者上傳文件(PDF、網站、文字稿)建立專屬知識庫,AI 根據知識庫內容回答問題或生成內容。
- 生成簡報:
- 案例:講者協助朋友製作關於「雲林農夫與落花生」的演講簡報。將關鍵字與故事大綱輸入後,NotebookLM 生成了包含圖文的完整簡報。
- 優點:能生成精細度極高的圖表(如落花生生長階段圖),大幅提升完成度。
- 限制:生成的格式為 PDF,無法直接微調(需截圖加工),且可能有圖片版權的不確定性。
- 定位:面向開發者,提供更進階的 Token 計算、多模態(Multimodal)測試與 Web App 建置。
- Live 功能與多模態:
- 可與 AI 進行語音對話(練英文口說)。
- 能辨識音訊中的口音(如分辨澳洲口音)或聲音類型(如樂器聲)。
- Build Web App:
- 功能:透過自然語言描述需求,AI 直接生成完整的 Web App 程式碼,並可一鍵部署到 Google Cloud。
- 限制:通常鎖定在特定的技術框架下(如特定的 Frontend UI framework),若要開發更複雜產品仍需人工介入。
- 趨勢:討論從 "Vibe coding"(憑感覺寫扣)到真正工程化應用的轉變。
- 工具比較:
- Cursor:基於 VS Code 的 AI 編輯器,優勢在於整合開發環境,方便導覽程式碼。
- Claude Code (CLI):Anthropic 的命令行工具,擁有強大的 System Prompt,能處理 Context 壓縮。
- AI 協作流程:
- 講者展示與 AI 協作開發「分帳 App」的過程。AI 負責撰寫 Spec 文件、生成程式碼、設定 GitHub Workflow、執行測試(Test)甚至除錯(Debug)。
- 強調未來開發流程將是人與 AI 協作,由 AI 執行測試與修復簡單 Bug,人負責架構與審核。
講者認為 AI 工具(尤其是 Google 生態系)已能高度整合「從發想到部署」的流程。雖然仍有限制(如 NotebookLM 的 PDF 格式、AI Studio 的框架限制),但善用這些工具能極大化生產力,特別是在學習、研究整理及快速原型開發上。