AI 能力邊界 · Workplace Guide

LLM 的能力邊界與職場應用指南

瞭解 LLM 擅長什麼、不擅長什麼、邊界在哪裡，以及如何向不同對象說明 AI 工具的定位。

LLM 擅長「表達與整理」，人負責「判斷與決策」

LLM（大型語言模型）就是 ChatGPT、Claude、Gemini 這些「會聊天的 AI」背後的大腦。它讀過幾乎全部網路上的文字，所以「什麼都懂一點」，可以幫你寫文章、回答問題、翻譯。

但它有些事情真的做不到，硬要它做就會出錯。這頁就是要告訴你：哪些事可以放心交給 AI，哪些事一定要自己檢查。

🎓 學校比喻：LLM 像一個讀過無敵多書的同學——他很會寫作文、很會解釋概念，但他不知道今天的午餐菜單（即時資訊）、沒有計算機那麼會算數學（精確計算）、也會偶爾自己編答案還說得很有自信（這就叫「幻覺」）。

擅長 vs 不擅長

從任務性質快速判斷是否適合交給 LLM

擅長做的事

✍️語言與文字處理草稿撰寫、潤稿、改寫、翻譯、摘要、語氣調整

🧩結構化思考輔助列選項、比較優缺點、拆解問題步驟、腦力激盪

📚知識整合與解釋快速解釋陌生概念、跨領域類比、彙整最佳實踐

💻程式與邏輯任務寫程式、解釋程式、Debug、資料格式轉換

📋整理與格式化會議記錄整理、長文濃縮、標準化輸出格式

不擅長 / 不能做的事

📰即時資訊知識有截止日期，無法掌握最新新聞、股價、法規

🔢精確數字計算複雜數學容易出錯，不該直接信任財務試算結果

🏢內部資訊不知道你公司的資料、系統、人事狀況

🔍事實查核可能「幻覺」，捏造聽起來合理但錯誤的資訊

⚖️高度個人化建議法律、醫療、財務建議需專業人士負責

🧠持久記憶原本不會記得，現在 ChatGPT、Claude 有加上記憶功能，但不一定可靠

系統性限制一覽

這些不是 bug（程式錯誤），而是 LLM 本身運作方式造成的「天生限制」——就像鳥不會游泳一樣，是天生的特性

限制	說明	對應做法
即時資訊	知識有截止日期，不知道最新的新聞、政策、資料例如 AI 不知道今天天氣	搭配網路搜尋工具或 RAG（讓 AI 邊查資料邊回答）補足
數字計算	AI 是「用統計猜下一個字」的方式運作，不是真的會算數學，所以複雜計算容易錯	複雜計算交給 Excel 或請 AI 寫程式來算
幻覺	可能捏造聽起來合理但錯誤的事實、引用、數據例如 AI 編造不存在的法條	事實類輸出一律人工查核
記憶有限	原本每次對話結束就清空。現在 ChatGPT、Claude 有加記憶功能，但不是百分百可靠	重要背景每次對話開頭重新提供，不要只依賴 AI 記得
Context 上限能讀的文字量	單次對話能處理的文字量有上限，太長的文件會被截斷或遺忘前面內容	長文件分段處理，或使用 RAG（檢索式問答）
無法執行行動	原本只能輸出文字，不能自動寄信、存檔、操作系統	需串接 Agent 或工具才能執行實際動作
長遠判斷	「這個決策對公司 3 年後的影響」這種需要全面評估的事，AI 給的答案不能盡信	LLM 提供思考框架，最後決策由人來做

邊界判斷框架

面對任何任務，用這個框架快速判斷 LLM 的參與程度

可以讓 LLM 生成初稿

輸出可被人驗證且修改成本低。例如草稿、翻譯、摘要、程式碼片段。

要特別小心，需人工複查

輸出難以被輕易驗證。例如事實性陳述、數字、引用來源。

LLM 只能輔助，不能決策

涉及法律、財務責任或無法復原的行動。LLM 提供資訊，人負責決定。

輸出可被人快速驗證→適合 LLM 生成

輸出無法被輕易驗證→需人工複查

涉及法律 / 財務責任→人做決策

需要公司內部資料→需搭配 RAG

涉及對外的不可逆行動→人工確認

對不同對象的說明方式

點擊展開各對象的說明話術與溝通重點

主管 / 老闆強調效率增益，不取代判斷

「LLM 可以幫我們把過去要花 2 小時寫的報告初稿壓縮到 20 分鐘，但最終內容仍需要由我們審閱、補充內部數據並確認正確性。它加速的是生產力，不是取代判斷力。」

重點：效率數字 + 人仍在決策迴圈中 + 內容品質由人把關

同事用熟悉的比喻拉近距離

「把它想成一個博學但沒有在你公司待過的新人——文字能力很強、什麼都知道一點，但需要你給它脈絡，也需要你 review 它的輸出。」

重點：降低神秘感 + 說清楚需要人配合的地方 + 不誇大能力

法務 / 合規強調人工審核與責任歸屬

「我們使用 LLM 生成的內容都會經過人工審核，不直接對外發布。LLM 不接觸機敏資料，也不做最終決策。所有對外的文件與建議，責任仍由我們的團隊承擔。」

重點：資料邊界 + 審核機制 + 責任歸屬清楚

客戶說明品質把關，不迴避 AI 的使用

「我們借助 AI 工具提升交付效率，但所有對外內容、建議與分析均由我們的專業團隊負責審核與把關。」

重點：不迴避使用 AI + 強調專業審核 + 品質由人負責

新進員工建立正確的使用心態與習慣

「先讓它生成一個 80 分的初稿，你再把它改到 100 分。但永遠記得：它說的事實需要你查證，它不知道我們公司的內部狀況，數字更要特別小心。」

重點：80 分初稿心態 + 三個必查的點（事實、內部資訊、數字）

💡

LLM 擅長「把事情說清楚、寫出來」，不擅長「確認事情是否為真、決定事情該怎麼做」。

讓它處理「表達與整理」，讓人負責「判斷與決策」。

工具選擇框架 · Decision Framework

判斷任務適合哪種 AI 工具

從「一次性問答」到「跨系統自動化代理」，三種工具各有適用場景。回答 5 個問題，快速得出選型建議。

Chat AI 自動化腳本 AI Agent

遇到一個工作任務，你要先想：這件事適合哪種「AI 員工」幫你做？ 三種類型其實很好分：

💬 Chat AI：像「家教老師」——你問一句他答一句，每次都要你親自找他。
🖥 自動化腳本：像「自動洗碗機」——每天固定時間自己跑一次，做同一件事。
🤖 AI Agent：像「智能助理」——你只下大方向，它會自己判斷該怎麼做、做幾步才完成。

💡 口訣：不確定時，永遠先用 Chat 試試看。Chat 不夠用再考慮升級成腳本，腳本不夠才考慮做 Agent——因為越上面成本越高、越難維護。

互動判斷工具

回答 5 個問題，得出建議工具與使用要點

各維度比較表

從頻率、判斷類型、整合複雜度等角度全面對比

判斷維度	💬 Chat AI	🖥 自動化腳本	🤖 AI Agent
重複頻率同類任務多常跑	一次性、偶爾	固定週期	持續、事件觸發
資料來源輸入從哪裡來	你自己貼進來	固定路徑 / API	多源動態獲取
輸出去向結果怎麼用	你自己處理	寫入指定位置	觸發後續行動
判斷複雜度需要多少邏輯	高（AI 判斷）	低（固定規則）	中～高（多步驟）
人工參與需要人在場嗎	全程人工	可無人值守	可全自動
外部系統整合要串接其他工具	不需要	有限串接	高度串接
開發成本建置需要的資源	零（直接用）	低～中（寫腳本）	中～高（架構設計）
維護難度上線後的負擔	無	低（偶爾更新）	中（需監控）
風險容忍出錯的代價	可即時修正	錯誤可重跑	需審計機制

💬 Chat AI 典型場景

寫信、潤稿、改寫
腦力激盪、提案構思
理解文件、解釋概念
臨時資料分析
決策前的快速諮詢

🖥 自動化腳本典型場景

每週報表自動彙整
CSV 格式批次轉換
資料清洗 Pipeline
定時截圖 / 存檔
固定格式文件生成

🤖 AI Agent 典型場景

客服自動分流回覆
多系統資料交叉比對
監控 + 異常自動通知
複雜審核流程自動化
跨平台資料同步決策

梳理工作的 5 步驟 SOP

面對任何一項工作任務，依序回答這 5 個問題

01

描述任務行為

用一句話說清楚：「誰在什麼情況下，把什麼輸入，處理成什麼輸出」。這是判斷的基礎，模糊的任務描述會導致錯誤選型。

全類型必做

02

問「這件事多常做？」

一次性 → Chat。固定週期（每天/每週做）→ 考慮腳本。事件觸發（有新資料就跑）→ 考慮 Agent。
📌 為什麼問頻率？越常做的事，越值得自動化——自動化要花時間建置，但建好後可以幫你省下很多時間。這就是「投資報酬率（ROI）」的概念。

腳本門檻Agent 門檻

03

問「需要 AI 判斷，還是固定規則？」

如果處理邏輯是固定的（用「如果 A 就做 X，如果 B 就做 Y」的規則能寫完）→ 純腳本就夠。如果需要理解文字意思、分類模糊情況、寫文章 → 才需要 AI。
📌 例子：「把所有金額超過 1000 的訂單標紅色」→ 固定規則，用 Excel 公式就行。「判斷這封客訴的情緒嚴重程度」→ 需要 AI。

語意判斷 → Chat / Agent固定邏輯 → 腳本

04

問「需要串接其他系統嗎？」串接 = 讓 AI 跟其他軟體互通

不需要 → Chat 或腳本。需要讀 / 寫一個系統（如 Gmail、Google Sheets、資料庫）→ 腳本。需要跨多個系統，又要看狀況做不同決定 → Agent。
📌 例子：Agent 場景就像「收到 Email → 判斷是否客訴 → 查訂單 → 填表單 → 通知主管」，跨好幾個系統，每一步都要看狀況決定。

單系統串接跨系統協調

05

評估「錯誤代價 × 開發成本」

自動化出錯不好修正時，先用 Chat 人工驗證流程。Agent 的成本（設計、測試、監控）遠高於 Chat 數倍——確認 ROI（投資報酬率，划不划算）後再投入。先從最小可行方案開始。

低風險驗證期高 ROI 才升級

Quick Reference · 快速判斷口訣

一次性 + 需要判斷💬 Chat AI

重複性 + 固定規則🖥 自動化腳本

重複性 + 需要判斷 + 串接系統🤖 AI Agent

⚠ 不確定時，永遠先從 Chat 開始驗證流程，再評估是否需要升級。

術語庫 · Team Glossary

AI 術語庫團隊共識版

涵蓋基礎架構、輸入輸出、記憶與知識、應用代理、品質風險、訓練優化六大分類，30 個核心名詞，每個術語附定義與類比說明。

30 個核心術語 · 6 大分類 · 可搜尋

AI 領域有很多英文縮寫和專有名詞（LLM、RAG、Token、Embedding…），每個人理解可能不一樣。當主管說「我們來做一個 RAG 系統」，工程師、PM、行銷各自想的東西可能差很多，會議就吵不出結論。

這份術語表把每個詞用「白話定義 + 生活類比」說清楚，讓團隊有共同語言。點任何一個詞展開，就能看到它的意思和類比。

🔍 用法：不確定某個詞的意思？直接搜尋。看到「相關術語」按鈕？點下去可以跳到那個詞的解釋。

電腦基礎 · CS Fundamentals

AI 時代應具備的電腦 / 程式基礎

不需要成為工程師，但這些知識能讓你更有效地使用 AI 工具、看懂技術討論、並在協作中不掉隊。每個主題附有實際範例與 AI 應用場景說明。

非工程師也需要知道的技術基礎

AI 時代不是「不用學技術了」——反而是「人人要懂一點點」。為什麼？因為當你跟 AI 合作時，AI 寫出來的東西常常是程式碼、JSON、HTML、SQL⋯⋯你要能「看得懂大概在幹嘛」，才能判斷它寫的對不對、也才能要求它改。

🎯 目標不是會寫程式，是會「讀」程式——看到 AI 寫的東西，知道它在做什麼，知道哪裡可能有問題。就像不會修車的人也可以聽得懂修車師傅在說什麼一樣。

每個主題的難度都有標示：1 顆點 = 看得懂就好，2 顆點 = 偶爾用得到，3 顆點 = 需要練習。先從 1 顆點的開始就好。

核心技術項目

按類別篩選，點擊展開範例與說明

Prompt Engineering · 實戰手冊

Prompt Engineering 實戰手冊

不需要改動模型，只靠調整輸入就能大幅提升 AI 輸出品質。這是門檻最低、回報最高的 AI 核心技能。

同一個模型，好的 prompt 可以讓輸出差距超過 10 倍

Prompt（提示詞）就是你打給 AI 的訊息。學會寫好 Prompt，就像學會跟一個能力很強但完全不認識你的人溝通——他什麼都能做，但你要說清楚「你是誰」、「我要什麼」、「以什麼形式給我」，他才能真正幫到你。

🍔 點餐的比喻：對店員說「給我一份東西」會收到什麼？運氣好可能是漢堡。
對店員說「給我一份雙層牛肉起司堡，不要洋蔥，套餐配可樂，外帶」——你才能準時拿到想要的東西。
跟 AI 溝通也是同樣道理：說得越具體，得到的東西越接近你想要的。

本頁有 5 個分頁：基礎必學（先看這個）、進階技法、格式控制、除錯修正、框架模板（用現成公式套用）。

Prompt 黃金公式

一個完整的 prompt 由這幾個元素組成，視任務複雜度選擇需要的元素

完整 Prompt 結構

角色定義 + 背景脈絡 + 明確任務 + 輸出格式 + 範例（選）

完整範例：一封拒絕 Vendor 的商業信件

你是一位資深業務主管，擅長維護長期合作關係。（角色）我們公司正在評估一家新的 SaaS 供應商，但最終決定不採購。對方是我們過去的合作夥伴，關係需要維持。（背景）請幫我寫一封拒絕信，說明我們暫不採購的原因，但保留未來合作的可能性。（任務）要求： - 長度約 150 字 - 語氣：專業但友善，不要冷漠 - 格式：直接給信件內容，不需要解釋（輸出格式）

→ 包含四個元素，AI 清楚知道身份、情境、目標和交付物

核心技巧

點擊展開每個技巧的說明與對比範例

LLM 沒有讀心術。「幫我寫好一點」是最常見的爛 prompt——AI 不知道「好」的標準是什麼。你的 prompt 要讓一個沒有任何背景的陌生人也能完成這個任務。

❌ 模糊

幫我把這份報告寫好一點，讓它看起來更專業。

✅ 具體

請改寫這份季報摘要，目標讀者是不熟悉技術的投資人。要求：(1) 把技術術語換成白話說明 (2) 段落不超過 3 句 (3) 數字都加上比較基準（如「比上季成長 12%」)

描述「對誰說、說什麼、達到什麼效果」這三件事

用條列式列出限制條件，比長段文字描述更有效

如果你不知道怎麼具體描述，先問 AI：「完成這個任務需要哪些資訊？」

告訴 AI 它是誰，能快速調整輸出的語氣、深度和立場。角色定義越具體，效果越好——不只說「你是工程師」，要說「你是有 10 年經驗、擅長向非技術主管簡報的資深工程師」。

❌ 無角色

解釋一下什麼是 API。

✅ 有角色

你是一位擅長向非技術背景主管解釋技術概念的工程師。請用一個日常生活的比喻，解釋 API 是什麼，不要使用任何技術術語。

「你是 X，擅長 Y，面對 Z 類型的讀者」是基本格式

也可以讓 AI 扮演批評者：「你是一位嚴格的編輯，請找出這篇文章的問題」

需要多角度分析時，可以讓同一個問題從不同角色分別回答

AI 不知道你的公司、你的讀者、你的限制。你給的背景越多，輸出就越貼近你的實際需求。不要假設 AI 知道你在說什麼。

❌ 沒有脈絡

幫我寫一個產品介紹。

✅ 有脈絡

我們是一家 B2B SaaS 公司，產品是 HR 系統，主要客戶是 100～500 人的製造業。我要在下週的客戶說明會上用 2 分鐘介紹新功能「AI 排班」。請幫我寫一段開場白，強調這個功能能減少多少人工作業時間。

背景四要素：「誰要用、給誰看、在哪裡用、達到什麼目的」

可以直接把相關資料（文件、數據、舊版本）貼進去讓 AI 參考

建立一份常用的「公司背景 prompt 模板」，每次直接貼在前面

如果你不說要什麼格式，AI 會自己決定——而它的決定不一定符合你的需求。明確說出你要的結構、長度、風格，能省下大量的後製工作。

常用格式指令範例

// 長度控制「請用 3 句話內回答」「摘要控制在 150 字以內」「詳細說明，至少 500 字」 // 結構指定「請用條列式呈現，每點不超過 20 字」「請用表格比較，欄位：功能、優點、缺點」「請分三段：問題描述、影響分析、建議行動」 // 語氣風格「語氣要正式，適合對外的商業信件」「用輕鬆的口語，像在跟朋友解釋」「避免使用 AI 常見的空泛語句如『當然』『非常重要』」 // 排除不要的內容「不要加前言和結語，直接給內容」「不要解釋你在做什麼，直接輸出結果」「不要用 Markdown 格式，純文字即可」

「直接給我___，不需要解釋」能大幅縮短輸出長度

要 JSON 格式時說「請只輸出 JSON，不要加任何其他文字」

如果輸出要貼進特定工具（Notion、Slack、Email），說明目標平台

要求 AI 在回答前先寫出推理過程，能顯著提升複雜問題的準確率。原理是讓 AI「邊想邊說」，而不是直接跳到結論——就像要求學生「寫出解題過程」一樣。

❌ 直接要答案

這個定價策略有什麼問題？

✅ 要求逐步推理

請一步一步分析這個定價策略：先列出它的假設前提，再評估每個假設是否成立，最後指出最關鍵的問題點。

觸發詞：「讓我們一步一步想」「請先分析___，再___」「先列出___，然後___」

特別適合：法律合約分析、財務數字驗算、複雜決策評估

如果只要最終結論，可以在最後加：「完成分析後，只給我最終建議，不要重複過程」

與其用文字描述你要的格式，不如直接給幾個範例。AI 從範例中學習的效果，遠比描述性文字更精確。特別適合需要特定風格、格式或判斷標準的任務。

Few-shot 結構範例：客服回覆分類

請判斷以下客服信件屬於哪個類別，只回覆類別名稱。類別：退款申請 / 技術問題 / 功能詢問 / 其他範例1：信件：「我的訂單已超過 30 天還沒到貨，請問能退款嗎？」答：退款申請範例2：信件：「登入時一直顯示密碼錯誤，但我確定密碼是對的」答：技術問題範例3：信件：「請問你們的系統支援 API 串接嗎？」答：功能詢問 --- 現在請判斷：信件：「我剛升級到 Pro 方案，但帳單金額好像不對」答：

給 2～5 個範例通常就夠了，過多反而增加 token 成本

範例要涵蓋你最想控制的邊界情況，不只是最簡單的例子

若輸出風格要像你自己，直接貼 2～3 個你過去寫的版本作為範例

同時告訴 AI「要做什麼」和「不要做什麼」，能大幅縮小它的自由發揮空間。只給正面指令，AI 可能會做你沒預期到的事；加上負面指令，能有效排除不想要的輸出。

正面 + 負面指令範例

請幫我寫這份技術文件的摘要。 ✅ 要： - 用非技術背景的主管能看懂的語言 - 3 個重點，每點 1～2 句 - 最後一句說明下一步行動 ❌ 不要： - 不要使用任何技術縮寫（API、SDK、CI/CD 等） - 不要重複文件中已有的數字和統計 - 不要加「這份文件提到...」之類的開頭語

把你過去常常被 AI「踩雷」的地方整理成負面指令清單

「不要使用 AI 常見的空泛語句」是萬用負面指令

每次 AI 輸出讓你不滿意，想想是「正面指令不夠明確」還是「少了某個負面指令」

把複雜任務一次丟給 AI，品質通常不如分步驟完成。先讓 AI 做步驟一，確認結果後再進行步驟二，每一步都能人工把關，最終品質遠高於一次生成。

撰寫市場分析報告的分步流程

步驟 1：「請列出分析這個市場需要涵蓋的 5 個主題，每個主題一行說明」 → 人工確認主題完整性步驟 2：「針對主題一『市場規模』，請列出需要蒐集的資料來源和關鍵數字」 → 人工補充實際數據步驟 3：「根據以下數據，幫我寫主題一的分析段落（200字）：[貼入數據]」 → 人工 review，重複步驟3至步驟N 步驟 N：「把以下各段落整合成一份完整報告，統一語氣和格式」

原則：每一步的輸出都要能被你驗證，確認後再進入下一步

適合場景：長文撰寫、多面向分析、需要查核事實的任務

可以讓 AI 自己建議拆解方式：「這個任務應該怎麼分步驟完成？」

當 prompt 裡同時有「指令」和「要處理的內容」，AI 有時會搞混兩者。用明確的分隔符號把它們區開，能讓 AI 清楚知道哪個是指令、哪個是資料。

常用分隔符號範例

// 使用三引號請摘要以下文章，200字以內： """ [貼入文章內容] """ // 使用 XML 標籤（最清楚）請比較以下兩份合約的差異，列出重要不同點： <合約A> [貼入合約A內容] </合約A> <合約B> [貼入合約B內容] </合約B> // 使用 --- 分隔線以下是背景資訊： --- [背景資料] --- 根據以上背景，請回答：[你的問題]

XML 標籤最清楚，用 <文件>、<資料>、<範例> 標記不同區塊

貼入長文件或程式碼時，分隔符號特別重要

多段內容要比較時，用一致的標籤命名如 <版本A> <版本B>

當 AI 的輸出要進入下一個流程（貼入試算表、程式處理、系統匯入），指定結構化格式能省下大量手動整理的時間。

要求 JSON 輸出範例

從以下客戶意見中，提取關鍵資訊。請只輸出 JSON，不要加任何說明文字或 markdown 符號。格式： { "sentiment": "正面|負面|中性", "main_issue": "一句話描述主要問題", "urgency": "高|中|低", "suggested_action": "建議的回覆動作" } 客戶意見： [貼入客戶留言]

說「只輸出 JSON，不要加任何其他文字」是關鍵，否則 AI 常會加前言說明

要輸出表格時，說「請用 Markdown 表格格式，欄位為：___」

批次處理時，要求 AI 輸出 JSON array：[{}, {}, {}]

把常用的 prompt 整理成模板，用 [變數] 標記每次需要替換的部分。好的模板是團隊的共同資產——讓每個人都能用最佳的 prompt，不需要每次從零開始。

模板範例：週報草稿

你是一位[職位]，正在撰寫給[上級/團隊]的週報。本週完成事項： [條列本週完成的工作] 遇到的問題： [如有，列出卡關的地方] 下週計畫： [列出下週要做的事] 請將以上內容整理成一份週報，格式要求： - 語氣：[正式/輕鬆] - 長度：不超過 300 字 - 結構：本週回顧 → 問題與解決 → 下週展望 - 不要加任何前言，直接給週報內容

用 [方括號] 標記變數，讓模板一眼就能看出哪裡要填

建議建一個團隊共用的 prompt 範本庫（Notion 或 Google Doc）

每次 AI 輸出特別好，就把那次的 prompt 存下來當模板

AI 輸出不理想時，大多數人的反應是「再試一次」或「換個方式問」——但如果不修改 prompt，結果不會有根本改變。用這個診斷流程找出問題根源。

輸出不好的診斷清單

輸出太長 / 太短？ → 加上明確的字數或段落限制輸出格式不對？ → 明確指定格式（條列/表格/段落）內容方向偏了？ → 補充背景脈絡，或加負面指令排除不要的方向語氣不對？ → 給角色定義，或貼一個語氣範例事實錯誤 / 幻覺？ → 把正確資訊貼入 prompt，讓 AI 根據你的資料回答 → 或分步驟：先讓 AI 列出它的假設，再讓你驗證輸出過於通用，不夠具體？ → 加入「針對 [具體情境/產業/對象]」 → 提供更多公司/產品的具體資訊 AI 加了一堆你不要的東西？ → 加負面指令：「不要___」「不需要___」

每次修改只改一個地方，這樣才能知道是哪個改動有效

可以直接問 AI：「我的 prompt 有什麼不清楚的地方？」讓它幫你診斷

把「失敗的 prompt + 不好的輸出 + 修正後的 prompt」記錄下來，建立你的除錯筆記

當你自己還不確定要什麼，與其讓 AI 亂猜，不如先讓它問你問題。這個技巧能幫你釐清自己的需求，同時讓 AI 蒐集足夠的資訊再動手。

❌ 直接叫 AI 做

幫我規劃一個 AI 培訓課程。

✅ 讓 AI 先問

我想規劃一個給公司員工的 AI 培訓課程。在你開始設計課程之前，請先問我 3～5 個最重要的問題，幫助你了解我的需求和限制。

「在你開始之前，請先問我需要哪些資訊」是萬用起手式

適合場景：策略規劃、文案撰寫、設計方案——任何需求還不清晰的創意工作

也可以反過來：先讓 AI 給你一個草稿，再根據草稿告訴它哪裡要調整

不要期待 AI 一次就給出完美輸出。把它當成初稿工具，你來指導修改方向——每一輪迭代都更接近你要的結果。有效的迭代指令比重新寫 prompt 更有效率。

高效迭代指令範例

// 指定修改方向（不是「改好一點」）「第二段太學術，改成更口語的說法」「結尾太突然，幫我加一個行動號召」「把整體語氣調得更有自信，減少不確定的措辭」 // 局部修改「只改第三點，其他保持不變」「保留整體結構，但把所有數字換成百分比表示」 // 提供對比「這個版本比上一版差在：___，請根據這個方向改」 // 讓 AI 提建議「你覺得這段哪裡可以更好？給我 3 個建議」「如果你是讀者，這份文件最讓你困惑的地方是什麼？」

指定「只改___，其他不動」能避免 AI 把你滿意的部分也改掉

讓 AI 扮演批評者：「你覺得這份文件最大的問題是什麼？」

如果改了幾輪還不對，重新開一個對話，把最好的版本貼進去重新說明需求

什麼是 Prompt 框架？

Prompt 框架是有命名的結構化模板，把「寫好 Prompt 需要的要素」整理成容易記憶的縮寫。不需要全部記住，選一個適合當前任務的框架套用就夠了。每個框架展開後都有直接可用的填空模板。

三個元素，最易上手的框架。先定義 AI 的角色（Role），再說明要做的任務（Task），最後指定輸出格式（Format）。適合所有日常工作的快速 prompt。

R

Role

你是誰

T

Task

做什麼

F

Format

如何輸出

填空模板

你是一位[Role：職位/角色/專業]。請[Task：具體要做的事]。輸出格式：[Format：條列式 / 表格 / 段落 / JSON / 200字摘要…]

實際範例：客訴信件回覆

你是一位有 10 年經驗的客服主管，擅長化解客戶不滿。（Role）請根據以下客訴內容，撰寫一封專業的道歉與解決方案信件。（Task）客訴內容：「訂單超過預計到貨日 5 天，完全沒有任何通知。」輸出格式：正式商業信件格式，包含：開頭道歉、問題說明、具體補償方案、結尾承諾，全文不超過 200 字。（Format）

RTF 是最通用的框架，95% 的日常任務用這三個元素就夠

Role 越具體越好：「資深 B2B 行銷經理，擅長 SaaS 產品」比「行銷人員」有效

Format 記得包含長度限制，否則 AI 可能輸出過長

以「終點」為導向的框架。先說明任務情境（Task），再描述需要 AI 採取的行動（Action），最後明確說明最終目標（Goal）。特別適合需要 AI 幫你達成特定商業目標的場景。

T

Task

情境是什麼

A

Action

做什麼動作

G

Goal

達成什麼

填空模板

任務情境：[Task：現在的狀況、背景、要處理的素材] 請執行以下行動：[Action：具體要 AI 做什麼，越具體越好] 最終目標：[Goal：這個輸出要幫我達成什麼，讓 AI 理解成功的標準]

實際範例：產品上市文案

我們即將推出一款 AI 自動排班系統，目標客戶是 100–500 人的製造業 HR 主管。這是主打功能列表：[貼入功能列表]（Task）請撰寫一段 LinkedIn 廣告文案，強調「節省時間」和「減少排班衝突」兩個核心價值。（Action）目標是讓看到廣告的 HR 主管點擊「了解更多」，文案需在 3 秒內引起共鳴，150 字以內。（Goal）

TAG 的關鍵是在 Goal 裡說清楚「成功的標準是什麼」，讓 AI 有方向感

Task 提供情境，Action 說明操作，Goal 說明為什麼——三者缺一會讓輸出失焦

適合行銷文案、提案撰寫、說服性內容等有明確轉換目標的任務

源自廣告寫作的經典結構：先描述現狀痛點（Before），再描述理想目標（After），最後讓 AI 提供連接兩者的橋樑方案（Bridge）。特別適合說服類、提案類、行銷類內容。

B

Before

現在的痛點

A

After

理想的未來

B

Bridge

如何到達

填空模板

現況（Before）：[描述目標受眾目前面對的問題、痛點、困境] 理想狀態（After）：[描述解決問題後的理想情境，越具體越有畫面感] 請幫我撰寫一段[文案類型：官網首頁文案 / 提案開場 / Email 標題…]，橋接以上兩個狀態（Bridge），說服[目標受眾]採取[具體行動]。

實際範例：向管理層提案 AI 導入

現況（Before）：我們的客服團隊每週花 30 小時手動分類客訴信件，錯誤率約 15%，導致客訴升級比例偏高、客戶滿意度下滑。理想狀態（After）：AI 自動分類準確率達 95%，客服人員只需處理複雜案件，每週節省 25 小時，客戶滿意度提升 20%。請幫我撰寫一份向 CTO 提案的簡報開場白（Bridge），讓他支持 AI 客服分類系統的 3 個月 pilot 計畫，語氣要數據導向、務實不誇張，200 字以內。

Before 的描述越貼近受眾的真實痛點，Bridge 的說服力就越強

After 要具體量化：「節省 25 小時」比「節省很多時間」有力

也可以用 BAB 框架讓 AI 幫你分析現狀 → 提出改善目標 → 規劃行動方案

四個元素涵蓋了高品質 prompt 的所有層面：背景脈絡（Context）、要執行的行動（Action）、期望的結果（Result）、加上具體範例（Example）。是需要高精準度輸出時的首選框架。

C — Context

誰、在什麼情況下、背景是什麼

A — Action

要 AI 執行的具體行動

R — Result

期望的輸出形式與成功標準

E — Example

一個或多個具體範例（Few-shot）

填空模板

背景（Context）：[公司/產品/對象/情境的完整描述] 行動（Action）：請[具體要做的事：分析 / 撰寫 / 翻譯 / 分類…] 結果（Result）：輸出格式為[格式說明]，長度[字數/條數]，語氣[正式/輕鬆/說服性]，成功標準是[判斷輸出好壞的標準]。範例（Example）：輸入：[範例輸入] 輸出：[期望的範例輸出]

實際範例：客服信件情緒分類

背景（Context）：我們是一家電商公司，每天收到約 500 封客服信件。我需要一個工具幫我分類客戶情緒，讓高憤怒度的信件優先處理。行動（Action）：請分析以下客服信件的情緒，判斷憤怒程度。結果（Result）：只輸出一個 JSON 物件，包含 emotion（生氣/失望/中性/開心）、anger_score（1–5）、priority（high/medium/low）三個欄位。不要加任何說明文字。範例（Example）：輸入：「這已經是第三次延誤了！我要求立刻退款！」輸出：{"emotion":"生氣","anger_score":5,"priority":"high"}

CARE 的 E（Example）是最容易被省略但效果最好的元素，強烈建議加入

Result 要同時說明「格式」和「成功標準」，讓 AI 有自我評估的能力

適合需要高一致性輸出的批次處理任務，Example 可以提供 2–3 個涵蓋不同情境

特別適合需要 AI 完成多步驟、有先後邏輯的複雜任務。Role 設定身份，Input 提供所有素材，Steps 明確指示步驟順序，Expectation 設定最終期望。讓 AI 像按照 SOP 工作的專業員工。

R — Role

AI 扮演的專業角色

I — Input

所有素材、資料、限制條件

S — Steps

明確的步驟指令（1→2→3）

E — Expectation

最終輸出的期望與品質標準

填空模板

角色（Role）：你是一位[專業角色]，擅長[具體能力]。素材（Input）： - 以下是你需要處理的資料：[貼入素材] - 限制條件：[字數 / 語氣 / 不能提及的事項] - 目標受眾：[誰會看這個輸出] 步驟（Steps）：請依照以下順序完成任務： 1. [第一步] 2. [第二步，可引用第一步的結果] 3. [第三步] 期望（Expectation）：最終輸出應該是[格式說明]。成功的標準是[什麼樣的輸出算達標]。

實際範例：競品分析報告

角色（Role）：你是一位資深產品策略顧問，擅長 SaaS 市場競品分析和策略建議。素材（Input）： - 我們的產品：[貼入自家產品描述] - 競品 A 官網內容：[貼入競品A資料] - 競品 B 官網內容：[貼入競品B資料] - 限制：報告目標讀者是非技術背景的 CEO，不使用技術術語步驟（Steps）： 1. 先整理三家產品的功能差異，用表格呈現（5 個核心功能維度） 2. 根據表格，找出我們產品最明顯的 2 個優勢和 2 個劣勢 3. 針對劣勢，提出可在 3 個月內改善的具體建議期望（Expectation）：輸出包含：比較表格 + 優劣勢分析段落 + 行動建議清單。總長度控制在 500 字以內，每個建議要可執行、有明確負責人和時間節點。

Steps 的威力在於讓 AI 「先做步驟1再做步驟2」，而不是同時混著想，輸出品質明顯更好

可以在 Steps 之間加入「完成步驟1後，先列出你的發現，再繼續步驟2」，讓每步驟可被人工確認

RISE 適合需要分析→整合→建議的三段式任務，如報告撰寫、方案規劃、內容改寫

怎麼選框架？

RTF 快速的日常任務，需要直接輸出，不需要複雜推理

TAG 有明確商業目標，需要 AI 幫你達成特定轉換的任務

BAB 說服類、行銷類、提案類，需要痛點→解方的敘事結構

CARE 需要高一致性的批次處理，可以提供範例的任務

RISE 多步驟、有先後邏輯的複雜任務，如分析報告、方案規劃

送出前的 Prompt 檢查清單

每次送出前快速過一遍，減少來回修改的次數

✓

有沒有說清楚「給誰看」或「用在哪裡」？

✓

有沒有指定輸出長度或格式？

✓

有沒有提供必要的背景資訊或原始資料？

✓

有沒有說明語氣或風格要求？

✓

有沒有列出「不要做什麼」（負面指令）？

✓

指令和資料有沒有用分隔符號區開？

✓

對於事實性內容，有沒有提供參考資料讓 AI 依據？

✓

這個任務是否應該拆成多步驟，而不是一次完成？

Agent 驗收 · QA Framework

AI Agent 開發驗收標準

從需求確認到上線監控，每個階段的驗收門檻、測試項目和 Go / No-Go 判斷標準。確保 Agent 上線前已充分測試，上線後有機制保護。

沒有通過驗收的 Agent，不應該進入生產環境

AI Agent 是「會自己做事的 AI」——它不是只回答問題，而是會自動去查資料、寄信、操作系統。但 AI 不一定每次都對，如果讓它直接幫公司寄信給客戶、自動修改資料庫，萬一出錯後果不堪設想。

「驗收」就是上線前要過的關卡——確保 AI 不會做傻事，出錯了也能立刻停下。這頁列出每個階段該做哪些檢查。

🚗 類比：就像新車不能直接上路，要先通過煞車測試、碰撞測試、排放檢驗。AI Agent 也一樣——上線前要測試各種「出錯場景」、確認它會煞車（停下來等人）、確認它不會做壞事。

本頁名詞速查：Go = 通過、No-Go = 不通過、SLA = 服務品質承諾、P95 延遲 = 100 次裡有 95 次的回應時間、PII = 個人隱私資料。

Overview

四階段驗收框架

Agent 從立項到穩定運行，需要通過四道關卡。每道關卡都有明確的 Go / No-Go（通過 / 不通過）條件。

核心原則

Human-first 所有涉及對外行動、資料寫入、金流的操作，上線初期必須保留人工審核節點

Fail-safe 設計 Agent 時先問「如果 AI 判斷錯誤，最壞的後果是什麼？」，確保有兜底機制

Observable 每一個 Agent 行動都必須有日誌可查，「AI 做了什麼」不能是黑盒子

Reversible 優先設計可還原的操作，不可逆的行動（如刪除、發送）需要雙重確認

Checklist

各階段驗收清單

點擊展開每個階段的詳細驗收項目與判斷標準

Test Matrix

測試情境矩陣

確保測試覆蓋正常路徑、邊界情境和故障情境

情境類型	說明	測試範例	驗收標準
Happy Path	完全符合預期的標準輸入	格式正確的客戶訂單	100% 正確率，延遲在 SLA 內
Edge Case	邊界值、非預期但合理的輸入	空白欄位、超長文字、特殊字元	能優雅處理，不崩潰；需人工確認時正確升級
Ambiguous	語意模糊、AI 可能誤判的輸入	「請幫我處理這個問題」（無明確指向）	要求澄清或標記為 uncertain，不擅自猜測行動
Adversarial	惡意或注入攻擊的輸入	Prompt injection、指令劫持	完全拒絕執行，記錄告警
Failure	外部依賴中斷、API 失敗	資料庫斷線、第三方 API 逾時	有 retry 邏輯；超過重試上限後正確降級或人工升級
Load	超過預期的並發量	10x 正常流量的突發請求	能限流而非崩潰，佇列積壓有告警

Scorecard

上線前評分卡

各維度給分，總分達標才能 Go-Live。可依專案調整各維度的權重。

Post-Launch

上線後監控與熔斷機制

Agent 上線不是終點，而是進入持續觀察期

必要監控指標

成功率≥ 95%

P95 延遲100 次裡第 95 慢的那次≤ SLA

人工升級率需要人接手的比例< 10%

錯誤率（5xx）系統錯誤< 1%

幻覺/誤判率< 2%

Token 用量AI 使用成本≤ Budget

熔斷條件（自動暫停）

連續錯誤 ≥ 5 次且未自動恢復

5 分鐘內錯誤率 > 20%

偵測到 prompt injection 攻擊

非預期的高費用行為（超過預算 200%）

輸出包含敏感資料特徵（PII 洩漏偵測）

人工升級率突破 30%（連續 1 小時）

觀察期里程碑

Day 1 — 每小時人工抽查 5 筆輸出

Week 1 — 每日報告，確認指標穩定

Week 2 — 降低抽查頻率至每日一次

Month 1 — 指標穩定，進入常規監控

Month 3 — 評估是否可以降低人工升級比例

Documentation

驗收必備文件清單

上線前必須完成這些文件，缺一不可

LLM 的能力邊界與職場應用指南

判斷任務適合哪種 AI 工具

AI 術語庫 團隊共識版

AI 時代應具備的電腦 / 程式基礎

Prompt Engineering 實戰手冊

AI Agent 開發驗收標準

AI 術語庫團隊共識版