前陣子在一場與 Google 合辦的
容器遷移與生成式AI實戰工作坊 上,做了一場 “容器遷移與生成式 AI 應用的趨勢剖析” 的分享 (完整的 slide 可以參考這邊)。準備過程中,有機會重新整理自己對當前AI領域的理解和框架,在這篇文章中,我想將演講的要點進行文字紀錄,並分享給對此主題感興趣的朋友們。
準備過程中看了許多資料,其中幾份我覺得幫助蠻大的,內容當中很多引用也出自這些報告和文章,表列如下:
2024 AI Index Report - Stanford University
Now decides next: Getting real about Generative AI - Deloitte
How to Make AI UX Your Moat - Latent Space
我們就開始吧,內容大致分成三個部分:
~~~
📌 AI 對世界、對工作帶來的影響
~~~
We tend to overestimate the effect of a technology in the short run and underestimate the effect in the long run - Roy Amara
這句話相當傳神的刻畫了當前生成式 AI 帶來的 hype,也精準的描繪了人性的短視和容易 FOMO 的情緒。人們擔心錯過些什麼,擔心這新技術將如何影響現有的生態。AI Index Report 進行了詳細的調查,探討了AI在各個層面的影響,我選取了一些與主題相關的資料來分享:
~~~
💡 AI 在部分任務上的表現,已經超越人類
如上圖所示,在基礎的識別與理解任務(包括手寫、語音、口語、影像、視頻、文本理解)方面,AI 已經基本上全面超越了人類。也許在處理一兩句話或一兩張圖片時,人類的表現還可能略勝一籌,但當數量達到數百或數千時,從平均表現來看,人類基本上無法與 AI 相比(人類難免會感到疲倦且容易犯錯,而 AI 則不會有這些問題)。
在《AI 世界的底層邏輯與生存法則》一書中,其中有一句話讓我印象深刻,大致上是這麼說的:「不要被生成式 AI 中的”生成”二字所迷惑,其真正可怕的能力在於”理解”」。
因此,有一句我忘了在哪裡看到的話,我覺得說得很好:
無論你最擅長什麼(通常是你最喜歡的),你可能比人工智慧更好,但無論你不擅長什麼,人工智慧都可以幫助填補空白
~~~
💡 基礎模型的訓練成本巨大
由於基礎模型的訓練需要大量算力和巨量的資料儲備,可以看到整個 AI 的研究量能,其實是產業界大於學術界的。或許當前各家巨頭模型盡出的盛況,再過沒多久就會收斂成少數贏者全拿的局面。一般中小企業其實很難/也沒必要,自己訓練一個基礎模型。在實際與客戶接觸的案子中,主要還是以 Prompt Engineering 和 RAG 的架構為大宗。
~~~
💡 AI 不會取代你,但是會用 AI 的人會
2016 年 Alpha Go 打敗世界棋王的時候,也短暫掀起 AI 將取代人類的波瀾,不過很快就銷聲匿跡了;但現在這一波生成式 AI 不太一樣,很多場景 AI 甚至讓人覺得有自主思考的能力。
在這份調查中,有 57% 的人認為在未來五年內,AI 將對目前自己的工作帶來改變;有 36% 的人認為 AI 將取代自己的工作。可以看出,雖然懷抱著擔憂,但是人類對自己的能力還是有 21% 信心的差值。
正如之前所述,AI 難以在短期內超越你真正感興趣的領域,然而在你的不足之處,AI 可以提供幫助。因此,AI 不會取代你,而可能取代你的,是那些在同一領域中,能夠善用 AI 工具的其他人。
~~~
📌 組織如何從 +AI → AI+
~~~
在探討如何讓組織從 AI 中獲益時,將 IBM 和 Deloitte 的報告觀點結合來看,確實提供了一個全面的框架 (IBM 左;Deloitte 右)。從 IBM 的觀點來看,組織應從小規模的實驗開始,逐步推進至自動化,最終甚至可能改變或重塑整個工作流程。這個過程從導入 AI 的初期階段,到擴展和全面整合,每一步都具有其獨特的挑戰和需求。
從 Deloitte 的報告中,我們可以瞭解到,在導入 AI 的每個階段中會遇到的主要挑戰。一開始,組織需要證明 AI 可以在小範圍內提高績效。隨著技術的擴展,獲取組織內部以及合作夥伴的信任變得至關重要。到了後期,隨著 AI 的全面應用,組織的人才招募策略甚至可能需要進行調整,以適應新的工作需求和技能要求。
進一步深入 Deloitte 報告中的一些洞察,可以幫助我們更好地理解這些階段中的具體策略和建議:
~~~
💡 價值創造:ROI 難易計算,錯過的風險更大
左上角那句話,最近特別有感。現在很多客戶都會來詢問如何導入雲端上的 AI 工具,AI 相關的專案需求也是爆炸性增長。充分印證了一開始的那句話:「短期高估、長期低估」。
如同上圖左上的文字所述,生成式 AI 這個技術太新的,沒有太多過往的案例可循,所以即使被問到專案的 ROI,絕大部分也都是憑直覺在估算,以至於現在很多組織內部的 AI 計畫/專案,其實都是因為怕錯過了這股浪潮,落後了競爭對手,所做的各種嘗試。
在面對眾多AI技術導入需求的情況下,與客戶的溝通過程中,我們持續強調價值創造的重要性,這對於項目的聚焦與推進起到了關鍵作用。例如,有電商客戶希望利用生成式AI來分析平台上買賣雙方的聊天記錄,判斷是否存在繞過平台進行私下交易的意圖。
從模型性能直觀考量,人們可能認為模型應盡可能多地識別出含有私下交易意圖的對話;然而,如果從價值創造的角度來看,假設模型的主要價值在於節省人工審查時間,那麼是否應該首先提高對「無私下交易意圖」對話的識別準確率?這樣一來,人工審查者可以放心地忽略那些被模型判定為無問題的對話,只需針對模型篩選出的潛在風險進行進一步核查。如果僅僅追求正向識別的準確率,而忽略了反向的準確度,可能反而會降低整體效益。
在上圖中,深綠色圓圈代表在 AI 技術上領先的企業,而淺綠色圓圈則顯示了行業的整體平均水平。一般來看,大多數企業採用的是 "+AI" 模式,即在現有商業流程中融入 AI 技術以達到優化和加速的目的。相比之下,直接採用 "AI+" 模式來創建全新的商業模式或顛覆現有模式的企業則較為少見,這主要見於那些已經直接面臨 AI 威脅的行業。
~~~
💡 規模化導入:GenAI 工具導入仍低,風險(資料)和利益仍需權衡
探索現有商業模式之外,引入工具不僅是推動文化轉型,也是提升生產力的關鍵一環。簡單問大家一個問題:您所服務的公司是否開放使用像是 ChatGPT 或 Gemini 這樣的服務?公司是否有建立自己的大型語言模型(LLM)供內部使用,或者購買了 Github Copilot 來提升開發者的效率?
從調查結果來看,許多企業對於開放使用生成式AI工具的接受度仍然較低,主要原因是對商業機密資料安全的擔憂。企業擔心在員工使用AI工具的過程中可能會不小心洩漏敏感資訊。即便組織未正式開放這些工具的使用,個人仍可能會嘗試使用它們,這突顯了資訊安全在這一新興領域的持續重要性。因此,在開放與謹慎之間找到一個平衡點,將是組織在規模化應用AI及建立信任過程中的關鍵策略。
~~~
💡 AI 賦能:重新設計工作流程,改變人才策略
為了進一步提升業務效率,我們需要從根本上革新現有的工作流程,甚至考慮讓人工智慧處理部分任務。這要求我們重新設計工作流程和調整人才招募策略。
根據調查顯示,在硬技能方面,「資料分析」和「Prompt Engineering(提示工程)」將成為未來與AI有效互動的關鍵技能。在軟技能方面,「獨立思考」和「創意」顯得尤為重要,目前的AI模型尚未能透過大量資料輕易實現這些能力。
個人層面上,定期反思自己的日常工作流程,識別出哪些環節可以藉由「資料分析」和「Prompt Engineering」的幫助來提升效率。透過使用這些AI工具,不僅能優化工作效率,還能釋放更多時間用於「獨立思考」和「創意」。
通過不斷地反思和迭代這一流程,我們可以從單純使用AI的階段 (+AI) 進步到AI賦能(AI+) 的新階段。
~~~
📌 AI 如何創造產品價值,打造商業護城河
~~~
💡 AI 不是護城河,UX (Data) 才是
在前文中,我們提到不應急於透過 AI 顛覆整個產業或創造新的商業模式,而是應從現有的商業模式中尋找 AI 帶來的增值機會。然而,接下來我們必須面對的問題是,這些機會商業競爭對手也看得到,且他們可能擁有更豐富的資料或更大的規模。在這樣的情況下,組織應如何利用 AI 技術來構築自己的商業防禦壁呢?換句話說,如何能夠使您的 AI 應用表現優於競爭對手?對此,我發現「How to Make AI UX Your Moat | Latent Space」一文中提出的框架非常有參考價值,值得我們深入探討。
~~~
💡 ChatGPT 震驚了世界不是因為模型而是體驗
回想一下,我們第一次打開 ChatGPT 展開一輪對話,並且為之震驚的那個 moment。我們是被他背後模型所擁有的巨大規模/參數所震驚,還是被有如與一個博學多聞的真人對話體驗所震驚?
ChatGPT 的流式輸出,模擬了閱讀和聆聽。對話的過程,ChatGPT 會根據之前的內容 (Context) 來調整回應,彷彿有了記憶。聊天真正成為聊天,不像以前的 chatbot 似的一個個獨立的 Q&A。
這就是體驗上的差距,既然 AI 未來會像水電一樣成為企業的基礎設施。那麼,便沒有企業會因為用上了水電就脫穎而出。如何透過良好的體驗,建立正向循環持續積累資料形成壁壘,才是關鍵。
~~~
💡 好的體驗需要在互動的每個環節下功夫
怎麼在好的「體驗」上下功夫呢?或許我們可以從 Prompt Engineering 當中找尋線索。使用者和你提供的產品或服務互動,和我們和 AI 進行互動其實是類似的。我們可以借鏡 Prompt Engineering 當中的框架,來指引產品/服務的 UX 設計。
在 How to Make AI UX Your Moat 當中提到的 3C = Command + Constraints + Context 非常值得筆記下來:你的產品/服務 在什麼背景(Context) 下基於怎樣的約束 (Constraints) 幫助使用者完成了怎樣的任務 (Command),這三個環節,如何透過 AI 技術來進行簡化,打造更好的體驗?
~~~
💡 3P: Present → Practical → Powerful
來看一個實際案例(如上圖所示):一個時尚電商平台提供了AI助理服務,讓我們看一下整個購物體驗的流程。
起初,一名使用者提出7月將前往聖托里尼參加婚禮的需求,希望平台能推薦合適的服裝。AI助理考慮到7月聖托里尼的氣候既炎熱又多風,且婚禮場合需要著裝較為正式和高雅,因此推薦了適合正式場合的無袖或短袖洋裝。
隨後,使用者詢問適合的鞋款。AI助理根據洋裝的風格,建議了幾款高跟涼鞋。然而,使用者進一步提到婚禮後將有一場在海灘上的派對,考慮到高跟鞋在沙灘上行走的不便,AI助理便轉而推薦了幾款平底涼鞋,以適應不同的場合需求。
從這個例子,從使用者的角度,我們來套用看看 3C:
Command (命令): 穿搭建議
Constraints (約束): 7月 (時間)、Santorini (地點)、朋友的婚禮 (人、事)
Context (背景): 婚禮後在沙灘上的 after party
然後,我們看一下這三個 C,可以有什麼具體增進 UX 的措施:
Command: 讓用戶創建任務並且在未來可以搜尋他們。
在這個案例中,提供穿搭建議可能是某些使用者的常見需求,但不一定適用於所有人。其他使用者可能更關注於搜尋特定商品或查詢價格。因此,平台可以對使用者與這個AI助理的互動進行統計分析,並將常見的指令分類整理。這樣一來,AI助理在與使用者初次互動時,就可以根據這些數據提供更加個性化的開場白,而不僅僅是標準的「你好,有什麼我能幫助您的嗎?」Constraints: 在應用程序中創建自動拉入的用戶設置。
在上述案例中,我們觀察到AI助理巧妙地利用地點和時間資訊獲得相關天氣資訊,避免了推薦冬裝的尷尬,這顯著提升了用戶體驗。進一步地,我們可以思考還有哪些因素可能影響穿搭選擇,並探討是否能在不干擾用戶的情況下自動獲取這些資訊。Context: 簡化數據收集。
婚禮結束後的沙灘派對可能是邀請函上的其中一項活動安排。在這樣的場合,當AI助理提供鞋子選擇的建議時,應該先詢問客戶的需求,而不僅僅是考慮鞋子與服裝的搭配。或許我們可以改變傳統的問答對話模式,像朋友間的閒聊一般,先充分了解對方的背景和情境,再根據這些信息來提供更精準的穿搭建議。
在 3C 上針對 UX 做出改善,讓 AI 融入產品,從 Present (讓使用者意識到有 AI 功能) → Practical (AI 功能實際幫助使用者更有效率完成任務) → Powerful (使用者的 wow moment)。
在為產品/服務導入 +AI 技術的時候,我認為這是個蠻容以理解的框架,用來反思這樣的整合是否帶來使用者體驗的提升,而不是為了 AI 而 AI。
~~~
💡 如何應對「短期高估、長期低估」的 Amara’s Law
最後,呼應前面提到的 Amara’s Law,人類總是傾向「短期高估,長期低估」。在當前這個 AI 資訊焦慮的時代,這四點建議我覺得很值得每個關注且希望透過 AI 來提升效率的工作者具體實踐。
保持耐心:讓子彈飛,世界越快心則慢。技術和研究的東西可以追,但避免 FOMO,更多關注那些即使技術實現了,也不影響的商業/人性本質。
持續關注:讓自己獲取資訊的渠道通暢,並且降低噪音比例。
擁抱改變:強迫自己克服原有成見,凡是嘗試思考看看如果應用上 +AI 的話,這件事情會怎麼樣。甚至去思想練習,如果這件事情用 AI+ 的思維來看的話,又會怎麼樣。
批判思維:凡是皆有兩面,如同前面提到 AI 相關的資安議題,擁抱改變的同時,也同時能站在另一面思考其中的風險。
好啦,我們從 AI 對世界帶來的影響,談到組織如何從 +AI 到 AI+,再聊到如何透過 AI 提升產品/服務的體驗,很開心和各位分享這些趨勢,我也從這個分享到中學到許多,希望這些內容對各位有所幫助,下次再見 :~)