👋 嘿,我是 Browny。
Informal Writing 書寫琢磨 技術趨勢、溝通領導、概念理解與生活實踐。
每週一四派送,訂閱起來👇。也在 threads 上面分享比較 即時的 insight,歡迎關注 👀
📌 引言
大家這個禮拜過的好嗎,在過幾天就要進入8月囉,話說這個暑假好像都還沒有到海邊衝浪,八月有時間再來安排一下 🏄♀️。
今天和大家聊聊 NotebookLM 這個 Google 推出的 AI 驅動的研究/寫作工具。前文 “3大必備工具: 產出導向的資訊整理術” 當中,我和大家介紹了3個我在電子報寫作上的主要工具。最近,NotebookLM 慢慢進入了我的視野,我開始在寫作流程中使用它 👀。
其實它剛推出的時候,我有嘗鮮試用了一下,但沒有認真深入研究。直到最近我看到了一個訪談 NotebookLM 背後開發者 Johnson 的影片 [1] (強力推薦給對筆記軟體有興趣的朋友,主持人和來賓對於這個工具的現場即時互動我覺得有夠讚)。
加上自己在寫完 “解構AI Agent: 人工智能的關鍵突破?“ 一文後,對於 AI 工作流有了更系統性的體會,才慢慢發現這個工具的強大之處。那麼,就讓我們來看看 NotebookLM (以下簡稱 NLM) 由淺到深的三種使用方式,如何幫助我更高效的研究與寫作。
📌 什麼是 NLM?
📌 NLM 的主要組件
📌 NLM 使用的三個層次
📌 使用場景 & 實用問句
📌 限制與缺點
.
📌 什麼是 NLM?
不要花任何時間組織任何東西,只需把它們都放在一個地方,然後專注於產生想法
- Steven Johnson [1]
NLM 是 Google 實驗室開發的一款 AI 驅動的研究和寫作工具。它的核心是一個大型語言模型 (Gemini 1.5 Pro),能夠理解和分析用戶輸入的文檔,並與用戶進行智能對話,協助完成各種研究和寫作任務。
聊到過去他的筆記生涯,NLM 的開發者 Steven Johoson 提到:他不想要分類,不想要打標籤,他覺得一個好的筆記工具就是:「創建一個地方,你可以把所有東西都丟進去,然後使用智能工具來找到你需要的東西。不要花任何時間組織任何東西,只需把它們都放在一個地方,然後專注於產生想法。」
NLM 與 直接使用 ChatGPT (大語言模型) 最不一樣的地方就是它和你的對話都是有憑有據的 (術語 Grounding: 嚴格根據用戶提供的資料來回答問題)。如果你提供的資料沒有相關信息,它會直接回答不知道 (不會像 ChatGPT 那樣,很正經的給你一個錯誤的答案 或是 根本不存在的事實)。
這正是 NLM 試圖實現的願景:一個可以容納所有資訊,並能智能檢索和分析的工具。接下來的使用體驗當中,我們也能感受到這個核心的價值觀!
.
📌 NLM 的主要組件
要了解 NLM 的運作,我們先來看看他的主要組成:資源 (Sources)、筆記 (Notes)、指令 (Commands) 與 對話 (Chat):
📦 資源(Sources)
我現在習慣在 Perplexity、Exa 上針對某個議題去篩選我覺得優質的 citation,
然後把這些 citation 匯入到 NLM 進行探索
Sources 是 NLM 的事實基礎,用戶與 NLM 的對話一開始也都是圍繞在 Sources 上面 (為什麼說是一開始呢? 因為後面會提到,對話也可以圍繞在 Notes 上)。
用戶可以上傳各種格式當作 Source:如 Google Drive 文件、Web URL、PDF、文本文件等…。每個 notebook 最多可以包含 50 個 sources,每個 source 最多可以有 500,000 字,這意味著一個 notebook 可以處理高達 2500 萬字的內容 (相當驚人 🤯)。
💡 Pro tips
如果要一次匯入大量 sources,建議先開一個 Google Drive folder 把所有資料先整理進去,然後在匯入的時候就可以全選該 folder 下的所有文件 (包含 Doc, Sheet, Slide 都可以)。
加入 source 的時候選擇 Upload from Drive 的話,只會認到 Drive 相容的資料格式,例如你上傳了一個 .txt 檔案,在選單中是選不到的,你需要在 Drive 當中打開他一次,相容的 .doc 檔案才會出現。如果上傳很多檔案,一個一個點很麻煩,建議將自動轉成 Drive 相容格式的設定打開 (在 Drive → Setting → Uploads 裡面可以找到: Convert uploads to Google Docs editor format)。
我現在習慣在 Perplexity、Exa 上針對某個議題去篩選我覺得優質的 citation,然後把這些 citation 匯入到 NLM 進行探索。
.
📦 筆記(Notes)
區分 Written Note 和 Saved Response 讓用戶可以將研究與產出,在同一個地方進行
Notes 是用戶保存重要信息的地方。你可以直接寫筆記 (這種叫做 Written Note,透過 <Add note>
創建出來的筆記);也可以將對談中 NLM 的回應保存下來 (這種叫做 Saved Response,在 AI 回應的訊息右上角點選 <Pin this message to a note>)。這些筆記會顯示在頂部,方便隨時查看和使用。
💡 Pro tips
這樣設計的用意在 Johnson 的訪談中也能略窺一二:經常,我們寫作的時候會開很多的分頁甚至不同的軟體,有些拿來查資料,有些拿來寫作,複製來複製去的。區分 Written Note 和 Saved Response 讓用戶可以將研究與產出,在同一個地方進行。
.
📦 指令(Commands)
Commands 是 NLM 內建提供的一系列任務與操作,例如:摘要、生成大綱、協助理解等等…。也能根據你和 sources 之間的對話,來推斷可能你接下來感興趣的 follow-up questons。如上圖,當你上傳 source 的時候,會跳出 Notebook guide,當中有一些建議的指令,對於快速了解 sources 有蠻大的幫助。
💡 Pro tips
除了可以勾選 sources 然後打開 Notebook guide 使用指令以外,NLM 也有提供針對 notes 的指令,當勾選 1 個或多個 notes 的時候,聊天視窗上面會相應跳出內建的指令,這些指令對於激發新的想法也很有幫助!
.
📦 對話(Chat)
「勾選」在 NLM 當中是一件非常重要的事情,
因為這代表你現在正在和哪些 sources / notes 進行互動
Chat 讓用戶可以與 NLM 針對選取的 sources 或是 notes 進行互動,深入探討某個主題或逐步完成一項任務。這種交互式的體驗讓研究和寫作過程變得更加流暢和高效。
「勾選」在 NLM 當中是一件非常重要的事情,因為這代表你現在正在和哪些 sources / notes 進行互動:
當你選取單一 source / note,你可以在 chat 裡面問:「請問這份資料重點是什麼,解決了什麼問題」。透過 NLM 幫你深入理解單一 source 的信息。
當你選取多個 sources / notes,你可以在 chat 裡面問:「請問這些資料有哪些共同的見解或是相左的意見」。透過 NLM 快速幫你梳理跨 sources / notes 的一些信息。
💡 Pro tips
那麼,有沒有辦法同時選取 sources 和 notes 一起進行對話呢? 如果可以的話,就可以做到將自己的見解與 sources 進行互動,例如:
對某個議題,你可以先將你的看法寫在一個 Written Note <我的看法>,然後上網搜尋一些資料,將他們匯入 NLM 之後,一同勾選起來,問:「請問 <我的看法> 和來源資料有哪些異同,這些資料可以對 <我的看法> 做出什麼補充或修正」。
將一篇文章的大綱寫在 Written Note <Blog 大綱>,然後匯入跟這篇 blog 相關的資料,匯入 NLM 之後,問:「Note `<Blog 大綱>` 是介紹 NotebookLM 的文章大綱,請你依據 sources 的資料,完成這篇文章」。
可惜,目前 NLM 沒辦法直接做到,當你選取 notes 的時候,NLM 就會忽略掉 sources (讀者可以試著同時選取,然後觀察聊天輸入框前面的 hint)。
不過沒關係,我們可以用間接的方式來做到 (也就是善用大語言模型的記憶能力,即 Context Window)。以上述 2. 為例,我們可以先選 note 然後在 chat 裡面請 NLM 複述一遍,這麼一來這個 <Blog 大綱> 就會被 NLM 記住。
接著,我們先關閉 chat,把勾選改成特定的 source,然後再打開 chat,請 NLM 遵循大綱的結構並且根據 source 完成這篇 blog (操作可以參考下方錄影)。
.
📌 NLM 使用的三個層次
前文 “解構AI Agent: 人工智能的關鍵突破?“ 我整理了自己對於現在 AI Agent 的理解框架,自那之後我在使用 AI 相關工具的時候,都會問自己這個工具可以怎要套用到這個 Agentic workflow 當中。
NLM 也一樣,如果單看 Chat 當中一問一答的 Command,那麼他可能就僅停留在 Agentic workflow 當中的感知層。理解了 NLM 的主要組件後 (包括 sources, notes 的區別、勾選的重要性、等等…),我們就可以透過不同的使用方式 (不同的提問 or 不同的勾選策略),讓 NLM 幫助到規劃層甚至是行動層。
.
感知層 (Know What)
NLM 可以幫助用戶快速了解文檔的基本內容和結構。你可以問:
這個 source 有哪些重點?
這份內容嘗試解決什麼問題,提出了哪些方法,達成了哪些結果?
NLM 會分析文檔並提供簡潔的摘要,幫助你快速掌握核心重點。
.
理解層 (Know How)
NLM 可以幫助用戶更深入地理解文檔的觀點、立場和論證。你可以問:
如果要快速掌握這份內容,有什麼結構化的方式?
這份文檔的主要論點是什麼? 有什麼支持證據?
NLM 會生成大綱、思維導圖或其他結構化的表示,幫助你構建自己的框架來理解和記憶內容。
.
行動層 (Output)
引導 NLM 根據 理解的內容 搭配 你的目的 生成新的輸出。例如:
請根據 <XXX> note 的大綱,從 <OOO> sources 中提取對應的佐證,做有條理的表達。
基於這些資料,幫我草擬一個研究提案的框架。
NLM 會綜合分析所有相關資訊,生成符合你要求的輸出,大大提高工作效率。
.
📌 使用場景 & 實用問句
有了層次感以後,我們再回來看,哪些場景特別適合 NLM 來做發揮:在一個明確定義的範圍內進行研究的項目都非常適合!嚴謹地基於 sources 的事實回答 搭配 感知層 → 理解層 → 行動層 循序漸進的使用方式,在各個領域都能夠有所發揮:
🧰 學術研究
1. 文獻綜述
自動生成摘要:上傳多篇論文,讓 NLM 提取出每篇論文的主要觀點。
比較分析:比較多篇文獻,指出它們之間的相似點和不同點。
2. 論文撰寫
結構優化:輸入草稿,請求 NLM 優化文章結構。
尋找引用文獻:根據輸入的內容推薦相關的文獻,供引用和參考。
.
🧰 商業應用
1. 會議記錄整理
重點提取:上傳會議記錄,讓 NLM 提取主要決策和行動項目。
問題解答:根據會議記錄回答特定問題,如「誰提出了市場擴展的建議?」
2. 趨勢分析與報告
數據整合:上傳多個季度報告,請 NLM 整合數據並生成趨勢報告。
業績分析:針對不同部門的業績上傳報告,分析並對比其表現。
.
🧰 個人創作
1. 內容創作 (激發靈感和組織內容)
情節設計:上傳故事草案,請 NLM 提供新的角色或情節建議。
文本優化:幫助潤色和修改文章,提升文本質量。
2. Blog 與文章撰寫
標題與副標題生成:上傳文章草稿,請 NLM 提供相關標題和副標題建議。
內容架構:根據主題和目標讀者生成文章的大綱。
.
🧰 教育與教學
1. 課程資料準備 (for 教師)
講義摘要:上傳教材,請求 NLM 生成簡明的摘要或教學要點。
問題生成:根據課程內容生成練習題和討論問題。
2. 學習指南 (for 學生)
筆記整理:上傳課堂筆記,讓 NLM 整理出關鍵概念和重點。
知識點總結:為特定主題生成知識點總結,幫助學生更好地理解和記憶。
.
📌 限制與缺點
講了這麼多優點,實際使用下來還是有蠻多值得改善的地方。目前這個服務還是在實驗室階段,都是免費讓大家用的,其實是還蠻佛心的,未來說不定就要開始收費了。
資料的 I/O 整合略顯陽春:輸入方面雖然有兼容幾種常見的格式 (例: Web URL, PDF, Markdown, 等等…),不過在批次或是自動化匯入這塊還很陽春,比如你想要一次匯入好筆 Web URL 就做不到。另外,notes 的匯出則是完全不支援,只能乖乖自己手動複製貼上。
排版和編輯功能略顯陽春:Saved Response 沒辦法進行編輯,有時候輸出的結果排版的不是很好,就只能接受 (看的有點痛苦,我有時候會拿去叫 ChatGPT 幫我重新排版)。Written note 雖然可以編輯,不過略顯陽春,要直接將其輸出成 blog 文章的話,不太夠用。
回應的語言設定不夠彈性:NLM 的回應語言是連動登入的 Google 帳號語言,這其實蠻麻煩的。有時候希望模型使用中文回應,但是我的 Google 帳號預設語言是英文,就還要跑去改。後來我乾脆就都用英文,然後用沉浸式翻譯直接將 NLM 的回應翻成中文。
相關使用額度和上限不明確:在使用大語言模型,像是 ChatGPT, Claude 等,服務本身都會揭露自身的額度與上限,例如: Context window 多大、Input/Output token 上限多少、等等…。
我自己在使用的時候,有時候 Written note 裡面的內容太多了,導致我嘗試選取它進行 chat 的時候,聊天視窗不讓我輸入。我猜測可能是超過一個 note 可以容納的字元上限,這個並沒有一個官方的說明,只能靠實際使用的手感。
.
📌 結語
一個筆記的理想國終將來到:
不用煩惱 資料夾的樹狀結構要怎麼建 / 資料夾該怎麼命名 / 應該打上什麼標籤,
只需要將知識外掛進來,透過自然語言的方式,搜尋和組織,人們可以專注於產生想法
回到一開始,Johnson 對於筆記的理想:「不要花任何時間組織任何東西,只需把它們都放在一個地方,然後專注於產生想法」,在嘗試將 NotebookLM 融入工作流程之後,我覺得這個理想是真的有可能實現的,而且已經非常接近了。
NotebookLM 仍在實驗室階段,網站左上角都還掛著 “Experimental” 的字樣,能不能成為正式推出的產品也還說不定。不過仔細想想,背後的技術不就是 RAG (Retrieval-Augmented Generation) 嗎,一個將模型限縮只能根據框選的資料來回答的 RAG,一個將幻覺程度降低的 RAG,一個可以將每一個回答溯源至所匯入的資料的 RAG?
我想,即使沒有 NotebookLM 未來還是會出現類似的工具,一個筆記的理想國終將來到:不用煩惱資料夾的樹狀結構要怎麼建、不用煩惱資料夾該怎麼命名、不用煩惱要幫這個檔案打上什麼標籤,只需要將知識外掛進來,透過自然語言的方式,搜尋和組織,人們可以專注於產生想法。
寫到這邊,不免有些興奮,從我們介紹 NLM 的主要組件 → NLM 使用的三個層次,可以看到在通往通用人工智能 (AGI) 的路上,Agentic workflow 能夠作為我們的指引,來思考如何將這樣的工具作最大的發揮。心中有了這樣一個框架,也更能夠理解,這個工具的設計者,為什麼會將 NotebookLM 設計成 Sources, Notes, Commands 和 Chat。
這四種實體的抽象,使用體驗我覺得不差,但心中總覺得還有很大的進步空間。期望未來類似 NotebookLM 這樣的筆記理念可以百家爭鳴,發展出更直覺好用的 UX。彼時的研究者和現在相比,會是無比幸福的吧。
你是學生、研究人員、商業分析師或是創作者嗎,我真心建議你試試 NotebookLM。它可能會成為你的得力助手,幫助你在浩瀚的信息海洋中找到方向,實現你的研究和寫作目標。
你已經在用 NotebookLM 了嗎?你有什麼個人小技巧或是遇到什麼困難嗎?或是你有比 NotebookLM 更厲害的工具呢?歡迎留言和我分享討論。
記得按讚訂閱加分享,也可以請我喝杯咖啡 ☕,謝謝大家,我們下期見!
~
🔍 工人智慧猜你也喜歡
🔖 參考資料
[1] Is NotebookLM—Google’s Research Assistant—the Ultimate Tool for Thought?