Google 這款免費 AI,連 OpenAI 都在誇

在不久前結束的 Google I/O 上,Google 悄咪咪地在安卓和 iOS 同時上線了一款「舊」app——NotebookLM。發佈當日,不到 24 小時,它就奪得蘋果 App Store 中生產工具類別的第二名

2023 年發佈的 NotebookLM 此前只有桌面端2023 年發佈的 NotebookLM 此前只有桌面端

NotebookLM 於 2023 年發佈,當時人們只把它當拆解文檔的知識庫使,等到了 2024 年新增「音頻概覽」後,NotebookLM 破圈了。

就連來自競爭對手 OpenAI 的創始成員 Andrej Karpathy 在體驗 Google NotebookLM 後都難掩激動地表示,這讓他想起了當初的「ChatGPT 時刻」

同我們這兩年已經習慣的 AI 問答機器人不同,當我們輸入一個問題,NotebookLM 會要求你先把掌握的多媒體素材上傳了,再提問題,它是 source-grounded 的,只會根據你上傳的知識作答。就是這麼一款由 AI 驅動的筆記產品,翻紅了。

增加了音頻概覽功能後的 NotebookLM,可以將原本結構化、線性表達的知識文本,生成 10 分鐘左右的 AI 雙人播客,而且音色、抑揚頓挫,甚至包括調侃,都活人味十足。這還沒完,當文本被轉化為音頻後,人們發現 AI 非常會講故事、劃重點,在聲音上都能做出高亮……繁雜的論文大概率是沒能看完,但相聲總是能在路上就聽完的。

據流量分析平台 SimilarWeb 統計,從去年 11 月開始算,NotebookLM 半年時間月訪問量漲了 56%,達到超四千八百萬的量級。前陣子,Google 還推出了獨立的手機版, 「聲音快餐」加上移動場景,使用量有望再次翻倍。

AI 時代的筆記本長什麼樣

打開 NotebookLM,映入眼簾的一個個分門別類的自建主題,每次新建都會被要求上傳素材,諸如會議記錄、課堂內容、研究筆記,現在已經支持各種格式的文本文檔、帶板書的幻燈片、PDF、網頁(中文網頁解析支持不佳,建議將其「網頁轉 PDF」後再導入)、音頻,以及全互聯網智慧的結晶——YouTube!

一股腦兒都放進去後,界面瞅著就像一個特定研究主題的問答機器人,剛才上傳的不同媒介的資源,AI 全吸收了,且變成了你深入提問的上下文。

如圖,AI 已經將資料概括寫好了,如果你這時就有明確的問題要問,直接在輸入框激情問答,但如果你和大部分人一樣,無從下手,AI 已經貼心地擬好了高質量問題,就懸浮在輸入框的下方,而且這些問題你越問越有,不斷更新生成。

NotebookLM 的回答,幾乎是每一句,都會做好索引,而且並不只是定位到某個素材,而是細化到某一個素材具體討論到當前部分的位置。

如果你提的問題,在居里都沒有相關內容,AI 就會直接說:答不了。

如果你上傳的素材非常多元,「思維導圖「能派上大用場。它會將不同內容統統收整起來,呈現邏輯和關聯,如果你需要查看更細節的內容,再逐層展開,當找到你想具體研討的知識點,點擊,AI 將會就這一個小點放置到整體語義和上下文中,再幫你劃出重點。

筆記區的「學習指南」「簡報文檔」「常見問題解答」和「時間軸」,也都能幫你做好各種形式的「劃重點」。這麼看來,NotebookLM 更像個學霸搭子,它一目十行後,再遞給你一本劃滿螢光筆跡的濃縮本,且對它說的每句話都負責。

由於 source-grounded 的屬性,NotebookLM 的幻覺是降低了,但也意味著它並不能像 ChatGPT 那種生成式回答發散,不太能舉一反三。在用 NotebookLM 時,我不太擔心 AI 胡編亂造,最大的幻覺可能在於我瞅了一眼展開的思維導圖,覺得自己學到了太多……

文本生成「相聲」,他們都這麼玩

真正讓 NotebookLM 在 AI 產品賽道跑出差異化的,是「音頻概覽」。用法也很簡單,基於你上傳的資料,指定 AI 主播著重講哪個素材、哪個子主題,以及說明你的角色、背景、職務,明確你聽待生成播客的目的是什麼,prompt 寫完,等幾分鐘,節目就開播了。

科技博主@寶玉 xp 通過逆向推導,總結出播客被系統要求「使用‘熱情講述者 + 冷靜分析者’雙聲部,只憑指定來源,為時間緊卻求深度的學習者,精編出既客觀中立又足夠有趣的洞見,讓他 / 她收穫可立即行動或引發頓悟的認知價值。」這種形式的知識攝取,並不直接替代閱讀,NotebookLM 在特定場景有它的實用意義。

NotebookLM 的產品負責人 Raiza Martin 最早在家裡放這些播客,她的丈夫不滿一播就不帶停,Raiza 那時候卻在暗爽對方並沒有聽出那是 AI 在說相聲。

比如 AI 主播講到「3%」這麼一個需要強調的百分比,就會著重在這個字眼上加重語氣,這種聲音上的高亮非常像活人,也加深了我們對重點的記憶。

這還沒算完,播客在放時,你如果覺得 AI 並沒有講到你感興趣的點子上,直接按「加入」按鈕,打斷他們,直接提問。

比如你在策劃一趟去峇里島的行程,把一整本《孤獨星球》和各種攻略都導入庫,開始讓 AI 主播做景點推介了,聽著聽著你的小孩放學回家了,你這才意識到你把孩子這茬給忘了,那就可以打斷 AI 讓他們給你講點適合親子互動的景點……等到真正到了旅遊地,打斷主播,指定他們給你實時導覽,NotebookLM 直接化身耳機里的地陪。

也總有人使用工具不按套路。

有人把自己的簡曆傳上去,那倆 AI 主播逮住你每條職業經歷就是一頓讚美,彷彿拉了一個三人「誇誇群」,他們誇你賽前分析,誇你深耕,即便教育背景和工作經歷風馬牛不相及,他們也會說你底層能力遷移到位了……你聽完只會笑盈盈地說「AI 懂我」。

有人在工作會議上走神,把錄音傳給 AI 主播整理,在工位上聽到生動的會議概要,這可比枯燥的領導發言更易消化吸收。

有人擔心長輩攝取太多二手信息,乾脆收集可靠的出版物,做成 「10 分鐘聽完一本書」系列,這樣的「聽書」低幻覺,零私貨。

以上都屬於內容消費,也有人把生產搞起來了。

比如OpenAI 的創始成員 Andrej Karpathy 就花了兩個小時做出了一檔十集的播客Histories of Mysteries,先是用搜索引擎、ChatGPT、Claude 做好選題,然後再把諸如「亞特蘭蒂斯」的域奇詞條傳給 NotebookLM,節目就算殺青了。

Histories of Mysteries 的其中一集,講述了「wow! 信號」的故事Histories of Mysteries 的其中一集,講述了「wow! 信號」的故事

又比如一位博主開發了一款瀏覽器插件,可以把收集起來的 B 站影片的字幕都給抓了,再導入 NotebookLM 分析,他對另一個博主非常感興趣,通過集中分析對方的文案特點,為自己的創作提供靈感。

總結來說,NotebookLM 的對話交互和播客生成,都讓原本被動接受知識的過程(比如聽講座),變為主動收集、主動交互。在傳統的教育中,要持續並隨時進行高層次學習並不容易。

一個非常規 Google 產品的誕生

在前不久的 Google I/O 上,Google 宣佈他們專為教育場景優化的 AI 模型 LearnLM 集成到了 Gemini 2.5 和 NotebookLM 中,持續優化個性化、強互動性的教學內容的生成。值得一提的是,NotebookLM 之後,Google 就基於 LearnLM 推出了一個青少年科普交互式百科全書 Learn About。

Learn About 界面

據 TestingCatalog 報導,NotebookLM 還將上線「Sparks」影片生成功能,90% 基於用戶提供素材,10% 為 AI 補充的信息。

而 Google 可是前不久剛端出 Veo 3。這個 AI 影片生成模型,你只需要撰寫一段 prompt,它就能一鍵生成一個聲音、背景音跟影片完美契合的完整成品。

如果拿 NotelookLM 的攢稿能力,結合 Veo 3,恐怕要衝擊一大波知識區博主。別不信,因為 Veo 3 現在的成片長這樣:

NotebookLM 誕生的背後,也有不少說頭。

NotebookLM 最早是一個 「20% project」——這是 Google 的一個傳統,即「員工可用 20% 的時間在業餘項目上」。產品孵化自 Google Labs,相比大廠,Google Labs 更像創業小公司,流程更少,更迭和驗證速度更快。

除了技術人和工程師,他們還雇了一位寫科普暢銷書的作家——Steven Johnson,讓 AI 和真實的文字工作者交鋒和共創,團隊深入研究了這位作家組織信息以及書寫的技藝。

NotebookLM 出圈後,Google Labs 負責人 Josh Woodward 也開始兼任 Gemini 項目。他在接受紅衫採訪時,表示「我確實認為 prompt 已經過時了」,他主張人們和 AI 交互不需要手搓那麼長的提示詞,他認為多模態生成的超長上下文,加上 AI 的推理能力,用戶的意圖會更容易被捕捉。

一個薅羊毛小貼士:

NotebookLM 免費版支持上傳 50 個素材,對於一個你剛萌發好奇心的主題,可能用不到 50 個,但如果是想反芻、回溫一個你曾花費大心思鑽研過的課題,擴容到了 Pro 版,就有意義了,將整本著作、長影片、長音頻、內容繁多的板書,再加上這個課題的最新進展,夯實自己對舊知識的認知基礎,還能引入新動態的補充。

搜 Gemini Student,可以免費領 Google One 會員,包含所有 AI 服務會員,NotebookLM 也在內。這樣,你的 NotebookLM 一下子就支持 500 個主題研究,每個主題最高可上傳 300 個素材。

本文來自微信公眾號「果殼」(ID:Guokr42),作者:biu,編輯:臥蟲,36氪經授權發佈。