大廠山寨 Cursor,不如做好郵箱

大聰明:

寶玉出品,必屬精品,歡迎文末打賞。

以及… 真的不要「圍繞熱點秀技能」,而是把視角放到真正的用戶側,最大程度的去解決現實問題

今天看到有人說大廠開始立項抄 AI 編程軟件 Cursor 了,但這樣追在別人屁股後面跑是沒有前途的,AI 代碼編輯器已經是紅海了,就算大廠又如何,微軟比 Cursor 大多少?結果 GitHub Copilot 也沒打過 Cursor,大廠還不如多投資幾家像 Cursor 這樣的公司,為什麼非要抄他們呢!

程序員這個群體大家都知道,又不願意花錢又沒忠誠度,Cursor 好用馬上都退訂 Copilot,能白嫖絕對不花那 $20 的訂閱費,大廠不如多看看普通用戶的需求。

大聰明:是的,並且 114514

普通用戶需要的不是 Cursor,是能幫助溝通和寫作的 AI 編輯器,比如寫郵件、回短信。但是有好用的嗎?沒有!唯一可以看到的期貨是蘋果的 Apple Intelligence。

普通人的寫作需求是什麼?

普通人日常的寫作分三種:日常溝通、公文和創作。

日常溝通

日常溝通協作就是各種日常的郵件,短信、微信、Slack 等等,這類寫作尤其是郵件,套話很多,特別適合用 AI 生成。我日常寫稍微長一點的郵件基本都是 GPT 幫我完成了,給出要點和充足上下文,生成的又快又好,稍微改一下就可以用。

公文類寫作

公文類就是各種報告、總結、文檔等等,這種公文套話多,格式固定,但是費時費力,現在絕大部分公文都可以用 AI 幫助協作了。

而且同類型的公文,比如文檔,以前歷史的文檔都可以重用,大語言模型尤其擅長模仿寫作風格或者內容結構。結合 RAG(檢索增強生成)這樣的技術,寫新的內容之前把以前寫過的相關內容找出來,類似於 Cursor 那樣幫你預先生成,大部分時候可能一路 Tab 就好了。

創作類寫作

創作類又可以細分,一類是二次創作,比如翻譯、書評等;一類是原創的創作,比如寫論文、寫小說還有像這篇這樣的原創博客。

二次創作像翻譯這種創作,如果結合 AI 其實可以效果更好,比如 AI 先翻譯一遍,局部不對的,類似 Cursor 那樣,調出對話框,告訴它如何改進,比如先解釋一下、去搜索一些外部資料補充,再次生成結果就好很多,但是不需要手動去複製、搜索引擎搜索、篩選、重寫等等。

至於原創,我個人是不依賴於 AI 寫作的,從來沒有讓我滿意過,我更喜歡一點一點將模糊的想法形成文字,並不斷修改成型,AI 的自動完成甚至對我是一種干擾。但寫完後借助 AI 幫我改改錯別字、潤色一下還是可以的。

AI 寫作工具的挑戰是什麼?

相信我上面列出的幾類寫作需求也同樣是大多數人所需要的,像代碼編輯器,GitHub Copilot、Cursor 這樣的好工具層出不窮,而給普通人寫作的 AI 輔助工具,卻沒有看到什麼好用的,這裡面確實有很多挑戰!

私有數據的獲取

要想讓大語言模型生成好的結果,一定要有充足的上下文,這就意味著要獲取你的私有數據,而普通人寫作時的數據,很多都涉及隱私,相當敏感。沒有人希望自己的私密聊天記錄和通信記錄發送到服務器,公司相關的郵件更是如此。另外像微信、Slack 這樣的通信工具的數據,本身也是沒有公開 API 可以獲取的,通過其他手段可能會有些麻煩。

模型的能力

蘋果在演示 Apple Intelligence 中的智能郵件回覆時,效果很驚豔,但是它用的是本機小參數模型,如果不能接入 GPT-4o、Claude 3.5 這樣的大參數優秀的語言模型來做這個任務的話,我不覺得效果會有多好,畢竟模型的能力才真正決定了最終生成的效果。

包括現在開源的大語言模型,要想在本機運行,大一點參數的模型根本運行不起來,小一點參數的效果又不好,這也是製約之類 AI 寫作工具的一大瓶頸。

交互體驗

GitHub Copilot 和 Cursor 的成功,很大一部分程度上歸功於其交互體驗,根據當前你寫代碼的位置,智能的給出提示,隨時喚起對話框輸入提示詞個性化的完成任務。但是代碼相對來說確定性更強,有固定的語法結構和最優算法解,還有無數歷史代碼參考,通常一個上下文內,只有有限的最優解,所以可以給出精準的提示。而對於寫作,完全是發散式的,可能性太多,極難預測,同樣的交互也許就不一定適合普通寫作。

技術挑戰

很多做過或者瞭解 RAG 的都知道,現在 AI 搜索,看起來技術不複雜,但是做好其實極難,根據用戶的輸入找出貼切的上下文是極難的事情。要做好 AI 寫作,難度不會比 AI 搜索更小,因為本質就是先根據你當前輸入的內容,去做 AI 搜索,找出以前相關的內容,甚至要去搜索外網相關的內容,再結合輸入位置前後的內容和你的要求幫你寫作。

當然還有很多其他挑戰,我也無法一一列舉。

下一個 AI 寫作工具的機會在哪裡?

我以為下一個 AI 寫作工具的突破可能首先會是郵件客戶端,郵件寫作是高頻需求,整理郵件也是一大痛點,相對來說郵件的數據也容易拿到,用戶只要安裝了客戶端,綁定郵件帳號,就可以在用戶的允許下拿到用戶的所有郵件數據,並且可以結構化的整理郵件數據,比如和某個人、某個組之間的所有對話,比如某一類對話。

如果有信得過的郵件客戶端,能幫我連接 GPT-4o 和 Claude 3.5 這樣的 API,能根據我需求智能撰寫回覆郵件,能根據我需求整理郵件清理垃圾郵件,對我的生產力會是很大提升。

AI 郵件客戶端之後,可能會是公文寫作,幫助你把歷史內容都做好索引,學習你的寫作風格和文章結構,根據你採納建議的反饋不斷完善模型。

專業翻譯類的 AI 工具,是值得好好做的,書籍的翻譯、文章的翻譯、字幕的翻譯,都是可以借助 AI 大幅提升生產力的地方,好的翻譯工具,效率的提升可能是數倍記的。

在 GitHub Copilot 之前,我沒想到 AI 可以這樣輔助編程,再到 Cursor,我也沒想到交互還可以進一步進化到這樣方便的程度。所以對於 AI 寫作工具也是類似的,我不覺得 Cursor 就是天花板,未來一定有超出我想像的更好的交互形式出現,可能唯一限制我們的就是我們的想像力吧。

期待大廠能做出適合普通人的好用的引領未來的 AI 編輯器,而不是去山寨一個 Cursor 出來!相比而言,我更看好小團隊或者個人,他們比大廠更有機會開發出像 Cursor 這樣吊打大廠們的 AI 工具。