小白必讀:AI入門指南,及實用工具推薦

DeepSeek火爆,AI學習的熱潮也吹到了我們公司,上週給公司的同事做了一期關於AI入門的分享,感覺內容非常適合小白入門瞭解AI,於是整理成文章,作為我AI入門科普的總集和收尾,後面會更專注寫一些進階的內容。

如果你當下對AI還是雲裡霧裡,半知不解,那麼非常適合閱讀這篇文章,讀完就能幫助對AI建立一個基礎的認知,簡單瞭解AI的技術原理,AI生成內容的本質,為什麼能生成內容,AI能做什麼,提示詞如何寫,以及實用好用的AI工具和AI幻覺應對的方法等。

一、大語言模型為什麼會在今天出現?

OpenAI的ChatGPT發佈在2022年,為什麼AI會在這個時候發佈?主要是因為這三樣東西滿足了條件:

1.算法:機器學習範式的突破

2017年Google團隊開創的Transformer架構,通過神經網絡模型學習語言規律,實現文本理解與生成。如Transformer架構可捕捉長距離語義關聯,GPT系列模型通過自注意力機制預測詞序列。

2014年生成對抗網絡(GAN)的技術創新,通過生成器與判別器的對抗訓練,實現圖像/影片的創造性輸出。如Phenaki模型可根據文本生成連貫影片,DALL·E能跨模態生成圖像。

當前的AI工具基本都基於Transformer架構和生成對抗網絡(GAN)這兩個算法技術,算法的突破是當前AI誕生的原因之一。

2.數據:海量知識庫的積累

AI需要學習海量的高質量數據才能從中找到規律,模仿人類生成內容。

隨著互聯網和生產力的發展,近二十年人類生產的內容可能比過去幾千年還多,這些海量的數據積累讓AI有了足夠的「學習資料」,可以通過學習去瞭解分析分析數據中的語法結構、視覺特徵等潛在規律從而模仿人類進行創作。

如果沒有這些高質量的數據資料,AI可能根本找不到人類文本的規律。

3.算力:硬件性能的飛躍

過去人類的顯卡算力沒有辦法處理如此海量的數據,現在像NVIDIAH100集群可以支持1750億參數模型訓練,再有分佈式計算技術的發展,像GoogleTPUv4實現了每秒2.3exaflops運算能力,這種超強算力讓AI模型訓練時間從幾年縮短到幾週甚至幾天。

綜上所述,簡單來說,算法,數據,算力三者都滿足了AI誕生的條件!

二、為什麼AI能生成內容?

以DeepSeek為例來說明。

如果用一個比喻來描述DeepSeek,它大概就像是你的一位非常博學多才的朋友,讀過浩如煙海的書籍,還能瞬間在腦海中建立起各種知識之間的聯繫。這就是現代大語言模型的工作方式,而支撐這種能力的核心,就是上文提到的Google團隊開創的Transformer架構。

Transformer最厲害的本事,就是它的「注意力機制」。打個比方,當你在看一本書時,普通人需要從頭讀到尾,而Transformer就像是一個「超級讀者」,能夠一眼就找到文本中最關鍵的信息,並迅速理解它們之間的關聯。

DeepSeek在「成長過程」中「閱讀」人類積累的海量知識,從枯燥的域奇百科到優美的文學作品,從前沿的學術論文到專業的技術文檔,通過不斷預測句子中缺失的詞,逐漸掌握了語言的規律,知道了某個詞後面出現哪個詞的概率更大。

所以AI生成內容的方式是概率最大化,也就是「猜」,通過海量數據來預測下一個單詞,而不是真的理解了人類的說的到底是什麼意思。

也就是說AI只是一隻鸚鵡,它並不是真的理解現實世界,也不是通過邏輯推理來回答我們的問題。

現在的大語言模型跟我們在影視劇中看到的,比如像威爾·史密夫主演的《我,機器人》中的人工智能完全不一樣,我們與AGI距離依舊無限遙遠,當然可能並不是壞事。

三、AI到底能做什麼?

1.AI基礎能力

DeepSeek火爆之後很多人對AI有了不切實際的期待,以為AI什麼都能做,這是一個很大的誤區。就像我上文說的,現階段AI的主要能力主要是生成文本等,所以可用範圍基本局限在內容創作當中。

下圖我就羅列了四種最基礎的AI能力:文本生成、圖片生成、影片生成和音頻生成。AI是什麼,AI之於我是創造的源泉,創造的能力和創造的工具。

下面這個影片就是將AI的多模態能力整合做的一個《舌尖上的中國》風格的奧特曼搞怪影片。

具體的製作路徑是先用DeepSeek生成腳本和具體的文案,然後再使用Whisk生成靜態圖片,用可靈根據靜態圖片生成影片畫面,最後用剪映的AI配音功能生成音頻,合成為一個完整的影片。

2.AI進階能力

基於上面這些基礎功能,現在的AI還延伸出了一系列的其他的能力,像豆包聊天機器人、秘塔AI搜索、Manus這種都是對某方面的能力進行了強化,或者與其他工具組合後誕生的AI工具。

Manus、秘塔AI搜索等我們都可以理解為AI智能體,原本AI智能體的定義是能夠感知環境、做出決策並採取行動以實現特定目標的人工智能系統。但現在我們對其定義已經泛化了,像豆包上面的各種聊天機器人都被稱為智能體。

順著這個邏輯,現在市面上的智能體可以被理解為一個具有輸入-處理-輸出能力的人工智能系統,核心在於對信息的處理和響應能力,不同程度的智能體在自主性、感知廣度和決策複雜度上存在差異。

豆包上面的智能體聊天機器人我們就可以理解為是初級智能體,而像Manus這樣的「通用型AI智能體」相對就更高階了,能做的事情也更多。

基礎如豆包聊天機器人,可以根據我們設定的prompt做出特定的回覆。下圖就是我做的一款男友聊天器,他會像男朋友一樣和你聊天,給到充足的情緒價值。

更進一步的AI智能體像秘塔AI搜索,則是在搜索方面做了進一步的優化,可以自主拆分問題,然後搜索相關資料,最終將答案彙總。

相比直接和基礎大模型聊天,AI搜索工具給到的內容更全面,更詳細,幻覺發生的概率也更低。

而Manus這樣的智能體相比豆包的聊天機器人和秘塔AI搜索能做的事情就更多了,當我們告訴它需要做的事情後,它可以自己思考規劃任務,通過自動瀏覽網頁,調用各種工具來完成複雜任務。

做一份行業趨勢分析,旅遊攻略,抑或編寫一個小遊戲這些功能都不在話下。而且全程無需人工干預,它自己就一步步去完成。

隨著技術的進步,智能體將擁有更高級的特性,如更強的自主性、更廣泛的環境感知和更複雜的決策能力。

AI Agent也確實是AI發展的重要趨勢之一,它們正在彌合強大AI能力與實際應用場景之間的鴻溝。

對普通用戶而言,AI不再是一個需要精心「喂養」提示詞的工具,而是一個能真正理解並執行任務的助手。對企業而言,AI Agent能大幅降低AI落地的門檻,讓更多行業和場景能夠切實享受到AI帶來的效率提升。

未來的某個時刻,或許人類真的就可以脫手生產,擺脫重覆性的勞動,去從事更有創造性的工作了。

四、如何與AI交流?

現在大多數人對AI的重點還是放在了無所不知上,卻忽視了AI沒有現實世界的體驗。如果要用一個比喻來形容AI,那「全知全能的實習生」再合適不過了,什麼都懂,但什麼都不會。

所以怎麼和AI溝通就變得非常重要了。

這一塊我重點分享幾個適合普通人的AI提示詞技巧和溝通技巧,學會了這幾個技巧,我們在和AI溝通時效率會高很多。

1.AI提示詞技巧

語言的邊界是世界的邊界,AI能力的發揮取決於我們語言的運用。

AI提示詞(Prompt)是用戶與AI大模型交互的關鍵工具,其本質在於借助自然語言指令引導AI生成特定內容或達成任務的輸入信息。

例如,輸入「撰寫一篇有關火星探索的科普文章」,AI便會依據該提示生成相關內容。提示詞的清晰程度和詳細細節直接對AI生成內容的準確性與質量產生影響。

一般來說我會將提示詞分為以下三種,這三種是可以同時出現的,只不過某些簡單的需求使用簡單提示詞就夠啦。

我們寫提示詞的時候可以遵從這三種來。

  • 任務型提示詞。直接指定任務,像「翻譯以下英文段落」或者「生成300字的產品文案」,適用於需求明確的場景。

  • 角色型提示詞。經由設定角色來引導AI輸出,例如「假設您是資深營養師,設計一週減脂食譜」,這樣能夠增強專業性與創意性。

  • 結構化提示詞。採用模板化指令(如CRISPE原則:清晰、角色、步驟、示例、反饋),以提高AI的理解效率。例如:

角色:資深文案策劃

任務:撰寫新能源汽車廣告語

要求:包含科技感、簡潔有力、目標用戶為30-40歲男性。

經典提示詞賞析:

DeepSeek提示詞庫:

如果還是對提示詞一知半解的,可以直接去閱讀DeepSeekAPI文檔裡面的提示詞庫,瞭解學習寫法。(鏈接:https://api-docs.DeepSeek.com/zh-cn/prompt-library/)

2. 分解複雜任務

現階段AI由於上下文,模型能力等問題,其實在處理複雜任務的時候時常會出現「偷懶」這種情況,這種時候就需要我們幫AI拆解任務。

接下來用寫一篇「遠程辦公的未來發展」的文章為例,告訴大家怎麼一步步指導AI完成高質量寫作。

3. 連續提問技巧

不要指望AI能一次性完成你想要的內容,在使用AI時要調整好心態,把它當作一個博學但經驗尚淺的實習生。它知識面很廣,但需要你的引導才能交出令人滿意的作業。

比如我們讓AI寫一個咖啡店的開業方案,剛產出的第一版大概率是不符合我們的需求,我們可以通過繼續提問的方式讓它優化內容,直到符合我們的要求。

以咖啡店開業方案為例,AI寫的第一版方案沒有很好地突出「大學生」這個目標客群。這時候,別急著否定,而是可以這樣優化對話:

掌握這三個AI溝通的技巧,可以大幅度提升使用效率和生成內容的質量。

五、2025年AI工具推薦

之前我寫過一篇2025年AI工具推薦的文章,已經非常全了,感興趣的朋友可以閱讀一下這篇:《從ChatGPT、DeepSeek到可靈、豆包,2025年AI工具全景圖,從入門到精通,這一篇就夠了》。

六、AI使用注意事項

最後再講一個要點,AI都會有幻覺,尤其是DeepSeekR1,幻覺率高達14%,所以千萬不要輕信AI。

AI幻覺就是AI編造看似合理但實際錯誤的信息。比如你讓AI引用論文,它可能會虛構不存在的論文。就像早期AI會告訴你北京有埃菲爾鐵塔,因為它把「北京是中國首都」和「巴黎有埃菲爾鐵塔」這兩個知識點錯誤地混在了一起。

1. AI產生「幻覺」的原因有哪些?

首先,AI本質是在猜下一個詞。它不真正理解世界,只是通過統計關係預測最可能的下一個詞。就像「春天來了,小草…」後面大概率是「發芽了」。猜得越多,出錯可能性越高。

其次,訓練數據本身可能有錯。AI就像只能根據讀過的書回答問題,書里有錯,回答自然也會錯。

再者,通過擬合問題。這就像學生不僅記住知識點,還把教材的每個例題、每句話都背下來,遇到不同的場景時就懵了。

此外,AI的上下文限制(約64K或128K詞)和被設計成必須回答的傾向,也會導致它在不確定時編造答案,就像考試時不會的題也要瞎寫一樣。

2. 如何降低AI「幻覺」

技術上,可以用更高質量的數據集,對數據嚴格篩選清洗,或者利用人工反饋引導模型。還可以讓AI生成多個答案再投票選出最可靠的答案,或用思維鏈讓AI展示推理過程。

日常使用時,給AI設置明確邊界,比如限定在特定範圍內回答,或明確要求基於事實不要推測。也可用不同AI交叉驗證,或利用RAG技術提升準確度。

RAG技術是現在減少AI幻覺的主流方法。相當於給AI配個專業知識庫,先檢索相關事實,再基於這些信息回答。普通AI像是在參加閉卷考試,而使用了RAG技術的AI是開卷考試,自然更準確!

3. AI「幻覺」的潛在價值

AI幻覺也不一定全是壞處,它也能啟發創意,提供意想不到的觀點和靈感。在藝術領域,可能帶來獨特效果和驚喜。在科研中,雖然最初可能是錯誤的假設,但可能啟發新的研究方向,拓寬思路。

4.普通用戶應對AI「幻覺」的建議

借用《三體》的話:「不要輕信,不要輕信,不要輕信」。特別是健康問題上,不要拿AI的診斷建議質疑醫生,或自行治療。時刻保持警惕,別盲目相信AI。

更詳細的內容也可以看這篇內容:為什麼AI這麼能編?深度解析大模型的「幻覺」機制

最後,簡單總結一下。

隨著DeepSeek的走紅和AI技術的普及,我們正站在人類認知革命的風口浪尖。從算法的突破、數據的積累到算力的飛躍,AI的誕生不是偶然,而是人類智慧長河中的必然產物。

未來已來,但未來不是由AI決定的,而是由我們每一個人共同塑造的。讓我們懷著好奇心和批判精神,與AI共同創造一個更加美好的明天。

在這個AI與人類共同演進的新紀元,希望這篇入門科普能為你打開認知的一扇窗,讓你不再對AI感到雲裡霧裡,而是能夠自信地駕馭這個強大的工具,在自己的領域創造更多可能。

本文來自微信公眾號:田威AI,作者:田威