2024數博會召開 微博張俊林:人工智能的發展應該服務於人

8月28日,2024中國國際大數據產業博覽會在貴陽舉辦,微博首席科學家、新技術研發負責人張俊林受邀出席大會,在「智能經濟創新發展」交流活動中,圍繞「人工智能賦能經濟社會高質量發展」議題進行了分享。

作為新一輪科技革命和產業變革的重要驅動力,人工智能正以前所未有的速度滲透到各行各業,推動經濟社會各領域從數字化、網絡化向智能化躍升,成為引領經濟社會高質量發展的關鍵力量。

張俊林表示,人工智能是新質生產力的重要組成部分。如今所說的生成式人工智能最主要特徵就是通用性,它能夠給千行百業帶來賦能、增效、提產,也能給很多領域帶來全新的工具和方法。如在藥物研發過程中,AlphaFold系列模型對於人體蛋白質結構的預測能力大幅提升,這項技術代表了分子建模和藥物發現的巨大飛躍,對很多新藥的開發都有促進作用,相信每個人未來都會從中受益。

「再如,在搜索方面,人工智能也具有顯著價值。」張俊林舉例,「比如用傳統搜索查找信息時,成本會比較高,在搜索結果中還需要每個點開去尋找。但如果與大模型結合,只需要一句提問,基本上就能得到一個可靠答案。目前來看這種結合非常有前景,對搜索體驗的改善非常明顯。」

隨著通用大模型的快速發展,公開的訓練數據面臨枯竭。對此,張俊林表示,目前行業為了應對這一困境,已經摸索出一個通用的解決方案——合成數據,也就是大模型自主產生數據來訓練下一代模型。張俊林指出,國內也在普及這個方式,「大模型怎樣產生好的訓練數據來訓練下一代?這是通用大模型在數據方面的一個重要發展方向。」

張俊林還現場分享了微博做大模型的相關經驗。「微博自研了‘知微大模型’,也開發了很多微博場景內的大模型應用,得出的經驗是:在垂直場景化的應用里,其實並不需要規模特別大的模型,但前提是要有優質的行業場景數據。具體來講,用中小規模的模型,結合高質量場景數據做出來的應用效果,比單純用大模型、不使用高質量場景數據會好得多。」

談及人工智能的未來發展,張俊林表示,大模型的數據來源於人,算法也是由人設計,所以人工智能的發展從始至終都應該服務於人,從數據、算法到模型服務目標,都應該以人為本。