桑治婷婷代表:大模型升級高質量數據短缺 建議擴大公共數據開放

1月14日上午,北京市第十六屆人民代表大會第三次會議開幕,市長殷勇作政府工作報告。報告提出,要提升優勢產業發展能級,完善新一代信息技術、人工智能等產業支持政策。

北京市人大代表、北京快手科技有限公司副總裁桑治婷婷本次上會就帶來了關於進一步支持北京市人工智能產業發展,以及進一步加強青年科技人才工作的兩項建議。其中具體的建議內容包括擴大公共數據開放以幫助影片模型訓練,以及降低青年人才創新創業門檻等。

北京市人大代表、北京快手科技有限公司副總裁桑治婷婷 新京報記者 羅亦丹 攝北京市人大代表、北京快手科技有限公司副總裁桑治婷婷 新京報記者 羅亦丹 攝

支持民企更多承擔AI領域重大科研項目 開放更多公共數據和科研數據

桑治婷婷告訴新京報記者,為更好地促進北京市人工智能產業發展,建議支持民營企業更多承擔人工智能領域重大科研和產業化項目。

對於人工智能領域的研究,新京報記者注意到,在2024年年末因AI方向的貢獻而獲得盧保獎的兩位科學家傑佛瑞·辛頓和戴米斯·哈薩比斯均是Google旗下的科學家。其中哈薩比斯就在獲獎後的訪談環節表示,「我不認為在公司做研究和在學院做研究有什麼不同,無論在哪,只要方法得當,都能做出偉大的科學成就,許多新興科學、新領域和新的研究發現需要大量資源,比如我們需要大量計算機資源和資金,因此為什麼不利用私營部門的資金來支持這些研究呢?」

桑治婷婷建議,對於政府主導的人工智能重大科技計劃項目和產業項目,建議從政策層面向民營科技企業傾斜,明確相關政策、資金支持方式、項目評審標準等,為民營企業科技創造更多機會。同時,基於當前大模型訓練資金和人才門檻越來越高的現狀,建議設置「大模型財政補貼專項」,用於幫扶科技企業開展人工智能技術研發和人才培養,為民營企業科技創新提供更有力的支撐。

在影片生成大模型領域,快手於2024年6月推出的可靈大模型目前累計生成了5100萬個影片、1.5億張圖片,在國際上受到廣泛關注。但桑治婷婷表示,與國際上領先的科技企業相比,我國企業在人工智能研發方面普遍面臨高質量3D、影片數據短缺的問題。據相關機構統計,當前中美兩國企業在網站和APP端的訓練數據總量相近,但我國企業可直接利用的開源數據集佔比較低,只有近5%。適合影片生成模型訓練的數據就更少。

她建議從政府層面加大協調力度,通過政策引導和激勵機制開放更多公共數據和科研數據,為人工智能領域研發提供更多高質量的開源數據資源。

另外,當前高性能GPU短缺製約我國人工智能產業發展,桑治婷婷建議,從政府層面組織開展聯合技術攻關,支持互聯網企業參與國家新型研發機構建設,,共同在基礎研究和前沿技術方面佈局如超大規模人工智能算力網絡領域等路徑探索,針對核心關鍵技術如高性能影片處理與AI 芯片、算力調度人工智能模型、影片編解碼算法等重點領域開展聯合攻關,破除人工智能領域技術研發的根本障礙。

完善人才引進培養機制 營造良好創新創業氛圍

對於人工智能大模型等高新技術行業的發展,青年科技人才是必不可少的核心力量。在人才引進方面,桑治婷婷建議降低人才落戶門檻,吸引更多優秀青年、海外高層次人才和緊缺人才。同時,通過政府搭台、企業參與的方式,舉辦各類人才交流會、招聘會,為用人單位和人才搭建高效對接平台。

在人才培養方面,桑治婷婷建議有關政府部門推動高校、科研院所與企業的合作,培養有創新能力和實踐能力的高素質人才,同時支持設立青年人才創新創業基金,鼓勵青年人才開展科技創新創業活動。

在人才服務方面,她建議搭建專門的青年人才「一站式 」服務平台,將人才引進、培養、評價、服務等環節整合到一個平台上,方便青年人才辦事,同時根據人才的不同需求,提供個性化的政策諮詢、生活指導等服務。

此外,在大城市生活成本較高的情況下,良好的生活保障措施對吸引青年人才至關重要。建議進一步擴大人才公寓建設規模,為更多青年人才提供住房補貼或廉租房,對於符合條件的青年人才提供購房補貼或優惠貸款,以更大力度減輕青年人才住房壓力。

新京報記者 羅亦丹 編輯 王進雨 校對 柳寶慶