開源化、多元化、商業化,Google杠上了大模型
編輯 | 楊博丞
題圖 | IC Photo
在日前Google舉辦的2024年I/O Connect ChinaGoogle開發者大會上,AI大模型多元化成為市場關注的焦點。
圍繞APP軟件開發,Google推出三種不同規格的Gemini模型。Google方面稱,Gemini Nano是最高效的模型,適合處理設備端任務。
據悉,Gemini 1.5 Flash是Google迄今為止最快、最經濟的模型,適合處理高容量任務。面對所有開發者開放的Gemini 1.5 Pro,支援200萬token 上下文窗口。為減少算力消耗,Gemini 1.5 Pro和1.5 Flash均已上線上下文緩存功能。
考慮到開發者可能需要更大的靈活性和掌控力,Google推出Gemini姊妹大模型Gemma。新發佈的Gemma2相較於Gemma,新增90億和270億參數兩種規格。其中,270億參數版本經過優化,同時支援Google Cloud上的單個英偉達GPU以及Vertex AI單個TPU運行。
目前Gemini相關大模型已集成到Android Studio、Chrome DevTools、Project IDX、Colab、VS Code、IntelliJ和 Firebase等開發工具中,可幫助開發者編寫、調試、測試代碼、生成文檔、理解代碼庫等。
以Flutter為例,小米SU7配套應用就是基於Flutter所打造。在原有Flutter基礎上,Google推出Flutter 3.24和 Dart 3.5。新版最大看點是“Flutter GPU”新API的早期預覽版。如通過內置 Flutter SDK,開發者可使用Dart代碼訪問GPU,進而提高圖像渲染能力。
為方便開發者使用,Google推出多個Package。如Flutter_Scene可將3D項目直接導入,進而提高遊戲體驗。
此外,Google也推出Android Studio ON IDX早期預覽版,和原有Android Studi不同的是其支援在瀏覽器中完全運行。為保證借助AI構建應用的可靠性、合規性和安全性。Google推出包括如Firebase AI Monitoring 信息中心、Checks AI Safety等開發組件。
在AI大模型開源席捲全球下,Google推出開源大模型項目Project Oscar。但初始階段,Project Oscar僅支援93000條代碼提交以及2000名開發者Go編程語言項目。
圍繞Web網站開發,隨著Web GPU、WASM和Gemini內置到Chrome中,Google全新推出的Speculation Rules API可做到搜索即時導航,擺脫冗長頁面加載。面向單頁應用推出的View Transitions API,可提高頁面過渡體驗。二者結合,進而保證頁面過渡的無縫銜接。
為保證Web開發者開發效率,Google順勢推出試和優化應用Chrome DevTools,其在開發者網站出現問題時會發出警告和錯誤提示。該應用已內置到Gemini中。
圍繞下一代Android原生應用開發,Google推出多款新產品。設備端AI模型Gemini Nano和系統服務AI Core;用於業務邏輯共享代碼,適用於移動端、Web、服務器和桌面平台的Kotlin Multi Platform;並為DataStore、Room和ViewModel等多個Jetpack庫添加Kotlin Multi platform支援。
測試平台Android Device Streaming,則聯合小米、OPPO、一加、Samsung等手機廠商,方便開發者進行終端測試,現處於Beta階段。Gemini in Android Studio納入Android Studio穩定版,新增代碼生成和代碼轉換功能,以及AI隱私設置控制數據分享功能。
圍繞雲業務,Google提出的雲端新旅程具有五大特點:一是雲上開發新範式,新推出的Vertex AI功能可實現上下文緩存和接地功能。二是自成體系的靈活擴展,新推出150多種模型,包括Gemini系列、Gemma開源模型、Anthropic Claude模型、Meta Llama模型和Hugging Face模型庫。
三是打破壁壘的跨雲之旅,新推出的優化PostgreSQL數據庫和BigQuery Omni功能,支援跨雲互聯和聯合查詢以及多“雲”協同。四是輕鬆實現強大功能,新推出的自動化與智能預設設置,搭建全套雲基礎設施只需45分鐘,包括網絡、身份驗證和日誌記錄等。
五是AI智能助力,新推出的Gemini Code AssistIDE插件,提供代碼生成、補全、解釋和測試生成功能。Gemini in Databases則提供SQL生成和數據庫操作智能化。
圍繞開發者發佈多款大模型,無疑彰顯Google想要加速推進大模型商業化的決心。但目前Google的AI能力,尤其是輸出和檢索能力可能仍需提高。
今年6月份海外用戶在詢問Google“製作披薩使用多少膠水”問題時,GoogleAI搜索給出的答案為:據Business insider2024年5月的相關顯示文章,GoogleAl搜索結果建議在披薩醬中加入1/8 杯,即2湯匙,白色無毒的膠水,以防止奶酪滑落。
文章作者KatieNotopoulos 表示,膠水沒有明顯改變醬汁的稠度,而披薩呈現出誘人的橙色。海外媒體The Verge驗證後發現,該截圖並非偽造。因披薩中不能加入任何膠水,該答案也引發海外用戶對GoogleAI檢索能力的質疑。
我們在對Gemini實測過程中發現,一方面Gemini文生圖能力已被關閉,且Gemini暫時也不支援文生視頻。另一方面,Gemini的邏輯推理、數學計算能力仍需提高。
我們將2024年高考數學真題給到Gemini且特意強調是多選題,三道題目正確答案分別為(BD)(ACD)(ABC),但Gemini給出的答案分別是(AC)(AD)(AB),雖說第10題和第11題Gemini的答案包括正確選項,但第9題卻全部是錯誤選項。
此外,隨著Google大模型日益增多,正面臨數據中心電力消耗產生的二氧化碳排放迅速增加的棘手問題。
Google相關環境報告指出,2023年僅Google數據中心電力消耗就增長17%,由電力消耗所產生的二氧化碳汙染較2022年同期增長13%至1430萬噸,大致相當於38家燃氣發電廠每年可能排放的二氧化碳量。
不僅僅是Google,Microsoft2023財年的溫室氣體排放量比 2020年高出約30%。對於未來如何降低碳排放,Google相關報告指出,隨著我們進一步將人工智能集成到我們的產品中,由於人工智能計算強度的增加導致的能源需求增加,以及與我們的技術基礎設施投資預期增加相關的排放,減少排放可能具有挑戰性。
按照當前AI大模型發展速度,未來對電力需求或將成倍增長。作為全球擁有最多數據中心的美國,引發當地民眾對人工智能壓倒電網的電力需求急劇上升的擔憂,並可能使煤炭和天然氣工廠的存在時間比其他方式更長。
商業化、輸出質量穩定化、減碳化等各種問題的存在,即使對於Google這樣的全球大廠短期內也難言輕鬆。