生產力提升30%,微軟最大規模調研報告出爐,AI工具成打工人效率神器

AI在現實工作環境中如何影響了工作效率?微軟髮起一項最大規模的調查研究,AI工具在工作場景中最大提效30%。

對於每個打工人來說,AI工具就像小助理,想不出來?要趕deadline?先交給AI頭腦風暴一下。

寫文案可以用AI,做PPT可以用AI,做設計也可以用AI。

AI到底能在多大程度上提升我們的辦公效率?微軟最近搞了一項迄今為止關於工作場景下GenAI的最大規模研究,涉及來自60多家公司超過6000名員工。

報告地址:https://www.microsoft.com/enus/research/uploads/prodnew/2024/07/Generative-AI-in-Real-World-Workplaces.pdf

微軟於2023年12月發佈了第一份人工智能和生產力報告,報告主要得出了一個結論:AI工具有可能為信息工作者執行的任務帶來生產力的階躍函數提高。

報告地址:https://www.microsoft.com/enus/research/uploads/prod/2023/12/AI-and-Productivity-Report-First-Edition.pdf

半年前的研究主要由基於實驗室的研究組成,在這些研究中,參與者使用生成式人工智能工具在受控的模擬工作環境中完成研究人員設計的任務。

現在,越來越多的人可以使用生成式人工智能工具,這些工具在實驗室環境之外、在人們執行日常工作時會有什麼影響?

因此,第二份Microsoft AI和生產力報告重點關注人們如何將Copilot和其他生成式AI工具應用到日常工作中。

場景:工人在工作中使用AI

研究人員與60多個組織(包括各行各業6000多名員工)合作,對Copilot for Microsoft 365進行了大規模隨機對照現場實驗,參與者在日常工作中使用AI工具而不是研究人員在實驗室環境中模擬。

Copilot for Microsoft 365將生成式AI工具結合到了Word、Excel、PowerPoint、Outlook、Teams等應用程序中。

每個組織至少預留50個許可證,隨機分配給該組織指定的100名或更多Microsoft 365用戶。

研究人員使用這些組織中Microsoft 365的元數據,比較了電子郵件、會議和文檔的使用情況。

研究人員發現,與沒有使用Copilot的人相比,使用Copilot for Microsoft 365的人平均閱讀的個人電子郵件數量減少了11%,使用郵件的時間減少了4%。

一些企業電子郵件閱讀量和與寫郵件的時間相對減少了20%或25%。

研究人員推測,Copilot for Outlook中的電子郵件摘要功能和Copilot聊天功能可能允許工作人員檢索信息,而無需閱讀或重讀單封電子郵件。

Copilot對參加會議數量(通過 Microsoft Teams)的影響更為複雜,增加、減少和基本不變的情況都有出現。

有10個組織的出席會議數量出現了統計上的顯著減少,平均每天減少0.39次會議,而在Copilot之前平均每天有3次會議。

Teams Copilot提供會議摘要,並使用記錄來回答用戶在會議期間或會議後可能提出的問題,增加可能反映了 Teams Copilot使用的增加,但並不表明總體會議數量的增加。

在文檔方面,使用Copilot的人比沒有使用Copilot的人創建和編輯了更多的文檔。

總體而言,人們編輯的文檔數量增加了10%,其中Word、Excel 和 PowerPoint的重度用戶編輯數量增加了13%,一些企業的增幅達到25-30%。

Copilot 提供的寫作和創作幫助,使生成和修改輸出變得更容易。或者,人們可能會利用Copilot節省的一些時間來進行其他文檔創建和編輯。

辦公趨勢指數

為了瞭解生成式人工智能對工作場所生產力和滿意度的影響,微軟開展了2024年辦公趨勢指數調查。

這項匿名調查由Edelman Data & Intelligence對31個國家/地區的3.1萬名全職僱員或個體工作者進行。

該調查旨在廣泛捕獲用戶對生成式人工智能的看法和體驗,而不是關注Copilot等任何特定的生成式人工智能工具。

調查的一項重要發現是,在使用人工智能的受訪者中,78%的人至少使用了一些其組織未提供的人工智能工具。

這突顯了一個重要現象,即許多員工會主動尋找外部人工智能資源來滿足他們的日常使用需求。

此外,工作趨勢指數數據分析的一個重要焦點是「人工智能高級用戶」,研究人員將其定義為熟悉生成式人工智能、每週至少在工作中使用幾次、每天節省超過30分鐘的個人。

29%的AI用戶可被歸類為「高級用戶」,他們表示通過使用 AI 每天可以節省超過30分鐘的時間。

下表展示了每個要素在提高人工智能使用頻率方面有多大幫助,分數越高表明重要性越高。

在此分析中,分數範圍從361到882,突出顯示了影響AI高級用戶的重要因素是AI工具豐富和提高工作效率。

並且,調查結果發現,AI工具的影響因職位角色和職能而異,客戶服務和銷售員工的生產力提升最大,而法律專業人員的改善較小。

AI搜索引擎

搜索是工作流程中的一項常見任務,為了瞭解人工智能增強搜索的使用與傳統搜索有何不同,研究人員隨機選擇的8萬個樣本,分析了傳統Bing搜索和使用Copilot Bing搜索的不同數據。

研究發現,與Bing Copilot的聊天往往集中在與知識工作相關的主題,例如「翻譯和語言學習」、「創意寫作和編輯」以及「編程和腳本編寫」。

總體而言,72.9%的Copilot對話屬於知識工作領域,而Bing搜索會話的這一比例為37%。

然後,研究人員使用GPT-4根據Anderson和Krathwohl的分類法對與每個搜索會話相關的任務進行分類,該分類法定義了從最低複雜性到最高複雜性的六個類別:記憶、理解、應用、分析、評估和創建。

就完成「記憶」任務來看,超過四分之三的傳統搜索會話是用於完成「記憶」任務,而使用使用Copilo搜索這一比例不到二分之一。

「記憶」和「理解」被歸為低複雜性任務,其餘任務則歸為高複雜性任務,結果發現13.4%的傳統搜索會話和 37%的Copilot會話屬於高複雜性任務。

也就是說,人們常常把人工智能增強搜索用於比傳統搜索更複雜的領域。

研究人員將傳統搜索和Copilot之間任務領域和複雜性的轉變解釋為生成式人工智能的幫助。

多語言環境

研究人員在多語言環境中研究Copilot如何促進使用不同母語的同事之間的協作。

首先,研究人員要求77名母語為日語的人回顧一次用英語錄製的會議。

一半的參與者必須觀看和收聽影片,另一半可以使用Copilot Meeting Recap,提供人工智能會議摘要以及回答有關會議問題的聊天機器人。

然後,研究人員要求其他83名母語為日語的人回顧一次類似的會議,遵循相同的腳本,但這次會議以日語舉行。同樣,一半的參與者可以使用 Copilot。

對於英語會議,使用Copilot的參與者正確回答有關會議的多項選擇題的比例提高了16.4%,獲得滿分的可能性增加了一倍多。

此外,在比較兩種場景之間的準確性時,使用Copilot聽英語會議的準確率達到了97.5%,比使用標準工具聽母語日語會議的準確率 (94.8%) 略高。

研究人員對在日常工作中使用Copilot的人進行採訪時也提到了Copilot在非母語人士交流中的作用。在跨國公司中,Copilot可以幫助人們進行有效溝通。

總結一下以上的研究報告,微軟強調,在日常工作中使用GenAI可以顯著提高生產力,但同時也承認效果可能會根據環境和使用情況而有所不同。進一步的研究將探討企業如何才能最好地促進人工智能的高效利用。

參考資料

https://www.microsoft.com/enus/research/uploads/prodnew/2024/07/Generative-AI-in-Real-World-Workplaces.pdf

本文來自微信公眾號「新智元」,作者:耳朵 祖楊,36氪經授權發佈。