提供 RAG 即服務融資 550 萬美金,最新消費榜單顯示 AI 會議產品已是剛需

我在上個月分享了一個趨勢,就是在模型層與應用層之間,有很多企業需求並沒有得到很好的滿足,於是有不少產品開始提供 API 來滿足兩者之間的落差《AI 的一個新趨勢:如何更好的滿足模型層與應用層》。

提供這塊服務的有 3 種類型,一種是像 Fireworks 和 Cohere 等直接面向 B 端企業提供 API 服務的產品;第二種是一些 ToC 的產品,它們在服務 C 端的同時,積累了⼤量專業的⾏業數據和 Knowhow,於是把這種能⼒迭代到⾃⼰的 API 中,再將 API 提供給廣大的中小企業;讓這些在 C 端沒怎麼賺到錢的產品,反而通過 B 端開始掙錢了;

而第三類就是專門做 RAG 服務的產品。今天,又一個提供 RAG 即服務(RAG as a Service)的產品 Ragie 宣佈完成了 550 萬美金的種子輪融資,由 Craft 領投,Saga VC、Chapter One 和 Valor 跟投。

Ragie 在其官方博客說,大多數公司依賴 LLM 大模型提供商,如 OpenAI 和 Anthropic,結合一種稱為 RAG(檢索增強生成)的技術來進行他們的 AI 應用。RAG 利用公司自己的數據生成比單獨訓練模型生成的更有洞察力的內容。為此,公司在向量數據庫中提取數據並建立索引,將其輸入提示中,並生成更全面、更準確的內容。

但是使用 RAG 構建應用的過程非常繁瑣,開發者必須要做到這些:

  • 連接和同步多個數據源,包括知識庫應用和雲文件存儲;

  • 從各種文件格式和媒體類型(例如 PDF、Microsoft Office 文檔和圖像)中提取有意義的數據;

  • 實施不斷髮展的分塊和檢索技術;

  • 構建彈性且快速的可擴展數據處理管道;

  • 避免產生幻覺並確保生成的內容準確;

  • 使用學習和設置可能非常耗時的開源框架;

構建類似這樣的解決方案不僅耗時,而且即使團隊盡了最大努力,最後的產品也很脆弱。現在 Ragie 通過為開發人員提供完全託管的 RAG 即服務平台解決了這個問題。 

Ragie 最初是作為 Craft Ventures 創始人 David Sacks 的新聊天應用 Glue 的解決方案開發的,它實現了強大的數據攝取管道和檢索 API,該 API 使用 RAG 中的最新技術進行分塊、搜索和重新排名。通過簡化的開發人員體驗,開發人員可以將他們的應用程序與 Google Drive、Notion 和 Confluence 中的數據連接並同步。

除了提供開發人員所需的 RAG 核心功能外,Ragie 還提供高級功能,比方說避免文檔關聯問題的「摘要索引」和用於從非結構化文檔中提取結構化數據的「實體提取」。

David Sacks 在投資的博客里說,Ragie 為 RAG 基礎設施所做的事情就像 AWS 為雲所做的那樣。它能夠使開發者快速行動並通過無需維護的服務保持與最先進的 RAG 方法同步。

根據 Ragie 官網介紹,它採用了開箱即用的模式,簡化了結構化和非結構化數據的數據攝取、分塊和多模式索引。直接連接到你自己的數據源,並確保你的數據管道始終保持最新。它會針對結果進行優化 ,並且將數據導入 AI 應用只需要幾次點擊即可。

其聯合創始人 Mohammed Rafiq 說 Ragie 使用多種類型的索引來提高企業 RAG 的相關性。第一層是塊索引,通過將數據塊編碼成向量並存儲在向量數據庫中來創建。其次是每個輸入文檔的摘要索引,用於提高檢索結果的相關性,確保最終響應來自各種文檔,而不僅僅是一個文檔。

另外還集成了混合索引,允許 Ragie 同時提供基於關鍵字和語義、基於向量的檢索方法,從而真正幫助開發者快速構建他們的 AI 應用。

與此同時,最新的一份企業消費支出報告顯示,AI 生產力工具和 OpenAI 的替代品正在快速增長,其中音樂 AI Suno 成為目前增長最為快速的一個 AI 應用

OpenAI 的替代品 Anthropic 的市場份額則從年初的 4%上升到了目前的 17%,AI 會議類產品已經成為真正的一個剛需,榜單前 10 個產品里有 3 個都是 AI 會議類產品,另外還有一個 AI 日程管理產品……