前Liblib CTO創(chuàng)業(yè),打造Agent時(shí)代的基礎(chǔ)設(shè)施,可秒級(jí)調(diào)用上萬種工具

作者:劉雅坤 來源:DeepTech深科技
0 評(píng)論 453 瀏覽 0 收藏

現(xiàn)在,AI 正在變得越來越聰明,但是一個(gè)現(xiàn)實(shí)的問題是:重要的事情可以直接交給它去完成嗎?

現(xiàn)在,AI 正在變得越來越聰明,但是一個(gè)現(xiàn)實(shí)的問題是:重要的事情可以直接交給它去完成嗎?


ChatGPT、豆包、元寶能幫你查天氣、訂機(jī)票,但你敢用它做投資決策嗎?問題的關(guān)鍵不在于現(xiàn)在的大模型不夠強(qiáng),而在于它們尚不具備真實(shí)世界的感知和行動(dòng)能力。


需要了解的是,要想得到高質(zhì)量的金融分析報(bào)告,僅靠大模型本身編碼的靜態(tài)知識(shí)是遠(yuǎn)遠(yuǎn)不夠的,大模型需要像投研專家一樣實(shí)時(shí)動(dòng)態(tài)的獲取最新的政策、新聞、產(chǎn)業(yè)鏈、輿情、行情等多維信息和數(shù)據(jù),并使用專業(yè)的金融分析工具進(jìn)行精密和精確計(jì)算,如此才能得到一份真正可用的金融分析報(bào)告。


而現(xiàn)實(shí)的問題是,現(xiàn)階段大模型智商很高,具備強(qiáng)大的理解、分析和規(guī)劃能力,但在現(xiàn)有的數(shù)字世界中“眼瞎手殘”,像被困在玻璃缸中的“缸中之腦”,無法高效、便捷、低成本地感知和操作現(xiàn)實(shí)世界。


要有效解決這個(gè)問題,就需要為大模型接入一套感知和行動(dòng)層的基礎(chǔ)設(shè)施,讓它成為在數(shù)字世界中無所不知、無所不能的真正的超級(jí)智能體。


一家名為 Qveris AI 的初創(chuàng)公司,聚焦于 Agent 時(shí)代的 Infra 層,正致力于為 Agent 設(shè)計(jì)原生搜索和行動(dòng)路由引擎。據(jù)悉,截至目前該公司已獲得近千萬元種子輪融資。


如果說具身智能是為 AI 安上了與現(xiàn)實(shí)世界交互的“身體”,那么 Qveris AI 正在做的事就是給智能體(Agent)裝上了數(shù)字世界的“眼、耳、手、腳”。也就是說,接入這套基礎(chǔ)設(shè)施之后,大模型和智能體就能自己查數(shù)據(jù)、用工具,真正實(shí)現(xiàn)與現(xiàn)實(shí)數(shù)字世界的連接和互動(dòng)。


“簡單來理解我們做的事情,是構(gòu)建 AI 時(shí)代可被大模型和智能體使用的所有開放服務(wù)、資源和能力的 AI-Ready 數(shù)字孿生引擎,幫助大模型和智能體在數(shù)字世界中快捷、高效、低成本、實(shí)時(shí)動(dòng)態(tài)的搜索和調(diào)用所需的專業(yè)、權(quán)威、可信的數(shù)據(jù)和工具能力?!盦veris AI 創(chuàng)始人兼 CEO 王林芳告訴 DeepTech。


Agent 接不上真實(shí)世界,問題出在哪里?


互聯(lián)網(wǎng)的數(shù)據(jù)與工具生態(tài)為人類設(shè)計(jì),Agent 缺少統(tǒng)一、可信、標(biāo)準(zhǔn)化的供應(yīng)層。從領(lǐng)域現(xiàn)狀來看,不同的專家分散在不同的平臺(tái),例如金融、理財(cái)、計(jì)算等等。


舉例來說,你要做金融投資,正在考慮買黃金、比特幣、股票或債券。這是一項(xiàng)復(fù)雜的任務(wù),即使人類去做也可能需要咨詢各類專家,包括金融銀行經(jīng)理、理財(cái)經(jīng)理、投資顧問,還可能需要去網(wǎng)絡(luò)上看一些專家發(fā)言等作為參考資料。


現(xiàn)在人們常用的做法是:讓大模型用深度研究(Deep Research)模式,或找專業(yè)的金融 Agent 幫忙做全面的信息調(diào)查和推薦建議。


那么問題來了:面對(duì)海量數(shù)據(jù)查詢和對(duì)比、海量的免費(fèi)和付費(fèi)信息和跨供應(yīng)商、跨平臺(tái)的挑戰(zhàn),大模型的能力能行嗎?實(shí)際上,Agent 現(xiàn)在仍處于技術(shù)的早期階段,如果它拿不到真實(shí)、可信和高質(zhì)量的數(shù)據(jù),它生成的報(bào)告或未必正確,或質(zhì)量水平很低。


盡管現(xiàn)階段大模型性能高、能對(duì)話聊天,但當(dāng)面臨專業(yè)數(shù)據(jù)、專業(yè)工具甚至專業(yè)服務(wù)時(shí),大模型的能力便“捉襟見肘”:即便是當(dāng)下前沿團(tuán)隊(duì)開發(fā)的產(chǎn)品,能夠調(diào)用的數(shù)據(jù)源和工具數(shù)量大概在數(shù)十個(gè)到百個(gè),且搜集、對(duì)比、接入、評(píng)估、驗(yàn)證的難度、成本和時(shí)間周期都很高。


面對(duì)專業(yè)級(jí)別難度的問題,AI 極有可能因找不到實(shí)時(shí)、可信、權(quán)威、專業(yè)的數(shù)據(jù),僅靠訓(xùn)練時(shí)的記憶給出推測(cè)的答案。所以,AI 最大的問題不是不夠聰明,而是被困在“光說不練”的世界里。這并不是某個(gè)模型、某個(gè)產(chǎn)品的單一局限性,而是當(dāng)前整個(gè) Agent 生態(tài)普遍面臨的結(jié)構(gòu)性問題。


AI 會(huì)思考,但缺一層“行動(dòng)基礎(chǔ)設(shè)施”


事實(shí)上,行業(yè)已經(jīng)達(dá)成共識(shí):大模型已經(jīng)具備了驚人的“大腦”思考能力,但極度缺乏感知和改變現(xiàn)實(shí)世界的“手腳”。為了填補(bǔ)這一空白,市場(chǎng)正在經(jīng)歷從單一的技術(shù)探索向系統(tǒng)化基礎(chǔ)設(shè)施建設(shè)的轉(zhuǎn)變。放眼整體生態(tài),目前主要存在三類關(guān)鍵的建設(shè)路徑:標(biāo)準(zhǔn)協(xié)議層、模型算力層以及新興的“行動(dòng)基礎(chǔ)設(shè)施”層。


第一類是標(biāo)準(zhǔn)協(xié)議層,以 Anthropic 等機(jī)構(gòu)推出的 MCP(Model Context Protocol)為代表。這類協(xié)議制定了 AI 與世界溝通的語法規(guī)則,解決了如何連接的標(biāo)準(zhǔn)化問題。但這僅僅是鋪設(shè)了管道,管道中流動(dòng)的內(nèi)容——豐富、可用的工具資源,仍然處于匱乏狀態(tài)。


第二類是模型算力路由層,例如 OpenRouter。它們聚合了來自全球不同廠商的頂尖模型 API,解決了開發(fā)者獲取智力資源的便利性問題。


“這類平臺(tái)解決了‘大腦’的供給問題,屬于核心算力層。但對(duì)于一個(gè)完整的 Agent 而言,光有大腦是不夠的?!蓖趿址急硎?,Agent 要真正落地,需要面對(duì)的是一個(gè)復(fù)雜、非標(biāo)、數(shù)據(jù)分散的現(xiàn)實(shí)世界。而 Qveris AI 聚焦的正是模型之外的行動(dòng)能力——將各行各業(yè)的技能與服務(wù),轉(zhuǎn)化為 AI 可理解、可調(diào)用的資產(chǎn)。


從技術(shù)演進(jìn)的宏觀視角來看,我們正處于一種全新的運(yùn)行模式切換期:互聯(lián)網(wǎng)時(shí)代是“人類搜索+人類執(zhí)行”;大模型初期開啟了“人類輔助+AI 生成”;而現(xiàn)在,我們正在進(jìn)入“Agent 自主資源調(diào)度+Agent 自主執(zhí)行”的新階段。


然而,現(xiàn)有的互聯(lián)網(wǎng)是為人類設(shè)計(jì)的,而非為 Agent 設(shè)計(jì)的。這導(dǎo)致了一個(gè)巨大的范式鴻溝(如下表所示):


(內(nèi)容來源:王林芳;制圖:Nano Banana Pro)


由此可見,強(qiáng)行讓 Agent 去使用為人類設(shè)計(jì)的網(wǎng)頁或接口,效率極低且極不穩(wěn)定。Qveris AI 的核心定位正是基于此,來構(gòu)建互聯(lián)網(wǎng)上可被大模型和智能體使用的“AI-Ready”數(shù)字孿生引擎。


Qveris AI 不僅僅是簡單的工具聚合,而是對(duì)數(shù)字世界的重構(gòu)。它將互聯(lián)網(wǎng)上開放的服務(wù)、資源和能力進(jìn)行深度的清洗、建模與封裝,把原本適合人類閱讀的“網(wǎng)頁互聯(lián)網(wǎng)”,轉(zhuǎn)化為適合機(jī)器調(diào)用的“能力互聯(lián)網(wǎng)”,使得大模型能夠快捷、高效、低成本且實(shí)時(shí)動(dòng)態(tài)地搜索,并調(diào)用所需的專業(yè)數(shù)據(jù)與工具。


這與 2000 年代初的電商市場(chǎng)頗為類似。彼時(shí),雖然商品豐富,但由于缺乏統(tǒng)一的支付、物流和信用體系,交易成本極高。而 Qveris AI 正在建設(shè)的“行動(dòng)基礎(chǔ)設(shè)施”,相當(dāng)于 Agent 經(jīng)濟(jì)時(shí)代的“商業(yè)操作系統(tǒng)”:它把所有數(shù)字世界的信息交換產(chǎn)品,包括跨領(lǐng)域、跨平臺(tái)的資源集合在一起,打通了從搜索、發(fā)現(xiàn)、比較到調(diào)用、交易的全鏈路。


未來,當(dāng) Agent 需要查詢最新的法律條文、預(yù)定復(fù)雜的差旅服務(wù)或調(diào)用特定的 SaaS 功能時(shí),它不再需要像人類一樣去瀏覽網(wǎng)頁,而是通過 Qveris AI 的基礎(chǔ)設(shè)施,直接以機(jī)器的速度連接真實(shí)世界。這不僅是技術(shù)架構(gòu)的升級(jí),更是智能體時(shí)代釋放生產(chǎn)力的關(guān)鍵一環(huán)。


為 AI 而生的搜索引擎,解決的不是查信息,而是“找能力”


在 Agent 賽道中,頭部玩家的目標(biāo)往往是打造 AI 時(shí)代的超級(jí)應(yīng)用,成為新的流量入口。憑借強(qiáng)大的工程資源與商務(wù)拓展能力,大廠往往傾向于通過自建或深度定制的方式,直接接入高頻、核心的數(shù)據(jù)與服務(wù)(如地圖、支付、主流電商)。然而,現(xiàn)實(shí)世界的復(fù)雜性遠(yuǎn)超單一平臺(tái)的覆蓋能力。


對(duì)于核心且排他性強(qiáng)的場(chǎng)景,自建連接是合理的選擇;但對(duì)于海量、長尾、分散在各行各業(yè)的專業(yè)工具與數(shù)據(jù)(如特定行業(yè)的合規(guī)查詢、垂類 SaaS 操作、實(shí)時(shí)供應(yīng)鏈數(shù)據(jù)),構(gòu)建一個(gè)跨平臺(tái)、中立的行動(dòng)基礎(chǔ)設(shè)施,顯然是比單點(diǎn)逐一接入更具性價(jià)比的系統(tǒng)化解法。


對(duì)于廣大中小 Agent 開發(fā)者而言,痛點(diǎn)更為直接:他們擁有敏銳的場(chǎng)景洞察力,卻往往受困于有限的工程與商務(wù)資源。要驗(yàn)證一個(gè)創(chuàng)新場(chǎng)景,可能需要對(duì)接幾十個(gè)不同的 API,每個(gè)接口的鑒權(quán)、調(diào)試、維護(hù)都耗時(shí)耗力。他們迫切需要一套現(xiàn)成的基礎(chǔ)設(shè)施,以極大地縮短開發(fā)周期,將驗(yàn)證成本降至最低。


由此可見,Agent 時(shí)代的瓶頸,已不再是算力或模型智商,而是連接成本。


如果說 ChatGPT 等聊天機(jī)器人解決了 AI 的思考問題,那么 Qveris AI 致力于解決的便是 AI 的行動(dòng)問題。


Qveris AI 通過構(gòu)建 AI-Ready 的數(shù)字孿生引擎,為開發(fā)者帶來三大核心價(jià)值:


·語義級(jí)快速發(fā)現(xiàn)(Semantic Discovery):AI 獲取工具不再局限于預(yù)置的幾十個(gè)插件。面對(duì)用戶的復(fù)雜意圖,Qveris AI 能夠基于語義理解,在海量資源庫中以秒級(jí)速度匹配最適合當(dāng)下的工具或數(shù)據(jù)源,實(shí)現(xiàn)從關(guān)鍵詞搜索到意圖匹配的進(jìn)化。


·標(biāo)準(zhǔn)化一鍵調(diào)用(Unified Execution):將原本需要耗時(shí)數(shù)月的商務(wù)談判與 API 對(duì)接工作,壓縮為幾行代碼。通過統(tǒng)一的 Schema(數(shù)據(jù)結(jié)構(gòu))定義,Qveris AI 屏蔽了底層數(shù)萬個(gè)工具的異構(gòu)差異。開發(fā)者只需對(duì)接一個(gè)標(biāo)準(zhǔn)接口,即可調(diào)度萬級(jí)以上的標(biāo)準(zhǔn)化工具,極大降低了集成復(fù)雜度。


·動(dòng)態(tài)路由與高可用(Dynamic Resilience):這是企業(yè)級(jí) Agent 穩(wěn)定運(yùn)行的保障。Qveris AI 充當(dāng)了智能路由器的角色,當(dāng)某個(gè)工具因網(wǎng)絡(luò)波動(dòng)、服務(wù)中斷或價(jià)格調(diào)整不可用時(shí),系統(tǒng)能自動(dòng)尋找并切換至同類備選方案。


王林芳解釋說道:“我們接入了全網(wǎng)的工具和搜索+調(diào)用的能力,包括進(jìn)行 Agent 的搜索排序。例如,在同花順無法使用時(shí),這套基礎(chǔ)設(shè)施可以查詢東方財(cái)富、彭博等同類數(shù)據(jù)。這樣一來,開發(fā)者始終能夠獲得實(shí)時(shí)的替代方案,不會(huì)受到單一服務(wù)提供方的限制或中斷的影響。”


從搜索到 Agent:一個(gè)長期主義者的判斷


要把搜索、調(diào)用、評(píng)估和交易整合成一套系統(tǒng),本身并不是一個(gè)輕量級(jí)工程。回顧王林芳的職業(yè)經(jīng)歷,她在搜索領(lǐng)域的積累為創(chuàng)業(yè)奠定了基礎(chǔ)。


其本科和碩士畢業(yè)于清華大學(xué)電子系,研究生時(shí)期曾在微軟亞洲研究院實(shí)習(xí),畢業(yè)后加入微軟,在 Bing 搜索引擎負(fù)責(zé)工作包括百億級(jí)網(wǎng)頁爬蟲、索引、多模態(tài)理解、知識(shí)圖譜等。


后來,她加入了一家創(chuàng)業(yè)公司 Opera News 做大規(guī)模推薦引擎。2018 年,王林芳來到京東 AI 研究院,主要聚焦于 AI 視覺算法及應(yīng)用。2022 年底 ChatGPT 出現(xiàn)后,她意識(shí)到這是 AI 領(lǐng)域的一個(gè)重大機(jī)遇。于是她 2023 年中從京東離職開始探索創(chuàng)業(yè)之路,以 CTO 的身份加入了 Liblib AI,打造了國內(nèi)領(lǐng)先的開源開放多模態(tài)模型社區(qū)和工具平臺(tái)。


圖丨王林芳(來源:王林芳)


2025 年 6 月,她正式成立了 Qveris AI。據(jù)了解,目前該公司已與數(shù)家企業(yè)達(dá)成合作,其中包括知名通用 Agent 開發(fā)商,以及多家專注于金融與科技領(lǐng)域的 Agent 公司,年收入已到達(dá)數(shù)百萬元。


在王林芳看來,云廠商、SaaS 服務(wù)商以及各類數(shù)據(jù)工具提供方,本質(zhì)上屬于資源供給側(cè);而 Qveris AI 則處于連接供給與需求的索引分發(fā)層,兩者生態(tài)位截然不同。


“我們希望成為 Model Agent 體系中的‘Google’。”王林芳形象地比喻道,“正如 Google 不生產(chǎn)網(wǎng)頁但索引全網(wǎng)信息一樣,Qveris AI 的核心價(jià)值在于其跨平臺(tái)的中立性。我們不綁定任何單一云廠商,而是廣泛兼容各類底層基礎(chǔ)設(shè)施,將分散在不同云端的服務(wù)聚合起來,統(tǒng)一分發(fā)給上層的各類模型與開發(fā)者。無論你的資源在哪里,無論你使用什么模型,我們都是中間那個(gè)高效的連接器?!?/p>


Agent 經(jīng)濟(jì)的長期想象


Agent 經(jīng)濟(jì)給我們留下了想象空間:Agent 的發(fā)展可能是非線性的,并在各種業(yè)務(wù)中得到廣泛應(yīng)用。


王林芳指出,未來 10 年內(nèi),有可能 90% 的業(yè)務(wù)都會(huì)由 Agent 自主完成?!氨M管每個(gè)領(lǐng)域都有最好的工具,但發(fā)展路徑總是先有再優(yōu),就像搜索引擎的覆蓋面優(yōu)于人工精選一樣,我認(rèn)為搜索模式更適合現(xiàn)在和未來較長一段時(shí)間的需求?!?/p>


當(dāng) Agent 開始自主搜索、比價(jià)、決策并執(zhí)行,人類與技術(shù)的關(guān)系或許會(huì)再次發(fā)生改變。在這個(gè)過程中,真正重要的,不只是模型有多聰明,而是它能否被接入一個(gè)更開放、更透明、更可信的世界。


如果說過去的互聯(lián)網(wǎng)連接的是人,那么正在形成的 Agent 網(wǎng)絡(luò),連接的將是能力本身。


收藏 0打賞 0評(píng)論 0
評(píng)論
  1. 暫時(shí)沒有評(píng)論,來說點(diǎn)什么吧