91大神影片_狠狠色狠狠色综合网_免费一级片网址_欧美.日韩.国产.一区.二区_成人黄色av播放免费_国产视频一区三区_毛片一区二区

首頁  ?  財經  ?  財經要聞

谷歌深夜重磅開源!深度研究Agent拿下SOTA,比GPT-5 pro便宜90%

2025-12-12 08:13:00

來源:市場資訊

專題:政策定調夯實A股長期運行基礎 未來方向看科技成長

  來源:智東西

  智東西12月12日消息,今日凌晨,比OpenAI早一個小時,谷歌甩出了3個Agent大招:

  Deep Research Agent功能更新,并首次向開發者開放;開源新網絡研究Agent基準DeepSearchQA,旨在測試Agent在網絡研究任務中的全面性;推出新交互API(Interactions API)。

  Gemini Deep Research是一款專為長期上下文采集和綜合任務優化的Agent,其背后的模型是Gemini 3 Pro,通過多步強化學習的擴展搜索,Agent能夠自主地以高精度導航復雜的信息環境。此次更新包括針對特定數據進行網頁搜索、更低成本生成研究報告等。

  谷歌DeepMind產品經理路卡斯·哈斯(Lukas Haas)在社交平臺X上透露,新Gemini Deep Research Agent已經實現SOTA,在谷歌新基準測試上得分46.4%,在BrowseComp上與GPT-5 Pro相當,價格是其1/10左右。

  Deep Research Agent很快將在谷歌搜索、筆記本、 谷歌金融中提供,并在Gemini應用中升級。

  DeepSearchQA內置了900個手工設計的“因果鏈”任務,涵蓋17個領域,可以評估Agent在復雜、需要多步查詢信息等任務上的能力。

  交互API作為其與Gemini模型和Agent的統一交互界面,通過Google AI Studio中的Gemini API公開測試版向開發者開放。開發者可以通過Agent開發套件(ADK)和A2A協議使用交互API。

  有網友評論,谷歌這是把“一個數字版的福爾摩斯交給了開發者”,現在你只需要一邊喝咖啡,一邊就能讓每個應用像寫論文一樣展開深度調查。

  DeepSearchQA開源地址:https://www.kaggle.com/benchmarks/google/dsqa/leaderboard

  一、Deep Research Agent:更新網頁搜索、低成本生成研究報告功能

  谷歌博客稱,Deep Research背后的Gemini 3 Pro模型是他們迄今為止最真實的模型,該模型經過專門訓練,旨在減少幻覺并最大化復雜任務中的報告質量。

  Deep Research通過迭代式流程運行,它會提出問題、閱讀結果、識別知識空白,然后再次進行搜索。其新版本大幅提升了網頁搜索功能,使其能夠深入網站查找特定數據。

  新Gemini Deep Research Agent在完整HLE測試中達到46.4%,Gemini 3 Pro為43.2%,GPT-5 Pro為38.9%。在DeepSearchQA、BrowseComp的測試中以微小優勢勝出。

  谷歌還優化了該Agent以更低成本生成深度研究報告的功能。

  Gemini Deep Research Agent已經在需要高精度和基于早期反饋、測試的復雜領域應用,包括金融服務、生物技術和市場調研等行業,這些領域都可以利用Gemini Deep Research完成初步調研任務。

  對于構建下一代自動化研究工具的開發者來說,Gemini Deep Research Agent能夠綜合信息并生成詳細報告:

  統一信息綜合:Gemini Deep Research通過文件上傳和文件搜索工具分析用戶的文檔和公共網絡數據,還能處理長上下文,允許用戶直接在提示中放置大量背景信息;

  報告可控性:用戶可以通過提示定義結構、頭部,或指定數據表生成和格式來控制輸出;

  詳細引用:其會提供細粒度的來源,允許用戶驗證數據來源;

  結構化輸出:支持JSON模式輸出,便于下游應用解析研究結果。

  二、DeepSearchQA:新Agent基礎,涵蓋17大領域、900條任務

  DeepSearchQA是Deep Research Agent的測試基準。

  現有基準測試往往無法反映現實世界多步網絡研究的復雜性,谷歌開源新基準DeepSearchQA,是用于評估Agent在復雜、需要多步查詢信息等任務上。

  DeepSearchQA有900個手工設計的“因果鏈”任務,涵蓋17個領域,每一步都依賴于事先分析。與傳統的基于事實的測試不同,DeepSearchQA衡量的是全面性,要求Agent生成詳盡的答案集。這不僅評估研究的準確性,也包括檢索的記憶能力。

  DeepSearchQA還可以作為衡量“思考時長”效率的工具。谷歌在內部評估中發現,當允許Agent執行更多搜索與推理步驟時,其性能會獲得顯著提升。

  三、交互API:集成專為Agent應用開發設計的接口

  交互API原生集成了一套專屬接口,該接口專為Agent應用開發場景設計,可高效處理交錯式消息、思維鏈、工具調用及其狀態信息的復雜上下文管理工作。除Gemini模型套件外,交互API還提供其首個內置Agent Gemini Deep Research Agent。

  下一步,谷歌將擴展其內置Agent,并提供構建和引入其他Agent的功能,這將使開發者能夠通過一個API連接Gemini模型、谷歌內置Agent和開發者的定制Agent。

  交互API提供了一個單一的RESTful端點,用于與模型和Agent交互。

  通過指定模型參數與模型交互:

  通過指定Agent參數與Agent互動,目前支持deep-research-pro-preview-12-2025:

  交互API通過現代Agent應用所需的功能擴展了生成內容的核心功能,包括:

  可選的服務器端狀態:能夠將歷史管理卸載到服務器。這簡化了開發者的客戶端代碼,減少了上下文管理錯誤,并通過增加緩存命中率可能降低成本。

  可解釋和可組合的數據模型:一個為復雜的Agent歷史設計的干凈圖式。開發者可以對交錯的信息、思維、工具及其結果進行調試、流式分析和推理。

  背景執行:能夠將長期運行的推理環路卸載到服務器,而無需維護客戶端連接。

  遠程MCP工具支持:模型可以直接調用模型上下文協議(MCP)服務器作為工具。

  結語:Gemini生態再擴容,谷歌簡化Agent開發模式

  目前,Deep Research Agent已經在金融、科學研究等諸多領域有所應用。此次谷歌不僅更新了這一Agent,還發布了交互API,以簡化與Gemini模型和Agent的交互流程,構建更易用的開發生態。

  谷歌博客提到,其未來的更新還將聚焦于更豐富的輸出,如原生生成圖表以支持可視化分析報告,以及通過模型上下文協議(MCP)支持擴展連接性,更輕松地訪問自定義數據源,并努力將Gemini Deep Research引入企業用的Vertex AI。

免責聲明:本網對文中陳述、觀點判斷保持中立,不對所包含內容的準確性、可靠性或完整性提供任何明示或暗示的保證。請讀者僅作參考,并請自行承擔全部責任。 本網站轉載圖片、文字之類版權申明,本網站無法鑒別所上傳圖片或文字的知識版權,如果侵犯,請及時通知我們,本網站將在第一時間及時刪除。
91大神影片_狠狠色狠狠色综合网_免费一级片网址_欧美.日韩.国产.一区.二区_成人黄色av播放免费_国产视频一区三区_毛片一区二区
一二三四社区欧美黄| 国内外精品视频| 亚洲国产视频在线| 欧美视频三区在线播放| 久久这里只有精品视频网| 亚洲国产日韩精品| 日本韩国欧美一区| 夜夜爽夜夜爽精品视频| 亚洲精品国产一区二区精华液 | 欧美色男人天堂| 亚洲一区二区视频在线观看| 丁香激情综合国产| 国产欧美日韩另类一区| 国产99一区视频免费| 久久久99久久精品欧美| 中文字幕一区二区三| 成人做爰69片免费看网站| 久久久亚洲精品石原莉奈| 黄色资源网久久资源365| 精品精品国产高清a毛片牛牛| 丝袜美腿亚洲综合| 久久综合九色综合久久久精品综合 | 自拍偷自拍亚洲精品播放| 国产成人免费xxxxxxxx| 亚洲欧美偷拍卡通变态| av资源站一区| 视频精品一区二区| 国产区在线观看成人精品| 成人av在线观| 亚洲成av人影院| www久久久久| 51午夜精品国产| 精品中文av资源站在线观看| 自拍偷拍欧美精品| 欧美日韩国产高清一区| 国产精品亚洲第一区在线暖暖韩国| 亚洲精品一卡二卡| 欧美妇女性影城| 粉嫩av一区二区三区在线播放| 亚洲午夜一区二区三区| 国产精品丝袜一区| 日韩精品影音先锋| 欧美一区二区三区电影| 91免费视频网址| 91久久人澡人人添人人爽欧美| 亚洲精品成人天堂一二三| 欧美激情一区二区三区蜜桃视频| 欧美日韩免费高清一区色橹橹| 99久久久国产精品| 国产大陆精品国产| 久久99国产精品尤物| 日本不卡一区二区三区| 香蕉乱码成人久久天堂爱免费| 国产精品色一区二区三区| 久久综合狠狠综合久久激情| 欧美一区二区三区视频免费| 91.xcao| 久久婷婷色综合| 欧美高清在线一区二区| 国产婷婷色一区二区三区| 国产精品视频在线看| 一区二区理论电影在线观看| 亚洲日本韩国一区| 亚洲综合色自拍一区| 日韩精品欧美成人高清一区二区| 亚洲国产欧美日韩另类综合| 亚洲精品国产一区二区三区四区在线| 亚洲一区二区四区蜜桃| 偷窥国产亚洲免费视频| 蜜桃视频在线一区| 国产成人自拍在线| 国产成人精品免费在线| 国模冰冰炮一区二区| 国产成人丝袜美腿| 高清不卡一区二区| 在线观看一区二区精品视频| 国产精品进线69影院| 亚洲图片你懂的| 国产精品二三区| 亚洲成a人在线观看| 亚洲人成网站影音先锋播放| 国产91综合一区在线观看| 91在线观看成人| 国产成人欧美日韩在线电影| 中文一区一区三区高中清不卡| 国产视频在线观看一区二区三区| 国产精品久久久久久久岛一牛影视 | 国产亚洲精品久| 亚洲精品自拍动漫在线| 久久成人久久鬼色| 国产精品久久久一本精品| 欧亚洲嫩模精品一区三区| 色婷婷亚洲综合| 中文字幕乱码一区二区免费| 婷婷久久综合九色国产成人| 国产99一区视频免费| 亚洲人成小说网站色在线| 亚洲一区二区三区免费视频| 精品视频在线免费看| 精品一区二区三区香蕉蜜桃 | 99精品视频中文字幕| 天天做天天摸天天爽国产一区| 日韩精品一区二区三区蜜臀| 成人一区二区三区中文字幕| 中文字幕一区二区三区精华液| 成人午夜短视频| 一区二区三区在线免费观看| 国产精品人人做人人爽人人添| 日韩精品免费视频人成| 欧美va亚洲va| 欧美一区二区三区四区视频| 4438x亚洲最大成人网| 久久99精品久久久| 成年人国产精品| 日韩毛片在线免费观看| 久久99精品国产.久久久久久| 懂色av一区二区三区免费看| 色狠狠桃花综合| 国产精品国产a| 精彩视频一区二区三区| 777午夜精品免费视频| 久久电影网电视剧免费观看| 国产三级一区二区| 久久精品国产免费看久久精品| 欧美午夜精品一区| 国产精品美女一区二区在线观看| 日韩一区欧美二区| 色综合天天狠狠| 亚洲一卡二卡三卡四卡 | 亚洲午夜久久久久| 精品91自产拍在线观看一区| 在线观看一区日韩| 午夜日韩在线观看| 日韩亚洲欧美在线观看| 久久成人免费日本黄色| 日韩一区二区三区电影| 国产一区二区视频在线播放| 亚洲卡通动漫在线| 欧美精品一区二区三| 国产99久久久国产精品潘金 | 成人a免费在线看| 亚洲欧美另类久久久精品| 欧美亚洲高清一区| 日韩在线一区二区三区| 精品理论电影在线| 欧美日韩国产123区| 国产精品自产自拍| 久久99国产精品久久| 国产精品一区二区果冻传媒| 亚洲免费色视频| 欧美精品一区二区三区高清aⅴ| 成人激情视频网站| 成人免费视频一区二区| 国产99一区视频免费| 丝袜美腿成人在线| 国产乱码精品1区2区3区| 亚洲人成人一区二区在线观看| 欧美精品日韩精品| 成人福利电影精品一区二区在线观看| 亚洲国产日日夜夜| 日韩伦理电影网| 依依成人精品视频| 亚洲国产aⅴ成人精品无吗| 国产精品激情偷乱一区二区∴| 欧美日韩美女一区二区| 国产精品资源网站| 久久99国产精品尤物| 激情深爱一区二区| 国产精华液一区二区三区| 春色校园综合激情亚洲| 亚洲精品一线二线三线| 国产成人啪午夜精品网站男同| 亚洲一区在线免费观看| 一区二区视频在线| 亚洲高清三级视频| 久久精品国产精品亚洲红杏 | 亚洲另类一区二区| 精品一区二区三区免费| 成人av电影免费观看| 99久久精品免费精品国产| 欧美在线观看视频一区二区三区 | 亚洲国产精品久久人人爱蜜臀| 亚洲乱码中文字幕| 自拍av一区二区三区| 亚洲欧美日韩综合aⅴ视频| 亚洲久本草在线中文字幕| 久久99精品国产麻豆婷婷| 色综合久久99| 日韩免费在线观看| 欧美日韩国产小视频在线观看| 国产伦精品一区二区三区免费| 懂色av一区二区在线播放| 欧美性三三影院| 最好看的中文字幕久久| 国产精品1区二区.| 欧美国产视频在线| 久久不见久久见免费视频1| 91久久久免费一区二区| 国产精品久久久久久福利一牛影视| 美国一区二区三区在线播放|