亞馬遜云科技近日宣布,面向AI Agent開發領域推出新一代全托管搜索與向量引擎——Amazon OpenSearch Serverless。該服務通過動態資源調配技術,實現了從零請求到每秒數千次查詢的彈性擴展能力,并在非高峰時段自動縮減資源規模,相比傳統峰值容量配置方案可降低高達60%的運營成本。
在資源部署效率方面,新服務展現出顯著優勢。開發者僅需數秒即可完成資源初始化,其擴容速度較前代產品提升20倍。通過與Vercel、Kiro等AI開發平臺的深度集成,用戶無需管理底層基礎設施,即可在5分鐘內為AI Agent構建具備生產環境標準的搜索后端。這種"開箱即用"的特性,特別適合需要快速驗證創意的初創團隊和研發部門。
操作流程經過全面優化,用戶可通過控制臺Serverless菜單下的"Create collection"功能創建集合。系統提供三種創建模式:標準模式支持全文檢索與向量檢索的混合架構;Express模式通過自動配置安全策略實現最快部署;Classic模式則允許復用現有基礎設施資源。所有集合均支持架構版本繼承,確保跨區域部署的一致性。
針對Vercel用戶,新服務提供專屬集成方案。開發者既可在Vercel控制臺直接創建OpenSearch集合,也能將現有資源無縫對接。這種深度集成使搜索后端能夠隨應用流量自動擴展,同時支持按需添加機器學習推理等高級功能。技術文檔顯示,從創建到上線整個過程可在30秒內完成。
開發工具鏈方面,Claude Code、Cursor等IDE插件與Kiro Powers開發平臺形成完整生態。其中Amazon OpenSearch Agent Skills庫提供預封裝的工作流模塊,每個技能包含領域知識、最佳實踐和自動化執行邏輯。例如電商場景的"商品推薦"技能,不僅能返回檢索結果,還能展示用戶行為分析路徑。Kiro Launchpad則通過可視化架構設計工具,將開發周期縮短70%。
計費模式采用按使用量付費原則,費用根據索引、檢索和GPU加速所消耗的OpenSearch計算單元(OCUs)實時計算。該服務現已在所有已部署Amazon OpenSearch Serverless的云區域全面上線,支持SEARCH和VECTORSEARCH兩種集合類型,開發者可通過控制臺、CLI命令行或SDK進行管理。








