谷歌 Search Live 语音搜索功能上线:基于 Gemini 模型的自然对话式搜索新体验

AI新闻资讯11分钟前发布 一丢
84 00
2025 年 6 月 19 日,谷歌在美国正式推出全新的 Search Live 语音搜索功能,为 iOS 和 Android 用户带来基于 Gemini 大模型的自然对话式搜索体验。这项功能将传统搜索引擎的 “关键词查询” 升级为持续的语音交互,用户无需中断当前任务,即可通过聊天般的对话获取信息,标志着搜索引擎从 “信息检索工具” 向 “智能助手” 的重要演进。
谷歌 Search Live 语音搜索功能上线:基于 Gemini 模型的自然对话式搜索新体验

谷歌 Search Live 语音搜索功能上线:基于 Gemini 模型的自然对话式搜索新体验

交互革新:从 “关键词输入” 到 “自然对话” 的范式转变

Search Live 的核心突破在于打破了传统搜索的交互边界。用户只需在谷歌 App 的 Labs 中启用 AI 模式,点击新出现的 Live 图标并说出问题,即可触发语音搜索。与传统语音搜索不同的是,其支持多轮持续对话 —— 例如用户询问 “旧金山今天空气质量如何”,得到答复后可直接追问 “那亚麻连衣裙如何打包才不会皱”,系统会基于上下文持续响应,无需重复唤醒或输入关键词。

 

谷歌官方演示中,用户在收拾行李时通过语音提问,Gemini 模型不仅即时给出 “使用防皱纸包裹” 的建议,还能进一步推荐附近售卖防皱用品的店铺。这种 “边聊边搜” 的模式尤其适合多任务场景:用户在烹饪时查询菜谱、健身时询问运动数据,甚至在驾车时获取导航信息,都无需手动操作屏幕,交互效率提升显著。系统还会自动保存对话历史,用户可随时查看文字记录或切换为打字输入,兼顾不同使用习惯。

技术底层:Gemini 模型驱动的实时语音理解与生成

Search Live 搭载的 Gemini 模型在语音交互领域展现出三重技术优势:

 

  • 上下文连贯理解:模型能够记忆多轮对话的历史信息,例如用户先询问 “巴黎天气”,再追问 “适合穿什么衣服”,系统会结合温度、湿度等前文数据生成建议,避免信息断层;
  • 实时语音处理:通过端侧与云端协同优化,语音识别延迟控制在 300 毫秒以内,回应生成速度较传统 TTS(文本转语音)提升 40%,接近人类自然对话节奏;
  • 多模态信息整合:除语音外,用户可在对话中插入图片(如拍摄商品条码查询信息),模型能同步处理语音指令与视觉输入,实现 “所见即所问” 的跨模态交互。

 

值得关注的是,Search Live 支持后台持续对话 —— 即便用户切换到其他应用,只要保持麦克风权限,仍可继续提问。这种 “始终在线” 的交互逻辑,依赖 Gemini 模型的轻量化部署与功耗控制技术,在保证响应速度的同时,将后台功耗降低至传统语音助手的 60%。

行业竞合:语音交互赛道的技术角力与生态布局

谷歌此次更新正值 AI 语音交互赛道加速竞争之际。OpenAI 去年在 ChatGPT 中推出 Advanced Voice Mode,支持自然语调的语音对话与实时翻译;Anthropic 也于 2025 年 5 月在 Claude 应用中加入语音功能,主打长文本理解与专业领域问答。苹果虽在开发 “LLM 驱动的 Siri”,但因功能可靠性未达预期推迟发布,凸显语音交互技术在自然语言理解、多场景适配等方面的落地挑战。

 

与竞品相比,谷歌的优势在于搜索生态与 AI 模型的深度整合:Gemini 不仅能回答常识性问题,还能实时抓取谷歌搜索的最新数据(如航班动态、股市行情),并通过知识图谱结构化呈现信息。例如用户询问 “某部电影的导演”,Search Live 会在语音回应中同时播报导演生平、代表作品及当前评分,文字记录则以卡片形式展示详细信息,实现 “语音快速获取要点,文本补充深度细节” 的互补体验。

场景延伸:从信息查询到生活助理的功能进化

Search Live 的应用场景正从基础信息搜索向生活服务渗透。在旅行场景中,用户可通过语音规划行程:“查一下从纽约到东京的直飞航班”“推荐东京银座的寿司店”“将行程添加到日历”,系统能完成从信息检索到任务执行的全流程;在购物场景中,用户描述 “寻找蓝色纯棉衬衫,预算 50 美元以内”,Search Live 会语音播报筛选结果,并支持语音控制翻页、查看详情,部分合作商家已接入语音下单功能。

 

谷歌表示,未来将开放 Search Live 的开发者接口,允许第三方应用接入语音交互能力,例如外卖平台可通过该功能实现语音点餐,教育应用支持语音问答互动。这种生态开放策略,或将推动语音交互从 “工具属性” 向 “基础设施” 转变,重塑移动互联网的人机交互范式。

 

当搜索引擎开始 “听懂” 对话的上下文,当语音交互不再局限于单一指令,Search Live 展现的不仅是技术升级,更是 AI 与生活融合的新可能。随着 Gemini 模型的持续迭代与场景数据的积累,语音搜索有望成为连接物理世界与数字信息的主要入口,让 “聊着天获取答案” 成为日常交互的新常态。
© 版权声明

相关文章

暂无评论

您必须登录才能参与评论!
立即登录
none
暂无评论...