


Google AI Edge Gallery 是一款免费、开源的 iOS 应用,能将强大的设备端大语言模型(LLM)直接带到你的 iPhone 上。它完全离线运行先进的生成式 AI,确保你的数据绝对隐私。该应用支持最新推出的 Gemma 4 系列,并引入了 Mobile Actions(移动操作)这一突破性功能,可将自然语音指令转化为真实的手机操作,全程无需联网。
由紧凑型 270M 参数 FunctionGemma 模型驱动,Mobile Actions 可通过自然语言实现离线设备控制。你可以创建日历事件、打开地图、开关手电筒,以及执行其他自动化任务——全部即时完成,无需联网。
支持流畅的多轮对话,并可开启思考模式,查看模型逐步推理的过程。此功能非常适合理解复杂问题的解决思路,目前适用于 Gemma 4 系列及后续支持的模型。
将你的 LLM 从对话者转变为主动助手。使用维基百科进行事实核查、交互式地图以及丰富的视觉摘要卡片。你甚至可以通过 URL 加载模块化技能,或在 GitHub Discussions 上浏览社区贡献。
利用多模态能力,通过设备摄像头或相册识别物体、解决视觉谜题或获取详细描述。音频转录功能可实时将语音录音转录并翻译为文本,全部由高效的设备端语言模型完成。
"Mobile Actions 能将自然语音指令即时转化为真实的手机操作——全部离线完成。"
这是设备端函数调用首次登陆 iPhone,由专门的 270M 参数 FunctionGemma 模型驱动。当其他 AI 应用需要云端连接才能执行任务时,Google AI Edge Gallery 在本地完成一切,既更快速又完全私密。紧凑高效的模型与真实设备控制的结合,为设备端 AI 助手树立了新标准。
想要一个私密、离线的 AI 助手,能通过自然语音指令真正控制你的 iPhone。如果你是开发者或 AI 爱好者,希望尝试开源模型、测试自定义提示词,或为设备端智能体生态系统做出贡献,它同样适合你。该应用免费、开源,并由 Google 积极开发,是追求尖端设备端 AI 能力的理想选择。
其他您可能感兴趣的工具
自然表达,Typeless for iOS 会将您的语音实时转化为清晰、精炼的消息、邮件和文档,读起来就像您精心输入的一样。突然间,您的 iPhone 就能轻松完成那些曾经看似不可能的事情,而且速度提升十倍。
Okara 让您无需处理基础设施搭建,即可使用 30 多种强大的开源 AI 模型。像 Kimi 和 DeepSeek 这类顶级模型体积过大,无法在您的笔记本电脑上运行,我们为您代劳。在聊天中切换模型、搜索 Google、Reddit、X、YouTube,分析文件、生成图像,并与您的团队协作。所有内容均经过加密,我们绝不会利用您的数据进行训练。
我们推出 PersonaPlex,这是一款全双工对话式 AI 模型,支持自然对话,并可根据需求自定义语音和角色。PersonaPlex 能够处理打断和反馈,同时保持任意选定的角色,在对话动态和任务遵循方面优于现有系统。
Mistral 3 包含三款最先进的小型密集模型(14B、8B 和 3B),以及 Mistral Large 3——我们迄今为止能力最强的模型——这是一款稀疏混合专家模型,训练时使用了 41B 活跃参数和 675B 总参数。所有模型均依据 Apache 2.0 许可证发布。Ministral 模型在其类别中代表了最佳性能与成本比。同时,Mistral Large 3 跻身于前沿指令微调开源模型之列。
Loading comments…
制作者
mocha_byte
访问网站
apps.apple.com/us/app/google-ai-edge-gallery/id6749645337
项目信息
产品关键词