Ollama v0.19

Name: Ollama v0.19
Brand: Ollama v0.19
Availability: InStock

基于 MLX 为 Apple Silicon 带来本地模型性能大幅提升

开源人工智能苹果

在 Product Hunt 查看访问官网

产品介绍

Ollama v0.19 基于 MLX 重构了 Apple Silicon 的推理引擎，为本地编程和 agent 工作流带来显著的性能提升。该版本还新增了对 NVFP4 格式的支持，并引入了更智能的缓存复用、快照和淘汰机制，以实现更流畅的交互体验。

适合谁关注

开发者和技术团队
正在评估 AI 工具或智能体落地的团队

可借鉴场景

快速理解 Ollama v0.19 的定位、核心能力和 Product Hunt 热度
判断“基于 MLX 为 Apple Silicon 带来本地模型性能大幅提升”这类需求是否值得做竞品调研
沿着开发者工具、AI 与智能体继续发现同类产品和替代方案
筛选高票产品，观察海外用户当前愿意投票支持的产品形态

311

投票数

评论数

4月1日

发布日期

作者自荐

大家好！ Ollama v0.19 的工程改进，对于在 macOS 上运行本地模型的用户而言是一次巨大的飞跃。转向苹果原生的 MLX 框架从根本上改变了性能表现，充分利用了统一内存架构和 M5 芯片上的新型 GPU 神经加速器。 v0.19 现在也支持 NVFP4 格式，这使本地推理能力更接近生产环境水平。KV 缓存也经过了重构，实现了跨对话的缓存复用、智能检查点以及更智能的淘汰策略。对于像 @Claude Code 或 @OpenClaw 这类分支式 agent 工作流，这意味着更低的内存占用和更快的响应速度。如果拥有一台配备 32GB 及以上统一内存的 Mac，现在就可以拉取新的 Qwen3.5-35B-A3B NVFP4 模型并立即测试。在本地运行复杂的 agent 工作流变得前所未有的可行！

总结

Ollama v0.19 的发布标志着本地大模型运行效率进入新阶段。其核心创新在于深度拥抱苹果生态，从通用的计算框架转向苹果专为机器学习优化的原生 MLX 框架。这一转变充分利用了 Apple Silicon 的统一内存架构和专用神经引擎，解决了传统跨平台框架在 Mac 上的性能瓶颈。NVFP4 格式的支持和智能缓存管理，则进一步降低了复杂 agent 工作流对硬件的要求，使本地运行 350 亿参数级别的模型成为可能。这直接服务于日益增长的、对数据隐私和低延迟有高要求的开发者、研究者和 AI 应用构建者。此举不仅巩固了 Ollama 在本地模型部署工具中的领先地位，也推动了边缘 AI 计算的发展。潜在挑战在于其生态绑定可能限制其在非苹果硬件上的发展，以及如何持续优化以应对模型规模的持续增长。

GitMemo免费开源

把 AI 对话保存到你的 Git 知识库

本地优先，支持 macOS 与 Android。剪贴板、截图、笔记和文件都能集中保存、搜索、同步。

获取安装包