Product Hunt
Product Hunt 每日热榜

发现最新、最有趣的产品和创业项目

Ollama v0.19

Ollama v0.19

基于 MLX 为 Apple Silicon 带来本地模型性能大幅提升

Ollama v0.19

产品介绍

Ollama v0.19 基于 MLX 重构了 Apple Silicon 的推理引擎,为本地编程和 agent 工作流带来显著的性能提升。该版本还新增了对 NVFP4 格式的支持,并引入了更智能的缓存复用、快照和淘汰机制,以实现更流畅的交互体验。

适合谁关注

  • 开发者和技术团队
  • 正在评估 AI 工具或智能体落地的团队

可借鉴场景

  • 快速理解 Ollama v0.19 的定位、核心能力和 Product Hunt 热度
  • 判断“基于 MLX 为 Apple Silicon 带来本地模型性能大幅提升”这类需求是否值得做竞品调研
  • 沿着 开发者工具、AI 与智能体 继续发现同类产品和替代方案
  • 筛选高票产品,观察海外用户当前愿意投票支持的产品形态
311
投票数
8
评论数
4月1日
发布日期

作者自荐

大家好! Ollama v0.19 的工程改进,对于在 macOS 上运行本地模型的用户而言是一次巨大的飞跃。转向苹果原生的 MLX 框架从根本上改变了性能表现,充分利用了统一内存架构和 M5 芯片上的新型 GPU 神经加速器。 v0.19 现在也支持 NVFP4 格式,这使本地推理能力更接近生产环境水平。KV 缓存也经过了重构,实现了跨对话的缓存复用、智能检查点以及更智能的淘汰策略。对于像 @Claude Code 或 @OpenClaw 这类分支式 agent 工作流,这意味着更低的内存占用和更快的响应速度。 如果拥有一台配备 32GB 及以上统一内存的 Mac,现在就可以拉取新的 Qwen3.5-35B-A3B NVFP4 模型并立即测试。在本地运行复杂的 agent 工作流变得前所未有的可行!

总结

Ollama v0.19 的发布标志着本地大模型运行效率进入新阶段。其核心创新在于深度拥抱苹果生态,从通用的计算框架转向苹果专为机器学习优化的原生 MLX 框架。这一转变充分利用了 Apple Silicon 的统一内存架构和专用神经引擎,解决了传统跨平台框架在 Mac 上的性能瓶颈。NVFP4 格式的支持和智能缓存管理,则进一步降低了复杂 agent 工作流对硬件的要求,使本地运行 350 亿参数级别的模型成为可能。这直接服务于日益增长的、对数据隐私和低延迟有高要求的开发者、研究者和 AI 应用构建者。此举不仅巩固了 Ollama 在本地模型部署工具中的领先地位,也推动了边缘 AI 计算的发展。潜在挑战在于其生态绑定可能限制其在非苹果硬件上的发展,以及如何持续优化以应对模型规模的持续增长。

GitMemo免费开源

把 AI 对话保存到你的 Git 知识库

本地优先,支持 macOS 与 Android。剪贴板、截图、笔记和文件都能集中保存、搜索、同步。

获取安装包