
产品介绍
Pegasus 1.5 能够实时将原始视频转化为一致、结构化、带时间戳的数据。视频根据公司的自定义需求,转变为可查询、可计算的资产。只需定义所在领域的关键要素模式,指向任意最长2小时的视频,即可通过单次API调用获得基于时间的结构化元数据。该模型支持多模态输入——传入一张图片,即可在视频中找到该参考内容出现的所有时间点。视频库最终可供人类和智能体查询。
适合谁关注
- 开发者和技术团队
- 设计师、内容创作者和视觉团队
- 正在评估 AI 工具或智能体落地的团队
可借鉴场景
- 快速理解 Pegasus 1.5 by TwelveLabs 的定位、核心能力和 Product Hunt 热度
- 判断“将视频转化为基于时间戳的元数据的AI模型”这类需求是否值得做竞品调研
- 沿着 开发者工具、AI 与智能体 继续发现同类产品和替代方案
- 筛选高票产品,观察海外用户当前愿意投票支持的产品形态
173
投票数
5
评论数
4月20日
发布日期
作者自荐
总结
Pegasus 1.5 瞄准了视频数据价值挖掘的核心痛点:如何将非结构化的视频流转化为可被程序化理解和利用的结构化数据。其创新点在于将视频视为一种"数据库",通过定义自定义模式(Schema)来提取基于时间戳的元数据,这为视频内容分析、检索和自动化处理开辟了新路径。支持长达2小时的视频和多模态查询(如图片搜视频片段),使其在长视频内容管理、媒体资产管理、安防监控、教育培训等领域具有广泛应用潜力。其宣称的性能优势(超越Gemini系列)若经市场验证,将为其在竞争激烈的AI视频分析市场建立技术壁垒。挑战在于如何降低自定义模式的门槛,以及确保在不同类型视频(如电影、监控、会议录像)上提取元数据的准确性和一致性。
GitMemo免费开源
把 AI 对话保存到你的 Git 知识库
本地优先,支持 macOS 与 Android。剪贴板、截图、笔记和文件都能集中保存、搜索、同步。
获取安装包

与 @emilykurze 和 @TwelveLabs 团队合作完成这次发布,过程非常愉快。 Pegasus 1.5 是生成式视频AI领域的一次重大飞跃:具备自主且可靠的分段能力,支持长视频(最长2小时),并拥有业界领先的性能(比 Gemini 3 Pro、3.1 Pro 和 3 Flash 高出30%)。 欢迎在 twelvelabs.io 上尝试免费的 Playground——期待看到大家用它创造出什么!