OpenClaw summarize 0.12.0:秒杀式摘要引擎,吞噬URL/文件/媒体三源


summarize 0.12.0 版本现已发布! 点击标题,这是一款用于OpenClaw从 URL、文件和媒体快速生成摘要 !

幻灯片和媒体功能重大更新:更强大的 Chrome 侧边栏滑动模式、更流畅的 YouTube/视频切换、AssemblyAI+Gemini 转录、X 的 xurl 以及 NVIDIA 提供商

Summarize 是由 Peter Steinberger(OpenClaw之父、PSPDFKit 创始人)开发的一个开源 AI 工具,旨在帮助用户快速从各种信息源(链接、视频、文件等)中提取核心内容。

以下是该项目的主要特点和功能介绍:

1. 核心功能

* 多源支持:可以处理 URL 网页、YouTube 视频、播客(Podcasts)、PDF 文件、本地音频/视频文件以及图片。
* 智能提取管线
* 网页:将 HTML 转换为干净的 Markdown 文本(支持 Firecrawl 备份)。
* 媒体:优先获取已有的字幕/转录稿;如果没有,则使用本地或云端的 Whisper 进行语音转文字(STT)。
* 图片/视频:支持通过 OCR 提取文字或使用多模态模型进行理解。


* 总结生成:基于提取出的文本,通过大语言模型(LLM)生成简洁的摘要。

2. 多种使用方式

* CLI(命令行界面):适合开发者和自动化工作流。支持输出 JSON 或 Markdown,方便与其他脚本集成。
* Chrome 侧边栏扩展:在浏览器侧边栏中提供一键总结功能,支持流式输出摘要,并能随网页跳转自动更新。
* YouTube 增强功能:在侧边栏中会渲染视频截图、OCR 结果和带时间戳的转录卡片,点击时间戳可直接跳转视频。

3. 模型支持

* 模型不可知论:支持本地模型、付费 API 以及 OpenRouter。
* 本地运行:可以通过 Ollama 或兼容 OpenAI 协议的本地网关运行模型。
* 集成其他 CLI:甚至可以调用 claudegemini 的官方 CLI 工具作为后端。

4. 技术架构

* 本地守护进程 (Daemon):Chrome 扩展程序通过与本地运行的 127.0.0.1 服务通信,来执行较重的提取任务(如 yt-dlp 下载、ffmpeg 处理、tesseract OCR 等)。
* 安全与隐私:大部分处理逻辑在本地完成,只有 LLM 请求会发送到你配置的服务商。

5. 适用人群

* 信息过载者:快速筛选长文章、长视频的核心点。
* 开发者/效率专家:利用 CLI 将网页内容自动化导入到 Obsidian、Notion 等笔记软件中。
* 研究人员:快速处理大量 PDF 或视频录音,并获得带原始出处的摘要。

项目地址https://github.com/steipete/summarize/
官网/文档summarize.sh