video-pipeline
تایید شده视频内容全链路处理。一个视频进去,文字稿+观点摘要+短视频切片+可发布文章全出来。串联 video-to-text → insight-extractor → video-clipper → article-forge 四个 skill 的完整流水线。适用于:直播回放、播客、会议录像的一站式内容加工。
نصب مهارت
مهارتها کدهای شخص ثالث از مخازن عمومی GitHub هستند. SkillHub الگوهای مخرب شناختهشده را اسکن میکند اما نمیتواند امنیت را تضمین کند. قبل از نصب، کد منبع را بررسی کنید.
نصب سراسری (سطح کاربر):
npx skillhub install yfge/video-skills-suite/video-pipelineنصب در پروژه فعلی:
npx skillhub install yfge/video-skills-suite/video-pipeline --projectمسیر پیشنهادی: ~/.claude/skills/video-pipeline/
بررسی هوش مصنوعی
Scored 42 — creative orchestration architecture with smart parallelization (stages 2+3 concurrent). The time complexity analysis and output directory structure show thoughtful design. However, entirely dependent on 4 sub-skills (video-to-text, insight-extractor, video-clipper, article-forge) — useless without them. 1 GitHub star, Chinese-only.
محتوای SKILL.md
---
name: video-pipeline
description: 视频内容全链路处理。一个视频进去,文字稿+观点摘要+短视频切片+可发布文章全出来。串联 video-to-text → insight-extractor → video-clipper → article-forge 四个 skill 的完整流水线。适用于:直播回放、播客、会议录像的一站式内容加工。
user-invocable: true
metadata: {"openclaw": {"emoji": "🎬"}}
---
# Video Pipeline — 视频内容全链路
## 一句话
丢一个视频进来,出一套完整的内容产品:文字稿 + 观点摘要 + 短视频切片 + 可发布文章。
## 链路总览
```
输入: 视频文件 (直播回放/播客/会议录像)
│
▼
┌─────────────────────────────────────────────┐
│ Stage 1: video-to-text │
│ 转写 → 带时间戳的文字稿 + JSON │
│ (去口吃的基础数据也在这里产生) │
└──────────────────┬──────────────────────────┘
│
┌──────────┴──────────┐
▼ ▼
┌───────────────┐ ┌─────────────────────┐
│ Stage 2: │ │ Stage 3: │
│ insight- │ │ video-clipper │
│ extractor │ │ 按观点切片 → │
│ 提炼观点/金句 │ │ 去静音/去口吃 → │
│ /争议点 │ │ 短视频成品 │
└───────┬───────┘ └─────────────────────┘
│
▼
┌───────────────────────────────────────────┐
│ Stage 4: article-forge │
│ 观点摘要 + 原始文稿 → 可发布文章 │
│ (博客/知乎/公众号) │
└───────────────────────────────────────────┘
输出目录: workspace/pipeline/<project-name>/
├── transcript.txt # 完整文字稿
├── transcript.json # 带时间戳 JSON
├── insights.md # 观点摘要
├── clips/ # 短视频切片
│ ├── 01-xxx.mp4
│ ├── 02-xxx.mp4
│ └── ...
└── articles/ # 生成的文章
├── blog-xxx.md
└── zhihu-xxx.md
```
## 执行流程
### 输入参数
用户给出:
1. **视频文件路径**(必须)
2. **项目名**(可选,默认从文件名生成)
3. **目标产出**(可选,默认全部):
- `transcript` — 只要文字稿
- `insights` — 文字稿 + 观点
- `clips` — 文字稿 + 切片
- `articles` — 文字稿 + 观点 + 文章
- `all` — 全部(默认)
4. **文章平台**(可选):blog / zhihu / wechat
5. **切片数量**(可选,默认 5-8 条)
### Stage 1: 转写(video-to-text)
1. 读取 `video-to-text` SKILL.md
2. 创建项目目录:`workspace/pipeline/<project-name>/`
3. 用 nohup 后台执行转写脚本:
```bash
nohup python3 {video-to-text-skillDir}/scripts/transcribe.py \
/path/to/video.mp4 \
--output-dir workspace/pipeline/<project-name>/ \
--output-name transcript \
--diarize \
> /tmp/pipeline-transcribe.log 2>&1 &
```
4. 等待完成(用 process poll 或检查输出文件)
5. 产出:`transcript.txt` + `transcript.json`
**⚠️ 这是最耗时的阶段**,30 分钟视频大约需要 10-20 分钟转写。后续阶段都很快。
### Stage 2: 观点提炼(insight-extractor)
1. 读取 `insight-extractor` SKILL.md
2. 输入 `transcript.txt`
3. 按 insight-extractor 流程提炼:
- 话题边界识别
- 核心论点提取
- 金句标注(保留时间戳)
- 争议点标注
4. 产出:`insights.md`
**关键:** 金句和观点的时间戳要精确,Stage 3 切片需要用。
### Stage 3: 视频切片(video-clipper)
可以和 Stage 2 并行(都只依赖 Stage 1 的输出)。
1. 读取 `video-clipper` SKILL.md
2. 基于 `insights.md` 的观点 + `transcript.json` 的时间戳定位切片边界
3. 执行四阶段切片流程:
- 用 `batch-clip-v4.sh` 批量切片(去静音 + 去口吃 + crossfade)
- 用 `batch-postcheck.sh` 二次质检
- 必要时用 `iterate-until-clean.py` 迭代修复
4. 产出:`clips/01-xxx.mp4`, `clips/02-xxx.mp4`, ...
**优化:** 优先切 insights 中标记为「金句」和「争议点」的片段——这些做短视频最有传播力。
### Stage 4: 文章生成(article-forge)
1. 读取 `article-forge` SKILL.md
2. 输入 `insights.md` + `transcript.txt`
3. 根据目标平台选择文体和风格
4. 生成文章,严格执行去 AI 味
5. 产出:`articles/blog-xxx.md` 或 `articles/zhihu-xxx.md`
**可选:** 如果用户要求发布,调用 ZhiForge 的发布流程。
## 并行策略
```
时间线:
─────────────────────────────────────────────────>
Stage 1 (转写) Stage 2 (观点) Stage 4 (文章)
████████████████ ████████ ████████
Stage 3 (切片)
████████████████
```
- Stage 2 和 Stage 3 可以**并行**(用 sessions_spawn 分别跑)
- Stage 4 依赖 Stage 2 的输出,串行
- Stage 1 最慢,占总时间 60-70%
## 子 agent 编排
推荐用 `sessions_spawn` 并行化:
```
主 agent:
1. 启动 Stage 1(转写,等待完成)
2. spawn 子 agent A → Stage 2(观点提炼)
3. spawn 子 agent B → Stage 3(视频切片)
4. 等 A 完成 → 启动 Stage 4(文章生成)
5. 等 B 完成 → 汇总输出
```
## 输出汇总模板
全部完成后,向用户汇报:
```
🎬 视频内容处理完成
📹 源文件:xxx.mp4 (时长 XX:XX)
📁 项目目录:workspace/pipeline/<name>/
📝 文字稿:transcript.txt (XXXX 字)
💡 观点提炼:insights.md
- X 个核心观点
- X 条金句
- X 个争议点
🎞️ 短视频切片:X 条
- 01-xxx.mp4 (XX:XX) — 主题
- 02-xxx.mp4 (XX:XX) — 主题
- ...
📄 文章:X 篇
- blog-xxx.md (XXXX 字) — 标题
- zhihu-xxx.md (XXXX 字) — 标题
```
## 快速触发
用户说以下任何一种,触发此 skill:
- "处理这个视频"
- "视频全链路"
- "直播回放处理"
- "把这个视频变成内容"
- "video pipeline"
默认执行 `all`(全部产出),除非用户指定只要某个阶段。
## 注意事项
- Stage 1 转写**必须用 nohup 后台**,否则超时
- 文件名含中文要建英文 symlink
- 切片依赖 transcript.json 的 word_segments,不是 transcript.txt
- 文章生成依赖 insights.md,不能跳过 Stage 2 直接到 Stage 4
- 所有产出存 `workspace/pipeline/<project-name>/`,不用 /tmp/
- 用完浏览器后必须 `browser stop`