video-pipeline

Pass

视频内容全链路处理。一个视频进去,文字稿+观点摘要+短视频切片+可发布文章全出来。串联 video-to-text → insight-extractor → video-clipper → article-forge 四个 skill 的完整流水线。适用于:直播回放、播客、会议录像的一站式内容加工。

@yfge
MIT3/27/2026
42out of 100
(0)
1
21
24

Install Skill

Skills are third-party code from public GitHub repositories. SkillHub scans for known malicious patterns but cannot guarantee safety. Review the source code before installing.

Install globally (user-level):

npx skillhub install yfge/video-skills-suite/video-pipeline

Install in current project:

npx skillhub install yfge/video-skills-suite/video-pipeline --project

Suggested path: ~/.claude/skills/video-pipeline/

AI Review

Instruction Quality50
Description Precision35
Usefulness42
Technical Soundness40

Scored 42 — creative orchestration architecture with smart parallelization (stages 2+3 concurrent). The time complexity analysis and output directory structure show thoughtful design. However, entirely dependent on 4 sub-skills (video-to-text, insight-extractor, video-clipper, article-forge) — useless without them. 1 GitHub star, Chinese-only.

SKILL.md Content

---
name: video-pipeline
description: 视频内容全链路处理。一个视频进去,文字稿+观点摘要+短视频切片+可发布文章全出来。串联 video-to-text → insight-extractor → video-clipper → article-forge 四个 skill 的完整流水线。适用于:直播回放、播客、会议录像的一站式内容加工。
user-invocable: true
metadata: {"openclaw": {"emoji": "🎬"}}
---

# Video Pipeline — 视频内容全链路

## 一句话

丢一个视频进来,出一套完整的内容产品:文字稿 + 观点摘要 + 短视频切片 + 可发布文章。

## 链路总览

```
输入: 视频文件 (直播回放/播客/会议录像)
  │
  ▼
┌─────────────────────────────────────────────┐
│ Stage 1: video-to-text                       │
│ 转写 → 带时间戳的文字稿 + JSON               │
│ (去口吃的基础数据也在这里产生)                │
└──────────────────┬──────────────────────────┘
                   │
        ┌──────────┴──────────┐
        ▼                     ▼
┌───────────────┐   ┌─────────────────────┐
│ Stage 2:       │   │ Stage 3:             │
│ insight-       │   │ video-clipper        │
│ extractor      │   │ 按观点切片 →         │
│ 提炼观点/金句  │   │ 去静音/去口吃 →      │
│ /争议点        │   │ 短视频成品           │
└───────┬───────┘   └─────────────────────┘
        │
        ▼
┌───────────────────────────────────────────┐
│ Stage 4: article-forge                     │
│ 观点摘要 + 原始文稿 → 可发布文章            │
│ (博客/知乎/公众号)                          │
└───────────────────────────────────────────┘

输出目录: workspace/pipeline/<project-name>/
  ├── transcript.txt          # 完整文字稿
  ├── transcript.json         # 带时间戳 JSON
  ├── insights.md             # 观点摘要
  ├── clips/                  # 短视频切片
  │   ├── 01-xxx.mp4
  │   ├── 02-xxx.mp4
  │   └── ...
  └── articles/               # 生成的文章
      ├── blog-xxx.md
      └── zhihu-xxx.md
```

## 执行流程

### 输入参数

用户给出:
1. **视频文件路径**(必须)
2. **项目名**(可选,默认从文件名生成)
3. **目标产出**(可选,默认全部):
   - `transcript` — 只要文字稿
   - `insights` — 文字稿 + 观点
   - `clips` — 文字稿 + 切片
   - `articles` — 文字稿 + 观点 + 文章
   - `all` — 全部(默认)
4. **文章平台**(可选):blog / zhihu / wechat
5. **切片数量**(可选,默认 5-8 条)

### Stage 1: 转写(video-to-text)

1. 读取 `video-to-text` SKILL.md
2. 创建项目目录:`workspace/pipeline/<project-name>/`
3. 用 nohup 后台执行转写脚本:
   ```bash
   nohup python3 {video-to-text-skillDir}/scripts/transcribe.py \
     /path/to/video.mp4 \
     --output-dir workspace/pipeline/<project-name>/ \
     --output-name transcript \
     --diarize \
     > /tmp/pipeline-transcribe.log 2>&1 &
   ```
4. 等待完成(用 process poll 或检查输出文件)
5. 产出:`transcript.txt` + `transcript.json`

**⚠️ 这是最耗时的阶段**,30 分钟视频大约需要 10-20 分钟转写。后续阶段都很快。

### Stage 2: 观点提炼(insight-extractor)

1. 读取 `insight-extractor` SKILL.md
2. 输入 `transcript.txt`
3. 按 insight-extractor 流程提炼:
   - 话题边界识别
   - 核心论点提取
   - 金句标注(保留时间戳)
   - 争议点标注
4. 产出:`insights.md`

**关键:** 金句和观点的时间戳要精确,Stage 3 切片需要用。

### Stage 3: 视频切片(video-clipper)

可以和 Stage 2 并行(都只依赖 Stage 1 的输出)。

1. 读取 `video-clipper` SKILL.md
2. 基于 `insights.md` 的观点 + `transcript.json` 的时间戳定位切片边界
3. 执行四阶段切片流程:
   - 用 `batch-clip-v4.sh` 批量切片(去静音 + 去口吃 + crossfade)
   - 用 `batch-postcheck.sh` 二次质检
   - 必要时用 `iterate-until-clean.py` 迭代修复
4. 产出:`clips/01-xxx.mp4`, `clips/02-xxx.mp4`, ...

**优化:** 优先切 insights 中标记为「金句」和「争议点」的片段——这些做短视频最有传播力。

### Stage 4: 文章生成(article-forge)

1. 读取 `article-forge` SKILL.md
2. 输入 `insights.md` + `transcript.txt`
3. 根据目标平台选择文体和风格
4. 生成文章,严格执行去 AI 味
5. 产出:`articles/blog-xxx.md` 或 `articles/zhihu-xxx.md`

**可选:** 如果用户要求发布,调用 ZhiForge 的发布流程。

## 并行策略

```
时间线:
─────────────────────────────────────────────────>
  Stage 1 (转写)     Stage 2 (观点)     Stage 4 (文章)
  ████████████████    ████████           ████████
                      Stage 3 (切片)
                      ████████████████
```

- Stage 2 和 Stage 3 可以**并行**(用 sessions_spawn 分别跑)
- Stage 4 依赖 Stage 2 的输出,串行
- Stage 1 最慢,占总时间 60-70%

## 子 agent 编排

推荐用 `sessions_spawn` 并行化:

```
主 agent:
  1. 启动 Stage 1(转写,等待完成)
  2. spawn 子 agent A → Stage 2(观点提炼)
  3. spawn 子 agent B → Stage 3(视频切片)
  4. 等 A 完成 → 启动 Stage 4(文章生成)
  5. 等 B 完成 → 汇总输出
```

## 输出汇总模板

全部完成后,向用户汇报:

```
🎬 视频内容处理完成

📹 源文件:xxx.mp4 (时长 XX:XX)
📁 项目目录:workspace/pipeline/<name>/

📝 文字稿:transcript.txt (XXXX 字)
💡 观点提炼:insights.md
   - X 个核心观点
   - X 条金句
   - X 个争议点

🎞️ 短视频切片:X 条
   - 01-xxx.mp4 (XX:XX) — 主题
   - 02-xxx.mp4 (XX:XX) — 主题
   - ...

📄 文章:X 篇
   - blog-xxx.md (XXXX 字) — 标题
   - zhihu-xxx.md (XXXX 字) — 标题
```

## 快速触发

用户说以下任何一种,触发此 skill:
- "处理这个视频"
- "视频全链路"
- "直播回放处理"
- "把这个视频变成内容"
- "video pipeline"

默认执行 `all`(全部产出),除非用户指定只要某个阶段。

## 注意事项

- Stage 1 转写**必须用 nohup 后台**,否则超时
- 文件名含中文要建英文 symlink
- 切片依赖 transcript.json 的 word_segments,不是 transcript.txt
- 文章生成依赖 insights.md,不能跳过 Stage 2 直接到 Stage 4
- 所有产出存 `workspace/pipeline/<project-name>/`,不用 /tmp/
- 用完浏览器后必须 `browser stop`