Jun 27, 2025

中文播客剪辑苦手们有救啦，用文字剪音频（内附免费代码文件，有手就行）

你是不是也常常为了剪掉播客里的「嗯」「然后」而头疼？面对永无止尽的电波，来来回回听到耳朵长茧？

我做中文播客 5 年，还是会剪播客剪到崩溃。

本文一步步带你——完全零基础——跑通整套流程：上传音频 → AI 转文字 → 自动找出口癖 → 生成剪辑软件标签。

（PS：被这个cover图笑死了...）

📦 准备材料

物品	说明
一段音频文件	支持 `.m4a` / `.mp3` / `.wav`，建议先用 1 ~ 3 分钟试跑
Google 账号	用来登录 Google Colab（免费云端 Jupyter 环境）
OpenAI API Key	Whisper 转录接口用，费用 $0.006/音频分钟
（可选）Audacity / Audition	你日常用来剪播客的软件

🟢 什么是 Google Colab？

Google Colab = 在线版 Jupyter Notebook + 免费 GPU。
打开网页就能跑 Python 代码，文件保存在云端，不用本地装环境。

网址：https://colab.research.google.com/
步骤：
1. 登录 Google 账号
2. 打开下方提供的 Notebook 链接
3. 点击顶部 Runtime → Run all，Colab 会按顺序执行每个代码块
Colab 会弹窗要求授权挂载 Google Drive，你可以点「取消」，所有文件会存到临时空间（断线后消失）。

🔑 注册并获取 OpenAI API Key

访问 https://platform.openai.com/signup ，用邮箱或 Google/GitHub 账号注册。
登录后，进入 左侧栏 → API Keys
点击 “+ Create new secret key”
复制生成的 Key（只会显示一次！），形式如 sk-xxxxxxxxxxxxxxxx
在 Colab 运行时，脚本会提示你粘贴这串 Key 并存入环境变量 OPENAI_API_KEY。

💡 费用说明

Whisper 转录：$0.006 / 音频分钟
10 分钟 ≈ $0.06；99 分钟 ≈ $0.50
计费到你的 OpenAI 账户预付余额，官网可随时查看消耗。

🚀 一键运行脚本

点击下方链接直接打开 Notebook，可以生成一个copy，保存到你的google drive。跟着提示操作即可（无需改代码）
👉 打开 Colab Notebook

Notebook 主要步骤

步骤	自动做什么
0. 安装依赖	安装 `openai`、`ffmpeg-python` 等库
1. 上传音频	浏览上传，或拖到 Colab 左侧 Files
2. 自动压缩	单声道 16 kHz，体积更小
3. 分片	拆成 ≤ 25 MB 的小文件，避免 API 限制
4. Whisper 转录	调 OpenAI 接口，拿到「每个词 + 时间戳」
5. 口癖标注	查找「嗯」「呃」「然后」「就是」并生成标签
6. 选择导出格式	输入 `audacity` / `audition` / `both`
7. 下载文件	Colab 自动弹出 download 按钮

🎬 导入剪辑软件

我录制了一个剪辑方式，可以点开youtube视频[观看](< https://youtu.be/f9IPWaR7HvI>)。

Audacity

File → Import → Labels
选择 full_labels.txt
时间轴下方出现多条标签；带 [FILLER] 前缀的即口癖词

Adobe Audition

Window → Markers 打开标记面板
面板菜单 → Import Markers...
选择 full_labels.csv
所有标记自动对齐到音频

❓ 常见问题 FAQ

问题	解答
上传大于 100 MB 的音频怎么办？	用脚本自带的 ffmpeg 压缩；或本地先 `ffmpeg -i in.m4a -ac 1 -ar 16000 -b:a 128k out.m4a`
我不会 Python，要改代码吗？	不用。Notebook 已封装输入提示，你只负责「上传文件→粘贴 API Key→选输出格式」。
API 太贵怎么办？	先用 1 分钟音频测试，确认效果再转长音频；99 分钟只要 $0.50，比人工听写省很多时间。
能不能同时删除口癖并导出成新音频？	目前版生成标签供手动审听。下一步会加入自动裁剪并导出。

📊 关于其他剪辑工具的一点想法

在做这个工具之前，我也尝试过市面上其他“语音转文字 + 自动剪辑”工具。这里简单分享一下体验：

🧟 Vocut（已关闭）

曾经是一个简洁的文字剪辑音频工具，操作界面像 Notion，用户可以删句子直接剪音频。当时我还挺推荐的，但现在网站已经下线，项目疑似停止开发。看来自动剪辑中文播客，目前还不是一门好生意。

🇨🇳 喜马拉雅 Creator 工具

功能其实很全，支持剪辑、加封面、发布。但必须注册登录使用，而且内容必然经过平台审查。虽然我的内容都不敏感，但我希望尽可能远离审查制度，保有自由创作的空间。

🇺🇸 Descript（目前不支持中文）

我非常喜欢 Descript 的产品设计 —— 文字就是音频。只要能支持中文，我一定第一时间迁移过去！ 但目前它只适用于英文播客，中文识别不够准，口癖无法识别，甚至连拼音都处理不好。

所以现在这个 PodEditor Lite 的思路就是：

不绑定平台，自己可用、可掌控
不受审查、不依赖某个编辑器
在中文语境下也能工作得很好

等哪天 Descript 支持中文，我会开心地切过去。但在那之前，这就是我给自己的工具。

🗓️ 下一步计划

AI 剪辑建议：识别“信息量低”段落并自动加 [DELETE?] 标记
文本驱动剪辑：在 Notebook 中直接删除文字 → 自动生成裁剪后音频
播客 show notes 自动生成：调用 GPT‑4o / Claude，总结章节要点，生成 show notes / 章节段落

✨ 全文总结

PodEditor Lite 把“找口癖+打标记”这件事，做到 3 分钟上手、50 美分跑完 1.5 小时音频。
如果你是中文播客创作者，试一试，也许能把剪辑效率提升 3 ~ 5 倍。

作者：@Simona
项目名：PodEditor Lite
发布日期：2025 年 6 月