你是不是也常常为了剪掉播客里的「嗯」「然后」而头疼?面对永无止尽的电波,来来回回听到耳朵长茧?
我做中文播客 5 年,还是会剪播客剪到崩溃。
本文一步步带你——完全零基础——跑通整套流程:上传音频 → AI 转文字 → 自动找出口癖 → 生成剪辑软件标签。
(PS:被这个cover图笑死了...)
目录
📦 准备材料
物品 | 说明 |
---|---|
一段音频文件 | 支持 .m4a / .mp3 / .wav ,建议先用 1 ~ 3 分钟试跑 |
Google 账号 | 用来登录 Google Colab(免费云端 Jupyter 环境) |
OpenAI API Key | Whisper 转录接口用,费用 $0.006/音频分钟 |
(可选)Audacity / Audition | 你日常用来剪播客的软件 |
🟢 什么是 Google Colab?
Google Colab = 在线版 Jupyter Notebook + 免费 GPU。
打开网页就能跑 Python 代码,文件保存在云端,不用本地装环境。
- 网址:https://colab.research.google.com/
- 步骤:
- 登录 Google 账号
- 打开下方提供的 Notebook 链接
- 点击顶部 Runtime → Run all,Colab 会按顺序执行每个代码块
- Colab 会弹窗要求授权挂载 Google Drive,你可以点「取消」,所有文件会存到临时空间(断线后消失)。
🔑 注册并获取 OpenAI API Key
- 访问 https://platform.openai.com/signup ,用邮箱或 Google/GitHub 账号注册。
- 登录后,进入 左侧栏 → API Keys
- 点击 “+ Create new secret key”
- 复制生成的 Key(只会显示一次!),形式如
sk-xxxxxxxxxxxxxxxx
- 在 Colab 运行时,脚本会提示你粘贴这串 Key 并存入环境变量
OPENAI_API_KEY
。
💡 费用说明
- Whisper 转录:
$0.006 / 音频分钟
- 10 分钟 ≈
$0.06
;99 分钟 ≈$0.50
- 计费到你的 OpenAI 账户预付余额,官网可随时查看消耗。
🚀 一键运行脚本
点击下方链接直接打开 Notebook,可以生成一个copy,保存到你的google drive。跟着提示操作即可(无需改代码)
👉 打开 Colab Notebook
Notebook 主要步骤
步骤 | 自动做什么 |
---|---|
0. 安装依赖 | 安装 openai 、ffmpeg-python 等库 |
1. 上传音频 | 浏览上传,或拖到 Colab 左侧 Files |
2. 自动压缩 | 单声道 16 kHz,体积更小 |
3. 分片 | 拆成 ≤ 25 MB 的小文件,避免 API 限制 |
4. Whisper 转录 | 调 OpenAI 接口,拿到「每个词 + 时间戳」 |
5. 口癖标注 | 查找「嗯」「呃」「然后」「就是」并生成标签 |
6. 选择导出格式 | 输入 audacity / audition / both |
7. 下载文件 | Colab 自动弹出 download 按钮 |
🎬 导入剪辑软件
我录制了一个剪辑方式,可以点开youtube视频[观看](< https://youtu.be/f9IPWaR7HvI>)。
Audacity
- File → Import → Labels
- 选择
full_labels.txt
- 时间轴下方出现多条标签;带
[FILLER]
前缀的即口癖词
Adobe Audition
- Window → Markers 打开标记面板
- 面板菜单 → Import Markers...
- 选择
full_labels.csv
- 所有标记自动对齐到音频
❓ 常见问题 FAQ
问题 | 解答 |
---|---|
上传大于 100 MB 的音频怎么办? | 用脚本自带的 ffmpeg 压缩;或本地先 ffmpeg -i in.m4a -ac 1 -ar 16000 -b:a 128k out.m4a |
我不会 Python,要改代码吗? | 不用。Notebook 已封装输入提示,你只负责「上传文件→粘贴 API Key→选输出格式」。 |
API 太贵怎么办? | 先用 1 分钟音频测试,确认效果再转长音频;99 分钟只要 $0.50,比人工听写省很多时间。 |
能不能同时删除口癖并导出成新音频? | 目前版生成标签供手动审听。下一步会加入自动裁剪并导出。 |
📊 关于其他剪辑工具的一点想法
在做这个工具之前,我也尝试过市面上其他“语音转文字 + 自动剪辑”工具。这里简单分享一下体验:
🧟 Vocut(已关闭)
曾经是一个简洁的文字剪辑音频工具,操作界面像 Notion,用户可以删句子直接剪音频。当时我还挺推荐的,但现在网站已经下线,项目疑似停止开发。看来自动剪辑中文播客,目前还不是一门好生意。
🇨🇳 喜马拉雅 Creator 工具
功能其实很全,支持剪辑、加封面、发布。但必须注册登录使用,而且内容必然经过平台审查。虽然我的内容都不敏感,但我希望尽可能远离审查制度,保有自由创作的空间。
🇺🇸 Descript(目前不支持中文)
我非常喜欢 Descript 的产品设计 —— 文字就是音频。只要能支持中文,我一定第一时间迁移过去! 但目前它只适用于英文播客,中文识别不够准,口癖无法识别,甚至连拼音都处理不好。
所以现在这个 PodEditor Lite 的思路就是:
- 不绑定平台,自己可用、可掌控
- 不受审查、不依赖某个编辑器
- 在中文语境下也能工作得很好
等哪天 Descript 支持中文,我会开心地切过去。但在那之前,这就是我给自己的工具。
🗓️ 下一步计划
- AI 剪辑建议:识别“信息量低”段落并自动加
[DELETE?]
标记 - 文本驱动剪辑:在 Notebook 中直接删除文字 → 自动生成裁剪后音频
- 播客 show notes 自动生成:调用 GPT‑4o / Claude,总结章节要点,生成 show notes / 章节段落
✨ 全文总结
PodEditor Lite 把“找口癖+打标记”这件事,做到 3 分钟上手、50 美分跑完 1.5 小时音频。
如果你是中文播客创作者,试一试,也许能把剪辑效率提升 3 ~ 5 倍。
作者:@Simona
项目名:PodEditor Lite
发布日期:2025 年 6 月