中文播客剪辑苦手们有救啦,用文字剪音频(内附免费代码文件,有手就行)

你是不是也常常为了剪掉播客里的「嗯」「然后」而头疼?面对永无止尽的电波,来来回回听到耳朵长茧?

我做中文播客 5 年,还是会剪播客剪到崩溃。

本文一步步带你——完全零基础——跑通整套流程:上传音频 → AI 转文字 → 自动找出口癖 → 生成剪辑软件标签。

(PS:被这个cover图笑死了...)


目录

  1. 准备材料
  2. 什么是 Google Colab?
  3. 注册并获取 OpenAI API Key
  4. 一键运行脚本(Colab 链接)
  5. 导入剪辑软件
  6. 常见问题 FAQ
  7. 下一步计划
  8. 全文总结

📦 准备材料

物品 说明
一段音频文件 支持 .m4a / .mp3 / .wav建议先用 1 ~ 3 分钟试跑
Google 账号 用来登录 Google Colab(免费云端 Jupyter 环境)
OpenAI API Key Whisper 转录接口用,费用 $0.006/音频分钟
(可选)Audacity / Audition 你日常用来剪播客的软件

🟢 什么是 Google Colab?

Google Colab = 在线版 Jupyter Notebook + 免费 GPU。
打开网页就能跑 Python 代码,文件保存在云端,不用本地装环境。

  • 网址:https://colab.research.google.com/
  • 步骤:
    1. 登录 Google 账号
    2. 打开下方提供的 Notebook 链接
    3. 点击顶部 Runtime → Run all,Colab 会按顺序执行每个代码块
  • Colab 会弹窗要求授权挂载 Google Drive,你可以点「取消」,所有文件会存到临时空间(断线后消失)。

🔑 注册并获取 OpenAI API Key

  1. 访问 https://platform.openai.com/signup ,用邮箱或 Google/GitHub 账号注册。
  2. 登录后,进入 左侧栏 → API Keys
  3. 点击 “+ Create new secret key”
  4. 复制生成的 Key(只会显示一次!),形式如 sk-xxxxxxxxxxxxxxxx
  5. 在 Colab 运行时,脚本会提示你粘贴这串 Key 并存入环境变量 OPENAI_API_KEY

💡 费用说明

  • Whisper 转录:$0.006 / 音频分钟
  • 10 分钟 ≈ $0.06;99 分钟 ≈ $0.50
  • 计费到你的 OpenAI 账户预付余额,官网可随时查看消耗。

🚀 一键运行脚本

点击下方链接直接打开 Notebook,可以生成一个copy,保存到你的google drive。跟着提示操作即可(无需改代码)
👉 打开 Colab Notebook

Notebook 主要步骤

步骤 自动做什么
0. 安装依赖 安装 openaiffmpeg-python 等库
1. 上传音频 浏览上传,或拖到 Colab 左侧 Files
2. 自动压缩 单声道 16 kHz,体积更小
3. 分片 拆成 ≤ 25 MB 的小文件,避免 API 限制
4. Whisper 转录 调 OpenAI 接口,拿到「每个词 + 时间戳」
5. 口癖标注 查找「嗯」「呃」「然后」「就是」并生成标签
6. 选择导出格式 输入 audacity / audition / both
7. 下载文件 Colab 自动弹出 download 按钮

🎬 导入剪辑软件

我录制了一个剪辑方式,可以点开youtube视频[观看](< https://youtu.be/f9IPWaR7HvI>)。

Audacity

  1. File → Import → Labels
  2. 选择 full_labels.txt
  3. 时间轴下方出现多条标签;带 [FILLER] 前缀的即口癖词

Adobe Audition

  1. Window → Markers 打开标记面板
  2. 面板菜单 → Import Markers...
  3. 选择 full_labels.csv
  4. 所有标记自动对齐到音频

❓ 常见问题 FAQ

问题 解答
上传大于 100 MB 的音频怎么办? 用脚本自带的 ffmpeg 压缩;或本地先 ffmpeg -i in.m4a -ac 1 -ar 16000 -b:a 128k out.m4a
我不会 Python,要改代码吗? 不用。Notebook 已封装输入提示,你只负责「上传文件→粘贴 API Key→选输出格式」。
API 太贵怎么办? 先用 1 分钟音频测试,确认效果再转长音频;99 分钟只要 $0.50,比人工听写省很多时间。
能不能同时删除口癖并导出成新音频? 目前版生成标签供手动审听。下一步会加入自动裁剪并导出。

📊 关于其他剪辑工具的一点想法

在做这个工具之前,我也尝试过市面上其他“语音转文字 + 自动剪辑”工具。这里简单分享一下体验:

🧟 Vocut(已关闭)

曾经是一个简洁的文字剪辑音频工具,操作界面像 Notion,用户可以删句子直接剪音频。当时我还挺推荐的,但现在网站已经下线,项目疑似停止开发。看来自动剪辑中文播客,目前还不是一门好生意

🇨🇳 喜马拉雅 Creator 工具

功能其实很全,支持剪辑、加封面、发布。但必须注册登录使用,而且内容必然经过平台审查。虽然我的内容都不敏感,但我希望尽可能远离审查制度,保有自由创作的空间。

🇺🇸 Descript(目前不支持中文)

我非常喜欢 Descript 的产品设计 —— 文字就是音频。只要能支持中文,我一定第一时间迁移过去! 但目前它只适用于英文播客,中文识别不够准,口癖无法识别,甚至连拼音都处理不好。

所以现在这个 PodEditor Lite 的思路就是:

  • 不绑定平台,自己可用、可掌控
  • 不受审查、不依赖某个编辑器
  • 在中文语境下也能工作得很好

等哪天 Descript 支持中文,我会开心地切过去。但在那之前,这就是我给自己的工具。


🗓️ 下一步计划

  • AI 剪辑建议:识别“信息量低”段落并自动加 [DELETE?] 标记
  • 文本驱动剪辑:在 Notebook 中直接删除文字 → 自动生成裁剪后音频
  • 播客 show notes 自动生成:调用 GPT‑4o / Claude,总结章节要点,生成 show notes / 章节段落

✨ 全文总结

PodEditor Lite 把“找口癖+打标记”这件事,做到 3 分钟上手、50 美分跑完 1.5 小时音频。
如果你是中文播客创作者,试一试,也许能把剪辑效率提升 3 ~ 5 倍。


作者:@Simona
项目名:PodEditor Lite
发布日期:2025 年 6 月