免费视频转音频提取器
从任何视频文件中提取音频轨道。可导出为MP3、WAV、AAC或OGG格式。
将视频文件拖放到此处
或点击浏览 · MP4、WebM、MOV、AVI、MKV(最大2 GB)
音频提取究竟做了什么
视频文件是一个容器(MP4、WebM、MOV、MKV、AVI 等),持有多个基本流:通常是一个视频流、一个或多个音频流,有时还有字幕或章节标记。音频提取是一种解复用操作:打开容器,读取音频流,要么逐字复制到新的音频文件(流复制,无损且快速),要么重新编码到不同的音频编解码器(转码,速度较慢,质量代价小)。FFmpeg 通过 -c:a copy 与 -c:a mp3/aac/opus 等标志处理这两种模式。本工具根据您的目标格式自动选择正确路径。
视频文件内的音频编解码器通常是 AAC(大多数 MP4)、Opus(较新的 WebM 和 MKV 文件),有时是 MP3(较旧的文件)、AC-3(DVD 风格)或 PCM(MOV/AVI 中的未压缩)。每种都是表示相同波形数据的不同方式;在它们之间转换涉及解码为原始 PCM 样本并重新编码为目标编解码器。有损编解码器(AAC、MP3、Opus、Vorbis)丢弃听不见的频率和模式以节省空间;无损编解码器(FLAC、ALAC、WAV 中的原始 PCM)保留每一个样本。如果您的目标是尽可能干净的音频,请提取为 FLAC 或 WAV。如果您的目标是用于休闲收听的便携文件,192 kbps 的 MP3 是通用默认。
比特率是音频版的 CRF:每秒音频分配多少比特。320 kbps MP3 对大多数听众「透明」(盲测中与 CD 质量无法区分)。192 kbps MP3 是大多数音乐库的默认。128 kbps 对语音/播客可以接受但对音乐有可闻降级。64 kbps 是仅语音的领地。AAC 和 Opus 在更低比特率下达到相同的感知质量(Opus 是最高效的:96 kbps Opus 在音乐上可与 192 kbps MP3 媲美)。
本工具的工作原理
与其他视频工具相同的 ffmpeg.wasm 引擎:通过 Emscripten 编译为 WebAssembly 的 FFmpeg,约 30 MB 浏览器侧二进制,通过 SharedArrayBuffer 多线程完全在标签内运行。当您拖入视频时,文件通过流式读取器读入 WebAssembly 虚拟文件系统。
提取命令看起来像 -i input.mp4 -vn -c:a libmp3lame -b:a 192k output.mp3,用于 192 kbps 的 MP3,其中 -vn 完全丢弃视频流。对于 WAV(无损):-i input.mp4 -vn -c:a pcm_s16le output.wav。对于 AAC:-c:a aac -b:a 192k output.m4a。对于 OGG/Opus:-c:a libopus -b:a 128k output.opus。FFmpeg 内置的音频解码器处理源内的任何编解码器(AAC、Opus、MP3、AC-3、FLAC 等)并输出所选目标编解码器。
当源音频编解码器与目标编解码器匹配时(在本工具中很少见,因为目标通常是 MP3/WAV 而源通常是 AAC),工具可以做流复制(-c:a copy)而不是重新编码。流复制完全保留原始比特,即使对小时长视频也在几秒内完成。对所有其他情况工具重新编码,受您的 CPU 限制。进度消息从 FFmpeg 的 stderr 流出并实时更新屏幕上的进度条。
音频编解码器和提取的简史
- MP3(MPEG-1 Layer III),1993 年。Fraunhofer 研究所发布 MP3 规范。该格式主导 1990 年代末和 2000 年代初的消费音频领域:Napster(1999)、iPod(2001)、iTunes Music Store(2003)。专利限制直到 2017 年最后的 MP3 专利到期才允许免费实现。
- AAC(高级音频编码),1997 年。MPEG-2 Part 7 和后来的 MPEG-4 Part 3。以更低比特率达到与 MP3 相似的质量。Apple 为 iTunes Music Store(2003)和 iPhone(2007)采用 AAC。AAC 成为 MP4 容器中的默认音频编解码器。
- FLAC(免费无损音频编解码器),2001 年。无损压缩将原始音频大小减少约一半。成为归档音频、发烧友分发和 CD 翻录的标准。从一开始就是开源且免版税。
- Vorbis 和 OGG 容器,2000 年代初。Xiph.Org 基金会发布 Vorbis 作为 MP3 的免版税替代品,打包在 OGG 容器中。被一些游戏(Quake III、Halo)和开源项目采用,但从未达到主流消费者采用。
- Opus,2012 年。IETF 标准化 Opus,结合 SILK(来自 Skype 的语音)和 CELT(音乐)的元素。成为低延迟实时通信(Discord、WebRTC、Zoom)的主导编解码器,并越来越多用于流媒体(YouTube WebM、Spotify Web)。在 96 kbps 下它可与 192 kbps 的 MP3 媲美。
- ffmpeg.wasm 和浏览器音频提取,2019 至 2026 年。Jerome Wu 在 2019 年发布第一个 ffmpeg.wasm。到 2024 年 4.x 系列稳定在约 30 MB,支持 SharedArrayBuffer 多线程。来自视频的浏览器侧音频提取变得实用,替代许多基于云的提取服务用于个人用途。
工作原理
- 上传视频: 选择包含您要提取音频的任何视频文件(MP4、WebM、MOV、AVI)。
- 选择音频格式: 选择MP3、WAV、OGG或AAC作为输出格式,并设置音频质量/比特率。
- 提取并下载: 点击“提取音频”,处理完成后下载音频文件。
为什么使用视频转音频提取器?
从视频中提取音频是常见需求,从视频文件中提取音乐、从录制中获取配音音频、从视频采访中保存播客音频,或从游戏播放视频中提取解说。专用的音频软件或命令行工具对于这个简单任务来说是杀鸡用牛刀。这款基于浏览器的提取器可以从任何视频中提取音频轨道,并将其保存为独立的音频文件,无需安装任何软件。
功能特点
- 多种音频格式: 导出为MP3(通用)、WAV(无损)、OGG(开源)或AAC(苹果/移动端)。
- 比特率控制: 选择从64 kbps(语音/播客)到64 kbps(高质量音乐)的音频质量。
- 音频剪辑: 可选指定开始和结束时间,仅提取音频的一个片段。
- 声道和采样率: 针对专业音频用途的单声道/立体声和采样率高级选项。
- 隐私优先: 视频文件在您的浏览器中本地处理,从不上传到任何服务器。
真实世界的提取工作流
- 从视频播客录制中提取音频。许多播客同时录制视频和音频(Riverside、Zencastr,甚至 Zoom)。提取音频轨道为您提供准备好上传到播客托管平台的播客 MP3。对于纯语音内容,128 kbps 单声道 MP3 就足够;对于音乐丰富的播客,192 至 256 kbps 立体声。
- 保存讲座音频供离线收听。录制的讲座、会议演讲或网络研讨会经常包含远多于所需的视频(幻灯片几乎不变)。仅提取音频显著减小文件大小(1 小时的 1 GB 视频变成 30 MB MP3),让您可以在通勤或锻炼时收听而无视频消耗。
- 从音乐视频中提取音乐。有时您拥有的一首歌的唯一版本是在音乐视频中。提取到高比特率 MP3(256 至 320 kbps)或 FLAC 无损为您的音乐库提供可播放的音频文件。请确保您拥有权利或仅用于个人用途。
- 保存画外音或叙述轨道。如果您录制了带有高质量画外音的视频教程,并希望重新利用音频(用于播客、有声书或不同视频),提取为您提供独立的音频文件以单独混音或重新母带处理。
- 用于配音或字幕的音频轨道。翻译和配音工作室经常从提取的音频而不是完整视频开始工作,特别是在带宽或存储很重要时。提取到无损 WAV 为翻译/配音工作流提供尽可能干净的源。
- 为转录服务的预处理。大多数自动转录服务(Whisper、Otter、Rev)接受音频上传比视频上传更快。在上传前提取为 MP3 节省时间和带宽。仅音频输入往往比视频在同一服务上转录得更快,因为服务器端不需要视频解码。
常见陷阱及其含义
- 有损到有损的重新编码增加质量损失。从 MP4 提取 AAC 到 MP3 意味着从有损 AAC 转码到有损 MP3,这增加另一代量化噪声。结果通常难以区分但略有降级。对于纯粹的保留,请提取到 FLAC 或 WAV(无损),如有需要稍后转换为 MP3。
- 比特率高于源没有帮助。如果视频的音频以 128 kbps AAC 编码,提取到 320 kbps MP3 不会恢复源没有的细节。它只是膨胀文件。匹配源比特率,或者如果您计划进一步处理就稍微调高一点;显著调高是浪费空间。
- 静音视频没有音频可提取。没有麦克风的屏幕录制、延时视频、在隔噪条件下拍摄的无人机镜头:这些可能完全不包含音频流,或包含纯静音流。工具检测无音频情况并通知您;对于纯静音流,提取的文件在技术上有效但听不见。
- 多声道环绕轨道下混到立体声。一些视频(蓝光转录、5.1 会议录音)具有多声道环绕音频。提取到 MP3 或 AAC 通常下混到立体声,丢失空间分离。要保留通道,请提取到 FLAC 或多声道 AAC;标准 MP3 没有原生多声道支持。
- ID3 标签不是免费的。视频文件不携带 MP3 风格的 ID3 元数据(标题、艺术家、专辑、封面艺术)。提取的 MP3 出来时标签为空。如果您需要填充标签,请在提取后使用桌面工具如 Mp3tag 或 MusicBrainz Picard 添加标题、艺术家和封面艺术。
- DRM 保护的视频不受支持。Netflix 下载、Apple TV+ 文件和其他 DRM 保护视频无法被本工具(或任何消费工具)提取。音频在容器中被加密。提取仅适用于您拥有的未加密文件。
隐私:您的视频从不离开您的设备
云视频转音频服务(Online Audio Converter、Audio Extractor、Convertio 等数十个)都上传您的完整视频,在他们的硬件上运行 FFmpeg,并发回提取的音频。一段 200 MB 的手机视频通过他们的基础设施意味着 200 MB 上传加 10 至 50 MB 下载。音频内容常包含家人或同事的声音、会议的对话、私人音乐、敏感主题的叙述。大多数运营商发布隐私政策,承诺在 1 至 24 小时内删除上传并在传输中加密,大型运营商持有 ISO/IEC 27001 认证。他们有强烈的商业动机来履行这些政策。但「一小时内删除」不等于「从未被看见」。在那个窗口里文件就在运营商基础设施上,对任何拥有正确权限的进程或人员可访问,并按运营商保留政策出现在日志和备份中。
本工具从不上传任何内容。完整流水线(文件选择、通过浏览器原生读取器解码、通过 ffmpeg.wasm WebAssembly 提取、通过浏览器 blob API 下载)在您的浏览器标签内运行。没有上传,没有携带视频数据的网络请求,没有日志条目。您可以在提取前打开浏览器开发工具的「网络」标签来验证:没有任何带视频内容的请求离开。只有页面本身的初始加载和 ffmpeg.wasm 约 30 MB 的一次性下载(后续访问缓存)会触及网络。页面加载后把浏览器切到飞行模式,提取器仍能在本地文件上工作。
何时另一个工具才是正确选择
- 超过 2 GB 的文件。约 2 GB 以上浏览器内存限制成为墙。请使用桌面 FFmpeg CLI:
ffmpeg -i big_video.mkv -vn -c:a copy big_audio.aac在任何文件大小上几秒内工作,因为它从磁盘流式读取并在编解码器匹配时使用流复制。 - 多轨音频提取。一些视频有多个音频轨道(导演评论、备用配音语言、叙述变体)。带有
-map 0:a:N的 FFmpeg CLI 明确选择每个轨道。浏览器工具通常只提取默认音频轨道。 - 跨多个文件的批量提取。使用 FFmpeg CLI 的 shell 脚本在一个命令中处理一个文件夹:
for f in *.mp4; do ffmpeg -i "$f" -vn -c:a libmp3lame -b:a 192k "${f%.mp4}.mp3"; done。比手动运行浏览器工具 100 次快得多。 - 重度 ID3/元数据工作流。如果您需要将正确的 ID3 标签、封面艺术、歌词和章节标记附加到提取的 MP3,请在提取后使用 Mp3tag(Windows)或 MusicBrainz Picard(跨平台)。这些具有浏览器工具缺乏的丰富元数据编辑器。
常见问题
提取的音频质量会与视频匹配吗?
会的,如果您提取为无损格式(WAV)或使用与视频音频轨道相同的比特率。视频的音频已经编码,以更低的比特率重新编码会降低质量。为获得最佳效果,请选择WAV或最高比特率选项。
如果视频没有音频轨道怎么办?
如果视频没有音频轨道,工具会通知您。静音视频(如无麦克风的屏幕录制)不包含可提取的音频数据。
我可以从YouTube视频提取音频吗?
此工具适用于您设备中的视频文件。从YouTube视频下载或提取音频可能违反YouTube的服务条款。请使用您拥有或有权处理的文件。
其他常见问题
MP3、AAC、OGG 和 WAV 有什么区别?
MP3(1993)是通用有损格式,到处都能播放。AAC(1997)在相同质量下比 MP3 更高效,Apple 设备的默认。OGG/Vorbis(2000 年代初)是免版税开放替代品;Opus(2012)是其现代继承者,是用于语音和音乐的最高效有损编解码器。WAV 是未压缩 PCM(巨大文件但无损)。FLAC 是无损压缩(约 WAV 大小的一半,无质量损失)。用于分享:MP3 或 AAC。用于归档:FLAC。用于编辑:WAV。
我应该选择什么比特率?
对于音乐:192 至 320 kbps MP3 或 AAC(320 对大多数听众透明;192 是事实上的库默认)。对于语音/播客:64 至 128 kbps 单声道就够了(更小文件,对语音无质量损失)。对于归档:不要选比特率,使用无损(FLAC 或 WAV)。选择高于源音频比特率的比特率没有帮助;只匹配或稍微调高。
提取将是无损还是有损?
取决于目标格式。提取到 WAV 或 FLAC 是无损:解码源的每个样本都被保留。提取到 MP3、AAC、OGG 或 Opus 是有损:编码器丢弃一些听不见的细节以节省空间。如果源音频已经是有损的(大多数 MP4 内部是 AAC),即使是无损提取也是「有损源的无损副本」,而不是原始录音的完美再现。
为什么提取有时近乎即时,有时缓慢?
如果源音频编解码器与目标匹配(在本工具中很少见,因为目标通常是 MP3/WAV 而源通常是 AAC),工具可以做流复制,只重写容器而不重新编码。流复制对任何文件大小都在几秒内完成。重新编码受您的 CPU 限制,所需时间与音频时长成正比:典型笔电上 MP3/AAC 为 1 至 5 倍实时。
有桌面或命令行的等效工具吗?
有。FFmpeg CLI:ffmpeg -i input.mp4 -vn -c:a libmp3lame -b:a 192k output.mp3。对于流复制:ffmpeg -i input.mp4 -vn -c:a copy output.m4a。VLC 有一个通过其内置 FFmpeg 提取音频的转换/保存对话框。Audacity 可以导入视频并以任何格式导出音频。所有这些与本浏览器工具产生本质上相同的输出,因为它们共享相同的底层编解码器。
我可以只提取音频的一部分吗?
本工具中不能直接:提取处理完整的音频轨道。要提取片段,请先使用视频修剪器将视频切到所需范围,然后提取音频。或在 FFmpeg CLI 中:ffmpeg -i input.mp4 -vn -ss 00:01:30 -to 00:03:45 -c:a libmp3lame -b:a 192k clip.mp3 提取 1:30 到 3:45。