What video formats are supported?

This tool supports MP4, WebM, MOV, AVI, and most other common video formats. Browser support varies, but MP4 (H.264) and WebM (VP8/VP9) work in all modern browsers.

Is there a file size or duration limit?

There is no hard limit since processing happens in your browser. However, very long videos or files over 500 MB may be slow. For best results, keep files under 200 MB.

免费视频转音频提取器

从任何视频文件中提取音频轨道。可导出为MP3、WAV、AAC或OGG格式。

您的文件永不离开您的设备

将视频文件拖放到此处

或点击浏览 · MP4、WebM、MOV、AVI、MKV（最大2 GB）

音频提取究竟做了什么

视频文件是一个容器（MP4、WebM、MOV、MKV、AVI 等），持有多个基本流：通常是一个视频流、一个或多个音频流，有时还有字幕或章节标记。音频提取是一种解复用操作：打开容器，读取音频流，要么逐字复制到新的音频文件（流复制，无损且快速），要么重新编码到不同的音频编解码器（转码，速度较慢，质量代价小）。FFmpeg 通过 -c:a copy 与 -c:a mp3/aac/opus 等标志处理这两种模式。本工具根据您的目标格式自动选择正确路径。

视频文件内的音频编解码器通常是 AAC（大多数 MP4）、Opus（较新的 WebM 和 MKV 文件），有时是 MP3（较旧的文件）、AC-3（DVD 风格）或 PCM（MOV/AVI 中的未压缩）。每种都是表示相同波形数据的不同方式；在它们之间转换涉及解码为原始 PCM 样本并重新编码为目标编解码器。有损编解码器（AAC、MP3、Opus、Vorbis）丢弃听不见的频率和模式以节省空间；无损编解码器（FLAC、ALAC、WAV 中的原始 PCM）保留每一个样本。如果您的目标是尽可能干净的音频，请提取为 FLAC 或 WAV。如果您的目标是用于休闲收听的便携文件，192 kbps 的 MP3 是通用默认。

比特率是音频版的 CRF：每秒音频分配多少比特。320 kbps MP3 对大多数听众「透明」（盲测中与 CD 质量无法区分）。192 kbps MP3 是大多数音乐库的默认。128 kbps 对语音/播客可以接受但对音乐有可闻降级。64 kbps 是仅语音的领地。AAC 和 Opus 在更低比特率下达到相同的感知质量（Opus 是最高效的：96 kbps Opus 在音乐上可与 192 kbps MP3 媲美）。

本工具的工作原理

与其他视频工具相同的 ffmpeg.wasm 引擎：通过 Emscripten 编译为 WebAssembly 的 FFmpeg，约 30 MB 浏览器侧二进制，通过 SharedArrayBuffer 多线程完全在标签内运行。当您拖入视频时，文件通过流式读取器读入 WebAssembly 虚拟文件系统。

提取命令看起来像 -i input.mp4 -vn -c:a libmp3lame -b:a 192k output.mp3，用于 192 kbps 的 MP3，其中 -vn 完全丢弃视频流。对于 WAV（无损）：-i input.mp4 -vn -c:a pcm_s16le output.wav。对于 AAC：-c:a aac -b:a 192k output.m4a。对于 OGG/Opus：-c:a libopus -b:a 128k output.opus。FFmpeg 内置的音频解码器处理源内的任何编解码器（AAC、Opus、MP3、AC-3、FLAC 等）并输出所选目标编解码器。

当源音频编解码器与目标编解码器匹配时（在本工具中很少见，因为目标通常是 MP3/WAV 而源通常是 AAC），工具可以做流复制（-c:a copy）而不是重新编码。流复制完全保留原始比特，即使对小时长视频也在几秒内完成。对所有其他情况工具重新编码，受您的 CPU 限制。进度消息从 FFmpeg 的 stderr 流出并实时更新屏幕上的进度条。

音频编解码器和提取的简史

MP3（MPEG-1 Layer III），1993 年。Fraunhofer 研究所发布 MP3 规范。该格式主导 1990 年代末和 2000 年代初的消费音频领域：Napster（1999）、iPod（2001）、iTunes Music Store（2003）。专利限制直到 2017 年最后的 MP3 专利到期才允许免费实现。
AAC（高级音频编码），1997 年。MPEG-2 Part 7 和后来的 MPEG-4 Part 3。以更低比特率达到与 MP3 相似的质量。Apple 为 iTunes Music Store（2003）和 iPhone（2007）采用 AAC。AAC 成为 MP4 容器中的默认音频编解码器。
FLAC（免费无损音频编解码器），2001 年。无损压缩将原始音频大小减少约一半。成为归档音频、发烧友分发和 CD 翻录的标准。从一开始就是开源且免版税。
Vorbis 和 OGG 容器，2000 年代初。Xiph.Org 基金会发布 Vorbis 作为 MP3 的免版税替代品，打包在 OGG 容器中。被一些游戏（Quake III、Halo）和开源项目采用，但从未达到主流消费者采用。
Opus，2012 年。IETF 标准化 Opus，结合 SILK（来自 Skype 的语音）和 CELT（音乐）的元素。成为低延迟实时通信（Discord、WebRTC、Zoom）的主导编解码器，并越来越多用于流媒体（YouTube WebM、Spotify Web）。在 96 kbps 下它可与 192 kbps 的 MP3 媲美。
ffmpeg.wasm 和浏览器音频提取，2019 至 2026 年。Jerome Wu 在 2019 年发布第一个 ffmpeg.wasm。到 2024 年 4.x 系列稳定在约 30 MB，支持 SharedArrayBuffer 多线程。来自视频的浏览器侧音频提取变得实用，替代许多基于云的提取服务用于个人用途。

工作原理

上传视频： 选择包含您要提取音频的任何视频文件（MP4、WebM、MOV、AVI）。
选择音频格式： 选择MP3、WAV、OGG或AAC作为输出格式，并设置音频质量/比特率。
提取并下载： 点击“提取音频”，处理完成后下载音频文件。

为什么使用视频转音频提取器？

从视频中提取音频是常见需求，从视频文件中提取音乐、从录制中获取配音音频、从视频采访中保存播客音频，或从游戏播放视频中提取解说。专用的音频软件或命令行工具对于这个简单任务来说是杀鸡用牛刀。这款基于浏览器的提取器可以从任何视频中提取音频轨道，并将其保存为独立的音频文件，无需安装任何软件。

功能特点

多种音频格式： 导出为MP3（通用）、WAV（无损）、OGG（开源）或AAC（苹果/移动端）。
比特率控制： 选择从64 kbps（语音/播客）到64 kbps（高质量音乐）的音频质量。
音频剪辑： 可选指定开始和结束时间，仅提取音频的一个片段。
声道和采样率： 针对专业音频用途的单声道/立体声和采样率高级选项。
隐私优先： 视频文件在您的浏览器中本地处理，从不上传到任何服务器。

真实世界的提取工作流

从视频播客录制中提取音频。许多播客同时录制视频和音频（Riverside、Zencastr，甚至 Zoom）。提取音频轨道为您提供准备好上传到播客托管平台的播客 MP3。对于纯语音内容，128 kbps 单声道 MP3 就足够；对于音乐丰富的播客，192 至 256 kbps 立体声。
保存讲座音频供离线收听。录制的讲座、会议演讲或网络研讨会经常包含远多于所需的视频（幻灯片几乎不变）。仅提取音频显著减小文件大小（1 小时的 1 GB 视频变成 30 MB MP3），让您可以在通勤或锻炼时收听而无视频消耗。
从音乐视频中提取音乐。有时您拥有的一首歌的唯一版本是在音乐视频中。提取到高比特率 MP3（256 至 320 kbps）或 FLAC 无损为您的音乐库提供可播放的音频文件。请确保您拥有权利或仅用于个人用途。
保存画外音或叙述轨道。如果您录制了带有高质量画外音的视频教程，并希望重新利用音频（用于播客、有声书或不同视频），提取为您提供独立的音频文件以单独混音或重新母带处理。
用于配音或字幕的音频轨道。翻译和配音工作室经常从提取的音频而不是完整视频开始工作，特别是在带宽或存储很重要时。提取到无损 WAV 为翻译/配音工作流提供尽可能干净的源。
为转录服务的预处理。大多数自动转录服务（Whisper、Otter、Rev）接受音频上传比视频上传更快。在上传前提取为 MP3 节省时间和带宽。仅音频输入往往比视频在同一服务上转录得更快，因为服务器端不需要视频解码。

常见陷阱及其含义

有损到有损的重新编码增加质量损失。从 MP4 提取 AAC 到 MP3 意味着从有损 AAC 转码到有损 MP3，这增加另一代量化噪声。结果通常难以区分但略有降级。对于纯粹的保留，请提取到 FLAC 或 WAV（无损），如有需要稍后转换为 MP3。
比特率高于源没有帮助。如果视频的音频以 128 kbps AAC 编码，提取到 320 kbps MP3 不会恢复源没有的细节。它只是膨胀文件。匹配源比特率，或者如果您计划进一步处理就稍微调高一点；显著调高是浪费空间。
静音视频没有音频可提取。没有麦克风的屏幕录制、延时视频、在隔噪条件下拍摄的无人机镜头：这些可能完全不包含音频流，或包含纯静音流。工具检测无音频情况并通知您；对于纯静音流，提取的文件在技术上有效但听不见。
多声道环绕轨道下混到立体声。一些视频（蓝光转录、5.1 会议录音）具有多声道环绕音频。提取到 MP3 或 AAC 通常下混到立体声，丢失空间分离。要保留通道，请提取到 FLAC 或多声道 AAC；标准 MP3 没有原生多声道支持。
ID3 标签不是免费的。视频文件不携带 MP3 风格的 ID3 元数据（标题、艺术家、专辑、封面艺术）。提取的 MP3 出来时标签为空。如果您需要填充标签，请在提取后使用桌面工具如 Mp3tag 或 MusicBrainz Picard 添加标题、艺术家和封面艺术。
DRM 保护的视频不受支持。Netflix 下载、Apple TV+ 文件和其他 DRM 保护视频无法被本工具（或任何消费工具）提取。音频在容器中被加密。提取仅适用于您拥有的未加密文件。

隐私：您的视频从不离开您的设备

云视频转音频服务（Online Audio Converter、Audio Extractor、Convertio 等数十个）都上传您的完整视频，在他们的硬件上运行 FFmpeg，并发回提取的音频。一段 200 MB 的手机视频通过他们的基础设施意味着 200 MB 上传加 10 至 50 MB 下载。音频内容常包含家人或同事的声音、会议的对话、私人音乐、敏感主题的叙述。大多数运营商发布隐私政策，承诺在 1 至 24 小时内删除上传并在传输中加密，大型运营商持有 ISO/IEC 27001 认证。他们有强烈的商业动机来履行这些政策。但「一小时内删除」不等于「从未被看见」。在那个窗口里文件就在运营商基础设施上，对任何拥有正确权限的进程或人员可访问，并按运营商保留政策出现在日志和备份中。

本工具从不上传任何内容。完整流水线（文件选择、通过浏览器原生读取器解码、通过 ffmpeg.wasm WebAssembly 提取、通过浏览器 blob API 下载）在您的浏览器标签内运行。没有上传，没有携带视频数据的网络请求，没有日志条目。您可以在提取前打开浏览器开发工具的「网络」标签来验证：没有任何带视频内容的请求离开。只有页面本身的初始加载和 ffmpeg.wasm 约 30 MB 的一次性下载（后续访问缓存）会触及网络。页面加载后把浏览器切到飞行模式，提取器仍能在本地文件上工作。

何时另一个工具才是正确选择

超过 2 GB 的文件。约 2 GB 以上浏览器内存限制成为墙。请使用桌面 FFmpeg CLI：ffmpeg -i big_video.mkv -vn -c:a copy big_audio.aac 在任何文件大小上几秒内工作，因为它从磁盘流式读取并在编解码器匹配时使用流复制。
多轨音频提取。一些视频有多个音频轨道（导演评论、备用配音语言、叙述变体）。带有 -map 0:a:N 的 FFmpeg CLI 明确选择每个轨道。浏览器工具通常只提取默认音频轨道。
跨多个文件的批量提取。使用 FFmpeg CLI 的 shell 脚本在一个命令中处理一个文件夹：for f in *.mp4; do ffmpeg -i "$f" -vn -c:a libmp3lame -b:a 192k "${f%.mp4}.mp3"; done。比手动运行浏览器工具 100 次快得多。
重度 ID3/元数据工作流。如果您需要将正确的 ID3 标签、封面艺术、歌词和章节标记附加到提取的 MP3，请在提取后使用 Mp3tag（Windows）或 MusicBrainz Picard（跨平台）。这些具有浏览器工具缺乏的丰富元数据编辑器。

常见问题

提取的音频质量会与视频匹配吗？

会的，如果您提取为无损格式（WAV）或使用与视频音频轨道相同的比特率。视频的音频已经编码，以更低的比特率重新编码会降低质量。为获得最佳效果，请选择WAV或最高比特率选项。

如果视频没有音频轨道怎么办？

如果视频没有音频轨道，工具会通知您。静音视频（如无麦克风的屏幕录制）不包含可提取的音频数据。

我可以从YouTube视频提取音频吗？

此工具适用于您设备中的视频文件。从YouTube视频下载或提取音频可能违反YouTube的服务条款。请使用您拥有或有权处理的文件。

其他常见问题

MP3、AAC、OGG 和 WAV 有什么区别？

MP3（1993）是通用有损格式，到处都能播放。AAC（1997）在相同质量下比 MP3 更高效，Apple 设备的默认。OGG/Vorbis（2000 年代初）是免版税开放替代品；Opus（2012）是其现代继承者，是用于语音和音乐的最高效有损编解码器。WAV 是未压缩 PCM（巨大文件但无损）。FLAC 是无损压缩（约 WAV 大小的一半，无质量损失）。用于分享：MP3 或 AAC。用于归档：FLAC。用于编辑：WAV。

我应该选择什么比特率？

对于音乐：192 至 320 kbps MP3 或 AAC（320 对大多数听众透明；192 是事实上的库默认）。对于语音/播客：64 至 128 kbps 单声道就够了（更小文件，对语音无质量损失）。对于归档：不要选比特率，使用无损（FLAC 或 WAV）。选择高于源音频比特率的比特率没有帮助；只匹配或稍微调高。

提取将是无损还是有损？

取决于目标格式。提取到 WAV 或 FLAC 是无损：解码源的每个样本都被保留。提取到 MP3、AAC、OGG 或 Opus 是有损：编码器丢弃一些听不见的细节以节省空间。如果源音频已经是有损的（大多数 MP4 内部是 AAC），即使是无损提取也是「有损源的无损副本」，而不是原始录音的完美再现。

为什么提取有时近乎即时，有时缓慢？

如果源音频编解码器与目标匹配（在本工具中很少见，因为目标通常是 MP3/WAV 而源通常是 AAC），工具可以做流复制，只重写容器而不重新编码。流复制对任何文件大小都在几秒内完成。重新编码受您的 CPU 限制，所需时间与音频时长成正比：典型笔电上 MP3/AAC 为 1 至 5 倍实时。

有桌面或命令行的等效工具吗？

有。FFmpeg CLI：ffmpeg -i input.mp4 -vn -c:a libmp3lame -b:a 192k output.mp3。对于流复制：ffmpeg -i input.mp4 -vn -c:a copy output.m4a。VLC 有一个通过其内置 FFmpeg 提取音频的转换/保存对话框。Audacity 可以导入视频并以任何格式导出音频。所有这些与本浏览器工具产生本质上相同的输出，因为它们共享相同的底层编解码器。

我可以只提取音频的一部分吗？

本工具中不能直接：提取处理完整的音频轨道。要提取片段，请先使用视频修剪器将视频切到所需范围，然后提取音频。或在 FFmpeg CLI 中：ffmpeg -i input.mp4 -vn -ss 00:01:30 -to 00:03:45 -c:a libmp3lame -b:a 192k clip.mp3 提取 1:30 到 3:45。