Trình trích xuất âm thanh từ video miễn phí

Trích xuất bản nhạc âm thanh từ bất kỳ tệp video nào. Xuất dưới dạng MP3, WAV, AAC hoặc OGG.

100% phía máy khách · tệp của bạn không bao giờ rời khỏi thiết bị

Kéo và thả tệp video vào đây

hoặc nhấp để duyệt · MP4, WebM, MOV, AVI, MKV (tối đa 2 GB)

Trích xuất âm thanh thực sự làm gì

Một tệp video là một container (MP4, WebM, MOV, MKV, AVI, v.v.) chứa nhiều luồng cơ bản: thường là một luồng video, một hoặc nhiều luồng âm thanh, và đôi khi có phụ đề hoặc đánh dấu chương. Trích xuất âm thanh là một thao tác demuxing: container được mở ra, luồng âm thanh được đọc ra, và được sao chép nguyên văn vào một tệp âm thanh mới (stream copy, không mất dữ liệu và nhanh) hoặc được mã hóa lại sang một codec âm thanh khác (transcode, chậm hơn với một chi phí chất lượng nhỏ). FFmpeg xử lý cả hai chế độ thông qua các cờ -c:a copy so với -c:a mp3/aac/opus. Công cụ này tự động chọn đường dẫn phù hợp dựa trên định dạng đích của bạn.

Codec âm thanh bên trong một tệp video thường là AAC (hầu hết các MP4), Opus (các tệp WebM và MKV mới hơn), hoặc đôi khi là MP3 (tệp cũ), AC-3 (kiểu DVD), hoặc PCM (không nén trong MOV/AVI). Mỗi loại là một cách khác nhau để biểu diễn cùng dữ liệu dạng sóng; chuyển đổi giữa chúng liên quan đến việc giải mã thành các mẫu PCM thô và mã hóa lại thành codec đích. Codec lossy (AAC, MP3, Opus, Vorbis) loại bỏ các tần số và mẫu không thể nghe được để tiết kiệm không gian; codec lossless (FLAC, ALAC, PCM thô trong WAV) bảo tồn mọi mẫu. Nếu mục tiêu của bạn là âm thanh sạch nhất có thể, hãy trích xuất sang FLAC hoặc WAV. Nếu mục tiêu của bạn là một tệp di động cho việc nghe thông thường, MP3 ở 192 kbps là mặc định phổ quát.

Bitrate là phiên bản âm thanh của CRF: bao nhiêu bit mỗi giây của âm thanh được phân bổ. 320 kbps MP3 là "trong suốt" với hầu hết người nghe (không thể phân biệt với chất lượng CD trong các bài kiểm tra mù). 192 kbps MP3 là mặc định cho hầu hết các thư viện âm nhạc. 128 kbps có thể chấp nhận được cho giọng nói/podcast nhưng làm xuống cấp âm nhạc một cách rõ ràng. 64 kbps là lãnh thổ chỉ-giọng-nói. AAC và Opus đạt được cùng chất lượng cảm nhận ở bitrate thấp hơn (Opus là hiệu quả nhất: 96 kbps Opus đối thủ với 192 kbps MP3 cho âm nhạc).

Cách công cụ này hoạt động bên trong

Cùng động cơ ffmpeg.wasm như các công cụ video khác: FFmpeg được biên dịch sang WebAssembly qua Emscripten, nhị phân phía trình duyệt ~30 MB, chạy hoàn toàn trong tab thông qua đa luồng SharedArrayBuffer. Khi bạn thả một video, tệp được đọc vào hệ thống tệp ảo WebAssembly thông qua trình đọc luồng.

Lệnh trích xuất trông như -i input.mp4 -vn -c:a libmp3lame -b:a 192k output.mp3 cho MP3 ở 192 kbps, trong đó -vn loại bỏ luồng video hoàn toàn. Đối với WAV (lossless): -i input.mp4 -vn -c:a pcm_s16le output.wav. Đối với AAC: -c:a aac -b:a 192k output.m4a. Đối với OGG/Opus: -c:a libopus -b:a 128k output.opus. Bộ giải mã âm thanh tích hợp trong FFmpeg xử lý bất kỳ codec nào bên trong nguồn (AAC, Opus, MP3, AC-3, FLAC, v.v.) và xuất ra codec đích đã chọn.

Khi codec âm thanh nguồn và codec đích khớp nhau (hiếm trong công cụ này vì các đích thường là MP3/WAV trong khi các nguồn thường là AAC), công cụ có thể thực hiện stream copy (-c:a copy) thay vì mã hóa lại. Stream copy giữ nguyên các bit ban đầu chính xác và hoàn thành trong vài giây ngay cả đối với video dài một giờ. Đối với tất cả các trường hợp khác, công cụ mã hóa lại, điều này bị giới hạn bởi CPU của bạn. Các thông điệp tiến trình truyền từ stderr của FFmpeg và cập nhật thanh tiến trình trên màn hình theo thời gian thực.

Lịch sử ngắn gọn về codec âm thanh và trích xuất

Cách hoạt động

  1. Tải lên video của bạn: Chọn bất kỳ tệp video nào (MP4, WebM, MOV, AVI) chứa âm thanh bạn muốn trích xuất.
  2. Chọn định dạng âm thanh: Chọn MP3, WAV, OGG hoặc AAC làm định dạng đầu ra và đặt chất lượng/tốc độ bit âm thanh.
  3. Trích xuất và tải xuống: Nhấp vào Trích xuất âm thanh và tải xuống tệp âm thanh khi quá trình xử lý hoàn tất.

Tại sao nên sử dụng Trình trích xuất âm thanh từ video?

Trích xuất âm thanh từ video là nhu cầu phổ biến, lấy nhạc từ tệp video, lấy âm thanh thuyết minh từ bản ghi, lưu âm thanh podcast từ cuộc phỏng vấn video, hoặc trích xuất lời bình luận từ video chơi game. Phần mềm âm thanh chuyên dụng hoặc công cụ dòng lệnh là quá mức cần thiết cho tác vụ đơn giản này. Trình trích xuất dựa trên trình duyệt này sẽ tách bản nhạc âm thanh từ bất kỳ video nào và lưu dưới dạng tệp âm thanh độc lập mà không cần cài đặt phần mềm.

Tính năng

Quy trình trích xuất trong thế giới thực

Các cạm bẫy phổ biến và ý nghĩa của chúng

Quyền riêng tư: video của bạn không bao giờ rời khỏi thiết bị của bạn

Các dịch vụ video-sang-âm-thanh đám mây (Online Audio Converter, Audio Extractor, Convertio, hàng tá khác) đều tải lên video đầy đủ của bạn, chạy FFmpeg trên phần cứng của họ, và gửi lại âm thanh đã trích xuất. Đối với video điện thoại 200 MB, đó là 200 MB lên cộng với 10 đến 50 MB xuống thông qua cơ sở hạ tầng của họ. Nội dung âm thanh thường bao gồm tiếng nói của gia đình hoặc đồng nghiệp, các cuộc trò chuyện từ các cuộc họp, âm nhạc riêng tư, tường thuật về các chủ đề nhạy cảm. Hầu hết các nhà điều hành đều công bố các chính sách quyền riêng tư cam kết xóa các bản tải lên trong 1 đến 24 giờ và mã hóa khi vận chuyển, và những nhà điều hành lớn có chứng nhận ISO/IEC 27001. Họ có lý do kinh doanh mạnh mẽ để tôn trọng các chính sách đó. Nhưng "xóa trong vòng một giờ" không phải là "không bao giờ được nhìn thấy". Trong cửa sổ đó, tệp nằm trên cơ sở hạ tầng của nhà điều hành, có thể truy cập bởi bất kỳ quy trình hoặc người nào có quyền phù hợp, hiển thị trong nhật ký và sao lưu theo chính sách lưu giữ của nhà điều hành.

Công cụ này không bao giờ tải lên bất cứ điều gì. Đường ống đầy đủ (chọn tệp, giải mã thông qua các trình đọc gốc của trình duyệt, trích xuất thông qua WebAssembly ffmpeg.wasm, tải xuống thông qua API blob của trình duyệt) chạy bên trong tab trình duyệt của bạn. Không có tải lên, không có yêu cầu mạng nào mang dữ liệu video, không có mục nhật ký. Bạn có thể xác minh bằng cách mở các công cụ dành cho nhà phát triển của trình duyệt trên tab Mạng trước khi trích xuất: không có yêu cầu nào rời đi với nội dung video. Chỉ có lần tải trang ban đầu và lần tải xuống ffmpeg.wasm khoảng 30 MB một lần (được lưu vào bộ nhớ đệm cho các lần truy cập tiếp theo) chạm vào mạng. Đặt trình duyệt ở chế độ máy bay sau khi tải trang và trình trích xuất vẫn hoạt động trên các tệp cục bộ.

Khi một công cụ khác là lựa chọn đúng

Câu hỏi thường gặp

Chất lượng âm thanh được trích xuất có khớp với video không?

Có, nếu bạn trích xuất sang định dạng không mất dữ liệu (WAV) hoặc ở cùng tốc độ bit với bản nhạc âm thanh của video. Âm thanh của video đã được mã hóa, mã hóa lại ở tốc độ bit thấp hơn sẽ giảm chất lượng. Để có kết quả tốt nhất, hãy chọn WAV hoặc tùy chọn tốc độ bit cao nhất.

Điều gì xảy ra nếu video không có bản nhạc âm thanh?

Nếu video không có bản nhạc âm thanh, công cụ sẽ thông báo cho bạn. Video câm (như bản ghi màn hình không có micrô) không chứa dữ liệu âm thanh để trích xuất.

Tôi có thể trích xuất âm thanh từ video YouTube không?

Công cụ này hoạt động với các tệp video từ thiết bị của bạn. Tải xuống hoặc trích xuất âm thanh từ video YouTube có thể vi phạm Điều khoản Dịch vụ của YouTube. Hãy sử dụng các tệp bạn sở hữu hoặc có quyền xử lý.

Các câu hỏi thường gặp khác

Sự khác biệt giữa MP3, AAC, OGG và WAV là gì?

MP3 (1993) là định dạng lossy phổ quát, phát ở mọi nơi. AAC (1997) hiệu quả hơn MP3 ở cùng chất lượng, mặc định trên các thiết bị Apple. OGG/Vorbis (đầu những năm 2000) là thay thế mở miễn phí bản quyền; Opus (2012) là người kế nhiệm hiện đại của nó và là codec lossy hiệu quả nhất cho giọng nói và âm nhạc. WAV là PCM không nén (các tệp khổng lồ nhưng lossless). FLAC là nén lossless (khoảng một nửa kích thước của WAV mà không mất chất lượng). Để chia sẻ: MP3 hoặc AAC. Để lưu trữ: FLAC. Để chỉnh sửa: WAV.

Tôi nên chọn bitrate nào?

Đối với âm nhạc: 192 đến 320 kbps MP3 hoặc AAC (320 trong suốt cho hầu hết người nghe; 192 là mặc định trên thực tế của thư viện). Đối với giọng nói/podcast: 64 đến 128 kbps mono là đủ (tệp nhỏ hơn, không mất chất lượng cho lời nói). Để lưu trữ: đừng chọn bitrate, sử dụng lossless (FLAC hoặc WAV). Chọn bitrate cao hơn bitrate âm thanh của nguồn không giúp ích; chỉ khớp hoặc tăng nhẹ.

Việc trích xuất sẽ là lossless hay lossy?

Phụ thuộc vào định dạng đích. Trích xuất sang WAV hoặc FLAC là lossless: mọi mẫu của nguồn được giải mã được bảo tồn. Trích xuất sang MP3, AAC, OGG, hoặc Opus là lossy: bộ mã hóa loại bỏ một số chi tiết không thể nghe được để tiết kiệm không gian. Nếu âm thanh nguồn đã là lossy (hầu hết các MP4 có AAC bên trong), ngay cả một trích xuất lossless cũng là "một bản sao lossless của nguồn lossy", không phải là một bản tái tạo hoàn hảo của bản ghi ban đầu.

Tại sao trích xuất đôi khi gần như tức thời và đôi khi chậm?

Nếu codec âm thanh nguồn khớp với đích (hiếm trong công cụ này vì các đích thường là MP3/WAV trong khi các nguồn thường là AAC), công cụ có thể thực hiện một stream copy chỉ ghi lại container mà không cần mã hóa lại. Stream copy hoàn thành trong vài giây cho bất kỳ kích thước tệp nào. Mã hóa lại bị giới hạn bởi CPU của bạn và mất thời gian tỷ lệ thuận với thời lượng âm thanh: 1 đến 5x thời gian thực cho MP3/AAC trên một máy tính xách tay điển hình.

Có một thiết bị tương đương trên máy tính để bàn hoặc dòng lệnh không?

Có. FFmpeg CLI: ffmpeg -i input.mp4 -vn -c:a libmp3lame -b:a 192k output.mp3. Đối với stream copy: ffmpeg -i input.mp4 -vn -c:a copy output.m4a. VLC có một hộp thoại Chuyển đổi/Lưu trích xuất âm thanh thông qua FFmpeg tích hợp sẵn của nó. Audacity có thể nhập video và xuất âm thanh ở bất kỳ định dạng nào. Tất cả tạo ra đầu ra về cơ bản giống hệt với công cụ trình duyệt này vì chúng chia sẻ cùng các codec cơ bản.

Tôi có thể trích xuất chỉ một phần của âm thanh không?

Trong công cụ này, không trực tiếp: việc trích xuất xử lý bản nhạc âm thanh đầy đủ. Để trích xuất một đoạn, hãy sử dụng một công cụ cắt video trước để cắt video của bạn theo phạm vi mong muốn, sau đó trích xuất âm thanh. Hoặc trong FFmpeg CLI: ffmpeg -i input.mp4 -vn -ss 00:01:30 -to 00:03:45 -c:a libmp3lame -b:a 192k clip.mp3 trích xuất từ 1:30 đến 3:45.

Công cụ liên quan

Trình cắt video

Trình chuyển đổi video

Trình cắt âm thanh

Trình nén video