Extractor de audio de vídeo gratuito
Extrae la pista de audio de cualquier archivo de vídeo. Exporta como MP3, WAV, AAC u OGG.
Arrastra y suelta un archivo de vídeo aquí
o haz clic para explorar · MP4, WebM, MOV, AVI, MKV (máx. 2 GB)
Qué hace realmente la extracción de audio
Un archivo de vídeo es un contenedor (MP4, WebM, MOV, MKV, AVI, etc.) que aloja múltiples flujos elementales: típicamente un flujo de vídeo, uno o más flujos de audio, y a veces subtítulos o marcadores de capítulo. La extracción de audio es una operación de demuxing: el contenedor se abre, el flujo de audio se lee, y o bien se copia literalmente a un nuevo archivo de audio (stream copy, sin pérdidas y rápido) o se recodifica a un códec de audio diferente (transcodificación, más lenta con un pequeño costo de calidad). FFmpeg maneja ambos modos a través de sus banderas -c:a copy vs -c:a mp3/aac/opus. Esta herramienta elige el camino correcto automáticamente según tu formato objetivo.
El códec de audio dentro de un archivo de vídeo suele ser AAC (la mayoría de MP4s), Opus (archivos WebM y MKV más nuevos) o a veces MP3 (archivos más antiguos), AC-3 (estilo DVD) o PCM (sin comprimir en MOV/AVI). Cada uno es una forma diferente de representar los mismos datos de forma de onda; convertir entre ellos implica decodificar a muestras PCM en bruto y recodificar al códec objetivo. Los códecs con pérdidas (AAC, MP3, Opus, Vorbis) descartan frecuencias y patrones inaudibles para ahorrar espacio; los códecs sin pérdidas (FLAC, ALAC, PCM en bruto en WAV) preservan cada muestra. Si tu objetivo es el audio más limpio posible, extrae a FLAC o WAV. Si tu objetivo es un archivo portátil para escucha casual, MP3 a 192 kbps es el valor predeterminado universal.
El bitrate es la versión de audio del CRF: cuántos bits por segundo de audio se asignan. 320 kbps MP3 es «transparente» para la mayoría de los oyentes (indistinguible de la calidad CD en pruebas a ciegas). 192 kbps MP3 es el predeterminado para la mayoría de las bibliotecas musicales. 128 kbps es aceptable para voz/podcasts pero degrada audiblemente la música. 64 kbps es territorio solo voz. AAC y Opus logran la misma calidad percibida a bitrates más bajos (Opus es el más eficiente: 96 kbps Opus rivaliza con 192 kbps MP3 para música).
Cómo funciona esta herramienta por dentro
Mismo motor ffmpeg.wasm que las otras herramientas de vídeo: FFmpeg compilado a WebAssembly vía Emscripten, binario del lado del navegador de unos 30 MB, corre enteramente en la pestaña vía multihilo SharedArrayBuffer. Cuando sueltas un vídeo, el archivo se lee al sistema de archivos virtual de WebAssembly vía un lector en streaming.
El comando de extracción se parece a -i input.mp4 -vn -c:a libmp3lame -b:a 192k output.mp3 para MP3 a 192 kbps, donde -vn elimina el flujo de vídeo enteramente. Para WAV (sin pérdidas): -i input.mp4 -vn -c:a pcm_s16le output.wav. Para AAC: -c:a aac -b:a 192k output.m4a. Para OGG/Opus: -c:a libopus -b:a 128k output.opus. El decodificador de audio integrado en FFmpeg maneja cualquier códec que esté dentro de la fuente (AAC, Opus, MP3, AC-3, FLAC, etc.) y produce el códec objetivo elegido.
Cuando el códec de audio fuente y el códec objetivo coinciden (raro en esta herramienta porque los objetivos suelen ser MP3/WAV mientras que las fuentes suelen ser AAC), la herramienta puede hacer una copia de flujo (-c:a copy) en lugar de recodificar. La copia de flujo preserva los bits originales exactamente y termina en segundos incluso para vídeos de una hora. Para todos los demás casos la herramienta recodifica, lo cual está limitado por tu CPU. Los mensajes de progreso se transmiten desde stderr de FFmpeg y actualizan la barra de progreso en pantalla en tiempo real.
Breve historia de los códecs de audio y la extracción
- MP3 (MPEG-1 Layer III), 1993.El Instituto Fraunhofer publica la especificación MP3. El formato domina la escena de audio de consumo de finales de los 1990 y principios de los 2000: Napster (1999), iPod (2001), iTunes Music Store (2003). Las restricciones de patentes limitaron las implementaciones libres hasta 2017, cuando expiraron las últimas patentes de MP3.
- AAC (Advanced Audio Coding), 1997.MPEG-2 Part 7 y posteriormente MPEG-4 Part 3. Logra calidad similar a MP3 a bitrates más bajos. Apple adopta AAC para iTunes Music Store (2003) e iPhone (2007). AAC se convierte en el códec de audio predeterminado en contenedores MP4.
- FLAC (Free Lossless Audio Codec), 2001.Compresión sin pérdidas que reduce el tamaño de audio en bruto en aproximadamente la mitad. Se convierte en el estándar para audio de archivo, distribución audiófila y ripeo de CD. Código abierto y libre de regalías desde su inicio.
- Vorbis y contenedor OGG, principios de los 2000.La Fundación Xiph.Org publica Vorbis como alternativa libre de regalías a MP3, empaquetado en el contenedor OGG. Adoptado por algunos juegos (Quake III, Halo) y proyectos de código abierto, pero nunca alcanza la adopción de consumo mainstream.
- Opus, 2012.El IETF estandariza Opus, combinando elementos de SILK (voz, de Skype) y CELT (música). Se convierte en el códec dominante para comunicación en tiempo real de baja latencia (Discord, WebRTC, Zoom) y cada vez más para streaming (YouTube WebM, Spotify Web). A 96 kbps rivaliza con MP3 a 192 kbps.
- ffmpeg.wasm y extracción de audio en el navegador, 2019 a 2026.Jerome Wu publica el primer ffmpeg.wasm en 2019. Para 2024 la línea 4.x se estabiliza en unos 30 MB con multihilo SharedArrayBuffer. La extracción de audio del lado del navegador desde vídeo se vuelve práctica, reemplazando muchos servicios de extracción basados en la nube para uso personal.
Cómo funciona
- Sube tu vídeoArrastra y suelta o selecciona un archivo de vídeo desde tu dispositivo.
- Elige el formato de audioSelecciona MP3, WAV, AAC u OGG, y ajusta la tasa de bits según necesites.
- Extrae y descargaObtén tu archivo de audio extraído, listo para usar.
¿Por qué usar el extractor de audio de vídeo?
Ya sea que estés extrayendo la música de un clip de vídeo, aislando una locución para editar o capturando el audio de un podcast desde una grabación de vídeo, la extracción de audio es una tarea común. Nuestra herramienta basada en navegador separa la pista de audio de tus archivos de vídeo sin pérdida de calidad, directamente en tu dispositivo. No se requieren cargas y tus archivos permanecen privados.
Características
- Múltiples formatos de audioExporta como MP3, WAV, AAC u OGG para máxima compatibilidad.
- Control de tasa de bitsElige la calidad de audio desde 64 kbps hasta 320 kbps.
- Recorte de audioExtrae solo la sección de audio que necesitas.
- Canal y frecuencia de muestreoPersonaliza la salida mono/estéreo y la frecuencia de muestreo.
- Privacidad primeroProcesamiento en el navegador, ningún vídeo sale de tu dispositivo.
Flujos de extracción del mundo real
- Sacar audio de una grabación de podcast en vídeo.Muchos podcasts graban vídeo y audio simultáneamente (Riverside, Zencastr, incluso Zoom). Extraer la pista de audio te da el MP3 listo para podcast para subir a la plataforma de alojamiento. Para contenido solo de voz, 128 kbps mono MP3 es suficiente; para podcasts con mucha música, 192 a 256 kbps estéreo.
- Guardar audio de conferencias para escucha sin conexión.Las conferencias grabadas, charlas o webinars suelen tener mucho más vídeo del que necesitas (las diapositivas apenas cambian). Extraer solo el audio recorta dramáticamente el tamaño del archivo (un vídeo de 1 GB de una hora se convierte en un MP3 de 30 MB) y te permite escuchar durante un trayecto o entrenamiento sin el consumo de vídeo.
- Extraer música de un vídeo musical.A veces la única versión de una canción que tienes está en un vídeo musical. Extraer a MP3 de alto bitrate (256 a 320 kbps) o FLAC sin pérdidas te da un archivo de audio reproducible para tu biblioteca musical. Asegúrate de tener los derechos o que sea solo para uso personal.
- Guardar pistas de locución o narración.Si grabaste un vídeo tutorial con una locución de alta calidad y quieres reutilizar solo el audio (para un podcast, audiolibro u otro vídeo), la extracción te da el archivo de audio independiente para mezclar o remasterizar por separado.
- Pista de audio para doblaje o subtitulado.Los traductores y estudios de doblaje a menudo trabajan desde audio extraído en lugar de vídeo completo, especialmente cuando el ancho de banda o el almacenamiento importan. Extraer a WAV sin pérdidas da la fuente más limpia posible para el flujo de traducción/doblaje.
- Preprocesamiento para servicios de transcripción.La mayoría de los servicios de transcripción automatizada (Whisper, Otter, Rev) aceptan subidas de audio más rápido que subidas de vídeo. Extraer a MP3 antes de subir ahorra tiempo y ancho de banda. Las entradas solo de audio también tienden a transcribirse más rápido que vídeo en el mismo servicio porque no se necesita decodificación de vídeo del lado del servidor.
Trampas comunes y qué significan
- La recodificación con pérdidas a con pérdidas añade pérdida de calidad.Extraer AAC de un MP4 a MP3 significa transcodificar de AAC con pérdidas a MP3 con pérdidas, lo cual añade otra generación de ruido de cuantización. El resultado suele ser indistinguible pero ligeramente degradado. Para preservación pura, extrae a FLAC o WAV (sin pérdidas) y convierte a MP3 más tarde si es necesario.
- Un bitrate más alto que el de la fuente no ayuda.Si el audio del vídeo está codificado a 128 kbps AAC, extraer a 320 kbps MP3 no recupera detalle que la fuente no tenía. Solo infla el archivo. Iguala el bitrate de la fuente o sube ligeramente si planeas más procesamiento; subir dramáticamente es espacio desperdiciado.
- Los vídeos silenciosos no tienen audio para extraer.Las grabaciones de pantalla sin micrófono, los vídeos timelapse, las imágenes de drones grabadas en condiciones aislantes de ruido: estas pueden no contener ningún flujo de audio, o un flujo de silencio puro. La herramienta detecta los casos sin audio y te notifica; para flujos de silencio puro, el archivo extraído será técnicamente válido pero inaudible.
- Las pistas surround multicanal se mezclan a estéreo.Algunos vídeos (rips de Blu-ray, grabaciones de conferencias 5.1) tienen audio surround multicanal. Extraer a MP3 o AAC normalmente mezcla a estéreo, perdiendo la separación espacial. Para preservar canales, extrae a FLAC o AAC multicanal; MP3 estándar no tiene soporte multicanal nativo.
- Las etiquetas ID3 no vienen gratis.Los archivos de vídeo no llevan metadatos al estilo ID3 (título, artista, álbum, portada). Los MP3 extraídos salen con etiquetas vacías. Si necesitas etiquetas rellenadas, usa una herramienta de escritorio como Mp3tag o MusicBrainz Picard después de la extracción para añadir títulos, artistas y portadas.
- El vídeo protegido por DRM no está soportado.Las descargas de Netflix, los archivos de Apple TV+ y otros vídeos protegidos por DRM no pueden ser extraídos por esta herramienta (ni por ninguna herramienta de consumo). El audio está cifrado en el contenedor. La extracción solo funciona en archivos sin cifrar que tú poseas.
Privacidad: tu vídeo nunca sale de tu dispositivo
Los servicios de vídeo a audio en la nube (Online Audio Converter, Audio Extractor, Convertio, docenas más) todos suben tu vídeo completo, ejecutan FFmpeg en su hardware y envían de vuelta el audio extraído. Para un vídeo de móvil de 200 MB son 200 MB de subida más 10 a 50 MB de bajada a través de su infraestructura. El contenido de audio incluye comúnmente voces de familiares o compañeros, conversaciones de reuniones, música privada, narración de temas sensibles. La mayoría de operadores publican políticas de privacidad comprometiéndose a borrar las subidas en 1 a 24 horas y cifrar en tránsito, y los principales tienen certificaciones ISO/IEC 27001. Tienen razones comerciales fuertes para honrar esas políticas. Pero «borrado en una hora» no es «nunca visto». Durante esa ventana el archivo está en infraestructura del operador, accesible a cualquier proceso o persona con los permisos correctos, visible en registros y copias de seguridad según la política de retención del operador.
Esta herramienta nunca sube nada. El pipeline completo (selección de archivo, decodificación vía lectores nativos del navegador, extracción vía ffmpeg.wasm WebAssembly, descarga vía la API blob del navegador) corre dentro de tu pestaña del navegador. Sin subidas, sin peticiones de red llevando datos de vídeo, sin entradas de registro. Puedes verificarlo abriendo las herramientas de desarrollador del navegador en la pestaña Red antes de extraer: ninguna petición sale con contenido de vídeo. Solo la carga inicial de la página y la descarga única de unos 30 MB de ffmpeg.wasm (cacheada para visitas posteriores) tocan la red. Pon el navegador en modo avión después de cargar la página y el extractor sigue funcionando con archivos locales.
Cuándo otra herramienta es la elección correcta
- Archivos de más de 2 GB.Los límites de memoria del navegador se vuelven un muro por encima de unos 2 GB. Usa FFmpeg CLI de escritorio:
ffmpeg -i big_video.mkv -vn -c:a copy big_audio.aacfunciona en segundos en cualquier tamaño de archivo porque transmite desde disco y usa copia de flujo cuando los códecs coinciden. - Extracción de audio multipista.Algunos vídeos tienen múltiples pistas de audio (comentario del director, idiomas de doblaje alternativos, variantes de narración). FFmpeg CLI con
-map 0:a:Nselecciona cada pista explícitamente. Las herramientas del navegador típicamente extraen solo la pista de audio por defecto. - Extracción por lotes en muchos archivos.Un script de shell con FFmpeg CLI procesa una carpeta en un comando:
for f in *.mp4; do ffmpeg -i "$f" -vn -c:a libmp3lame -b:a 192k "${f%.mp4}.mp3"; done. Mucho más rápido que ejecutar una herramienta de navegador 100 veces manualmente. - Flujo de etiquetas/metadatos ID3 intenso.Si necesitas adjuntar etiquetas ID3 apropiadas, portadas, letras y marcadores de capítulo a MP3 extraídos, usa Mp3tag (Windows) o MusicBrainz Picard (multiplataforma) después de la extracción. Estos tienen editores de metadatos ricos que las herramientas de navegador no tienen.
Preguntas frecuentes
¿La calidad de audio coincidirá con el vídeo original?
Sí, la extracción preserva la calidad de audio original. También puedes elegir una tasa de bits más alta para conservar la mejor fidelidad posible.
¿Qué sucede si mi vídeo no tiene pista de audio?
La herramienta detectará la ausencia de audio y te lo informará. Solo se pueden procesar archivos de vídeo con pistas de audio.
¿Puedo extraer audio de vídeos de YouTube?
Primero necesitas descargar el archivo de vídeo en tu dispositivo. Esta herramienta funciona con archivos de vídeo locales, no directamente desde enlaces en línea.
Otras preguntas frecuentes
¿Cuál es la diferencia entre MP3, AAC, OGG y WAV?
MP3 (1993) es el formato con pérdidas universal, se reproduce en todas partes. AAC (1997) es más eficiente que MP3 a la misma calidad, predeterminado en dispositivos Apple. OGG/Vorbis (principios de los 2000) es la alternativa libre de regalías abierta; Opus (2012) es su sucesor moderno y el códec con pérdidas más eficiente para voz y música. WAV es PCM sin comprimir (archivos enormes pero sin pérdidas). FLAC es compresión sin pérdidas (aproximadamente la mitad del tamaño de WAV sin pérdida de calidad). Para compartir: MP3 o AAC. Para archivar: FLAC. Para editar: WAV.
¿Qué bitrate debería elegir?
Para música: 192 a 320 kbps MP3 o AAC (320 es transparente para la mayoría de oyentes; 192 es el predeterminado de hecho de la biblioteca). Para voz/podcasts: 64 a 128 kbps mono es suficiente (archivos más pequeños, sin pérdida de calidad para el habla). Para archivar: no elijas un bitrate, usa sin pérdidas (FLAC o WAV). Elegir un bitrate más alto que el bitrate de audio fuente no ayuda; iguala o sube ligeramente solo.
¿La extracción será sin pérdidas o con pérdidas?
Depende del formato objetivo. Extraer a WAV o FLAC es sin pérdidas: cada muestra de la fuente decodificada se preserva. Extraer a MP3, AAC, OGG u Opus es con pérdidas: el codificador descarta algún detalle inaudible para ahorrar espacio. Si el audio fuente ya era con pérdidas (la mayoría de MP4s tienen AAC dentro), incluso una extracción sin pérdidas es una «copia sin pérdidas de fuente con pérdidas», no una reproducción perfecta de la grabación original.
¿Por qué la extracción a veces es casi instantánea y a veces lenta?
Si el códec de audio fuente coincide con el objetivo (raro en esta herramienta porque los objetivos suelen ser MP3/WAV mientras que las fuentes suelen ser AAC), la herramienta puede hacer una copia de flujo que solo reescribe el contenedor sin recodificar. La copia de flujo termina en segundos para cualquier tamaño de archivo. La recodificación está limitada por tu CPU y toma tiempo proporcional a la duración del audio: 1 a 5x tiempo real para MP3/AAC en un laptop típico.
¿Hay un equivalente de escritorio o línea de comandos?
Sí. FFmpeg CLI: ffmpeg -i input.mp4 -vn -c:a libmp3lame -b:a 192k output.mp3. Para copia de flujo: ffmpeg -i input.mp4 -vn -c:a copy output.m4a. VLC tiene un diálogo Convertir/Guardar que extrae audio a través de su FFmpeg incorporado. Audacity puede importar vídeo y exportar audio en cualquier formato. Todos producen una salida esencialmente idéntica a esta herramienta de navegador porque comparten los mismos códecs subyacentes.
¿Puedo extraer solo una porción del audio?
En esta herramienta, no directamente: la extracción procesa la pista de audio completa. Para extraer un segmento, usa primero un recortador de vídeo para cortar tu vídeo al rango deseado, luego extrae audio. O en FFmpeg CLI: ffmpeg -i input.mp4 -vn -ss 00:01:30 -to 00:03:45 -c:a libmp3lame -b:a 192k clip.mp3 extrae de 1:30 a 3:45.