Estrattore audio video gratuito
Estrai la traccia audio da qualsiasi file video. Esporta come MP3, WAV, AAC o OGG.
Trascina e rilascia un file video qui
o clicca per sfogliare · MP4, WebM, MOV, AVI, MKV (max 2 GB)
Cosa fa davvero l'estrazione dell'audio
Un file video è un contenitore (MP4, WebM, MOV, MKV, AVI, ecc.) che contiene più stream elementari: tipicamente uno stream video, uno o più stream audio, e a volte sottotitoli o marcatori di capitolo. L'estrazione dell'audio è un'operazione di demultiplexing: il contenitore viene aperto, lo stream audio viene letto e o copiato verbatim in un nuovo file audio (stream copy, lossless e veloce) o ricodificato in un codec audio diverso (transcoding, più lento con un piccolo costo di qualità). FFmpeg gestisce entrambe le modalità tramite i suoi flag -c:a copy contro -c:a mp3/aac/opus. Questo strumento sceglie il percorso giusto automaticamente in base al formato di destinazione.
Il codec audio dentro un file video è solitamente AAC (la maggior parte degli MP4), Opus (file WebM e MKV più recenti) o a volte MP3 (file più vecchi), AC-3 (stile DVD) o PCM (non compresso in MOV/AVI). Ognuno è un modo diverso di rappresentare gli stessi dati della forma d'onda; convertire tra loro comporta decodificare in campioni PCM grezzi e ricodificare nel codec di destinazione. I codec lossy (AAC, MP3, Opus, Vorbis) scartano frequenze e pattern inudibili per risparmiare spazio; i codec lossless (FLAC, ALAC, PCM grezzo in WAV) preservano ogni campione. Se il tuo obiettivo è l'audio più pulito possibile, estrai in FLAC o WAV. Se il tuo obiettivo è un file portatile per ascolto casuale, MP3 a 192 kbps è il default universale.
Il bitrate è la versione audio di CRF: quanti bit al secondo di audio sono assegnati. 320 kbps MP3 è "trasparente" per la maggior parte degli ascoltatori (indistinguibile dalla qualità CD nei test ciechi). 192 kbps MP3 è il default per la maggior parte delle librerie musicali. 128 kbps è accettabile per voce/podcast ma degrada udibilmente la musica. 64 kbps è territorio solo voce. AAC e Opus raggiungono la stessa qualità percepita a bitrate più bassi (Opus è il più efficiente: 96 kbps Opus rivaleggia con 192 kbps MP3 per la musica).
Come funziona questo strumento sotto il cofano
Stesso motore ffmpeg.wasm degli altri strumenti video: FFmpeg compilato in WebAssembly tramite Emscripten, binario lato browser di circa 30 MB, gira interamente nella scheda tramite multi threading SharedArrayBuffer. Quando rilasci un video, il file viene letto nel filesystem virtuale WebAssembly tramite un lettore di stream.
Il comando di estrazione sembra -i input.mp4 -vn -c:a libmp3lame -b:a 192k output.mp3 per MP3 a 192 kbps, dove -vn elimina lo stream video completamente. Per WAV (lossless): -i input.mp4 -vn -c:a pcm_s16le output.wav. Per AAC: -c:a aac -b:a 192k output.m4a. Per OGG/Opus: -c:a libopus -b:a 128k output.opus. Il decoder audio integrato in FFmpeg gestisce qualsiasi codec sia dentro la sorgente (AAC, Opus, MP3, AC-3, FLAC, ecc.) e produce il codec di destinazione scelto.
Quando il codec audio sorgente e il codec di destinazione corrispondono (raro in questo strumento perché i target sono solitamente MP3/WAV mentre le sorgenti sono solitamente AAC), lo strumento può fare uno stream copy (-c:a copy) invece di ricodificare. Lo stream copy preserva i bit originali esattamente e termina in pochi secondi anche per video di un'ora. In tutti gli altri casi lo strumento ricodifica, che è vincolato dalla tua CPU. I messaggi di avanzamento fluiscono dallo stderr di FFmpeg e aggiornano la barra di avanzamento sullo schermo in tempo reale.
Breve storia dei codec audio e dell'estrazione
- MP3 (MPEG-1 Layer III), 1993.Il Fraunhofer Institute pubblica la specifica MP3. Il formato domina la scena audio consumer della fine degli anni 1990 e dell'inizio degli anni 2000: Napster (1999), iPod (2001), iTunes Music Store (2003). Le restrizioni dei brevetti hanno limitato le implementazioni gratuite fino al 2017, quando sono scaduti gli ultimi brevetti MP3.
- AAC (Advanced Audio Coding), 1997.MPEG-2 Parte 7 e successivamente MPEG-4 Parte 3. Raggiunge qualità simile a MP3 a bitrate inferiori. Apple adotta AAC per iTunes Music Store (2003) e iPhone (2007). AAC diventa il codec audio predefinito nei contenitori MP4.
- FLAC (Free Lossless Audio Codec), 2001.Compressione lossless che taglia la dimensione audio grezza di circa la metà. Diventa lo standard per l'audio d'archivio, la distribuzione audiophile e il ripping di CD. Open source e royalty free fin dall'inizio.
- Vorbis e contenitore OGG, primi anni 2000.Xiph.Org Foundation pubblica Vorbis come alternativa royalty free a MP3, confezionato nel contenitore OGG. Adottato da alcuni giochi (Quake III, Halo) e progetti open source, ma non raggiunge mai l'adozione mainstream dei consumatori.
- Opus, 2012.L'IETF standardizza Opus, combinando elementi di SILK (voce, da Skype) e CELT (musica). Diventa il codec dominante per comunicazione in tempo reale a bassa latenza (Discord, WebRTC, Zoom) e sempre più per streaming (YouTube WebM, Spotify Web). A 96 kbps rivaleggia con MP3 a 192 kbps.
- ffmpeg.wasm ed estrazione audio nel browser, dal 2019 al 2026.Jerome Wu pubblica il primo ffmpeg.wasm nel 2019. Entro il 2024 la linea 4.x si stabilizza a circa 30 MB con multi threading SharedArrayBuffer. L'estrazione audio lato browser dal video diventa pratica, sostituendo molti servizi di estrazione basati su cloud per uso personale.
Come funziona
- Carica il tuo videoTrascina e rilascia o seleziona un file video dal tuo dispositivo.
- Scegli il formato audioSeleziona MP3, WAV, AAC o OGG e regola il bitrate secondo necessità.
- Estrai e scaricaOttieni il tuo file audio estratto, pronto per l'uso.
Perché usare l'estrattore audio video?
Che tu stia estraendo la musica da un videoclip, isolando una voce fuori campo per il montaggio o catturando l'audio di un podcast da una registrazione video, l'estrazione audio è un'attività comune. Il nostro strumento basato su browser separa la traccia audio dai tuoi file video senza perdita di qualità, direttamente sul tuo dispositivo. Nessun caricamento richiesto e i tuoi file rimangono privati.
Caratteristiche
- Più formati audioEsporta come MP3, WAV, AAC o OGG per la massima compatibilità.
- Controllo del bitrateScegli la qualità audio da 64 kbps a 320 kbps.
- Taglio audioEstrai solo la sezione audio di cui hai bisogno.
- Canale e frequenza di campionamentoPersonalizza l'uscita mono/stereo e la frequenza di campionamento.
- Privacy prima di tuttoElaborazione nel browser, nessun video lascia il tuo dispositivo.
Flussi di estrazione nel mondo reale
- Estrarre audio da una registrazione di podcast video.Molti podcast registrano video e audio simultaneamente (Riverside, Zencastr, anche Zoom). Estrarre la traccia audio ti dà l'MP3 pronto per il podcast da caricare sulla piattaforma di hosting del podcast. Per contenuti solo voce, 128 kbps mono MP3 è abbondante; per podcast ricchi di musica, 192 a 256 kbps stereo.
- Salvare l'audio della lezione per l'ascolto offline.Lezioni registrate, conferenze o webinar spesso hanno molto più video di quanto sia necessario (le slide cambiano poco). Estrarre solo l'audio taglia drasticamente la dimensione del file (un video di un'ora da 1 GB diventa un MP3 da 30 MB) e ti permette di ascoltare durante il tragitto o un allenamento senza il consumo del video.
- Estrarre musica da un video musicale.A volte l'unica versione di una canzone che hai è in un video musicale. Estrarre in MP3 ad alto bitrate (256 a 320 kbps) o FLAC per lossless ti dà un file audio riproducibile per la tua libreria musicale. Assicurati di avere i diritti o che sia solo per uso personale.
- Salvare tracce di voice over o narrazione.Se hai registrato un tutorial video con un voice over di alta qualità e vuoi riutilizzare solo l'audio (per un podcast, un audiolibro o un video diverso), l'estrazione ti dà il file audio standalone da mixare o rimasterizzare separatamente.
- Traccia audio per doppiaggio o sottotitolazione.Traduttori e studi di doppiaggio spesso lavorano dall'audio estratto piuttosto che dal video completo, specialmente quando la larghezza di banda o lo spazio contano. Estrarre in WAV lossless dà la sorgente più pulita possibile per il flusso di traduzione/doppiaggio.
- Pre elaborazione per servizi di trascrizione.La maggior parte dei servizi di trascrizione automatica (Whisper, Otter, Rev) accetta caricamenti audio più velocemente dei caricamenti video. Estrarre in MP3 prima di caricare risparmia tempo e larghezza di banda. Gli input solo audio tendono anche a essere trascritti più velocemente del video sullo stesso servizio perché non è necessaria la decodifica video lato server.
Insidie comuni e cosa significano
- La ricodifica da lossy a lossy aggiunge perdita di qualità.Estrarre AAC da un MP4 a MP3 significa transcodificare da AAC lossy a MP3 lossy, che aggiunge un'altra generazione di rumore di quantizzazione. Il risultato è spesso indistinguibile ma leggermente degradato. Per pura conservazione, estrai in FLAC o WAV (lossless) e converti in MP3 più tardi se necessario.
- Un bitrate più alto della sorgente non aiuta.Se l'audio del video è codificato a 128 kbps AAC, estrarre in MP3 a 320 kbps non recupera dettagli che la sorgente non aveva. Gonfia solo il file. Abbina il bitrate della sorgente o sali leggermente se prevedi di fare più elaborazione; andare drammaticamente più in alto è spazio sprecato.
- I video silenziosi non hanno audio da estrarre.Registrazioni dello schermo senza microfono, video time lapse, riprese con droni in condizioni di isolamento dal rumore: questi possono contenere nessuno stream audio affatto, o uno stream di puro silenzio. Lo strumento rileva i casi senza audio e ti notifica; per gli stream di puro silenzio, il file estratto sarà tecnicamente valido ma inudibile.
- Le tracce surround multi canale si downmixano in stereo.Alcuni video (rip Blu-ray, registrazioni di conferenze 5.1) hanno audio surround multi canale. Estrarre in MP3 o AAC tipicamente downmixa in stereo, perdendo la separazione spaziale. Per preservare i canali, estrai in FLAC o AAC multi canale; MP3 standard non ha supporto multi canale nativo.
- I tag ID3 non sono gratuiti.I file video non portano metadati in stile ID3 MP3 (titolo, artista, album, copertina). Gli MP3 estratti escono con tag vuoti. Se hai bisogno che i tag siano riempiti, usa uno strumento desktop come Mp3tag o MusicBrainz Picard dopo l'estrazione per aggiungere titoli, artisti e copertine.
- I video protetti da DRM non sono supportati.Download Netflix, file Apple TV+ e altri video protetti da DRM non possono essere estratti da questo strumento (o da qualsiasi strumento consumer). L'audio è crittografato nel contenitore. L'estrazione funziona solo su file non crittografati che possiedi.
Privacy: il tuo video non lascia mai il tuo dispositivo
I servizi cloud di video-to-audio (Online Audio Converter, Audio Extractor, Convertio, dozzine altri) caricano tutti il tuo video completo, eseguono FFmpeg sul loro hardware e rimandano l'audio estratto. Per un video del telefono di 200 MB sono 200 MB in su più 10 a 50 MB in giù attraverso la loro infrastruttura. Il contenuto audio comunemente include voci di familiari o colleghi, conversazioni di riunioni, musica privata, narrazione di argomenti sensibili. La maggior parte degli operatori pubblica politiche sulla privacy impegnandosi a eliminare i caricamenti entro 1 a 24 ore e a crittografare in transito, e quelli importanti detengono certificazioni ISO/IEC 27001. Hanno forti ragioni commerciali per onorare quelle politiche. Ma "eliminato entro un'ora" non è "mai visto". Durante quella finestra il file si trova sull'infrastruttura dell'operatore, accessibile a qualsiasi processo o persona con i permessi giusti, visibile nei log e nei backup secondo la politica di ritenzione dell'operatore.
Questo strumento non carica mai nulla. L'intera pipeline (selezione del file, decodifica tramite lettori nativi del browser, estrazione tramite WebAssembly ffmpeg.wasm, download tramite l'API blob del browser) gira all'interno della scheda del tuo browser. Nessun caricamento, nessuna richiesta di rete che porta dati video, nessuna voce di log. Puoi verificare aprendo gli strumenti per sviluppatori del browser sulla scheda Rete prima di estrarre: nessuna richiesta esce con contenuti video. Solo il caricamento iniziale della pagina e il download una tantum di circa 30 MB di ffmpeg.wasm (memorizzato nella cache per le visite successive) toccano la rete. Metti il browser in modalità aereo dopo il caricamento della pagina e l'estrattore funziona ancora su file locali.
Quando un altro strumento è la scelta giusta
- File oltre 2 GB.I limiti di memoria del browser diventano un muro sopra circa 2 GB. Usa FFmpeg CLI desktop:
ffmpeg -i big_video.mkv -vn -c:a copy big_audio.aacfunziona in pochi secondi su qualsiasi dimensione di file perché fa streaming da disco e usa stream copy quando i codec corrispondono. - Estrazione audio multi traccia.Alcuni video hanno più tracce audio (commento del regista, lingue di doppiaggio alternative, varianti di narrazione). FFmpeg CLI con
-map 0:a:Nseleziona ogni traccia esplicitamente. Gli strumenti browser tipicamente estraggono solo la traccia audio predefinita. - Estrazione in batch su molti file.Uno script shell con FFmpeg CLI elabora una cartella in un comando:
for f in *.mp4; do ffmpeg -i "$f" -vn -c:a libmp3lame -b:a 192k "${f%.mp4}.mp3"; done. Molto più veloce che eseguire uno strumento browser 100 volte manualmente. - Flusso pesante di ID3/metadati.Se hai bisogno di allegare tag ID3, copertina, testi e marcatori di capitolo appropriati agli MP3 estratti, usa Mp3tag (Windows) o MusicBrainz Picard (multi piattaforma) dopo l'estrazione. Questi hanno editor di metadati ricchi che gli strumenti browser non hanno.
Domande frequenti
La qualità audio corrisponderà al video originale?
Sì, l'estrazione preserva la qualità audio originale. Puoi anche scegliere un bitrate più alto per mantenere la migliore fedeltà possibile.
Cosa succede se il mio video non ha una traccia audio?
Lo strumento rileverà l'assenza di audio e te lo comunicherà. Solo i file video con tracce audio possono essere elaborati.
Posso estrarre l'audio dai video di YouTube?
Devi prima scaricare il file video sul tuo dispositivo. Questo strumento funziona su file video locali, non direttamente da link online.
Altre domande frequenti
Qual è la differenza tra MP3, AAC, OGG e WAV?
MP3 (1993) è il formato lossy universale, si riproduce ovunque. AAC (1997) è più efficiente di MP3 alla stessa qualità, default sui dispositivi Apple. OGG/Vorbis (primi anni 2000) è l'alternativa open royalty free; Opus (2012) è il suo successore moderno e il codec lossy più efficiente per voce e musica. WAV è PCM non compresso (file enormi ma lossless). FLAC è compressione lossless (circa la metà della dimensione di WAV senza perdita di qualità). Per condividere: MP3 o AAC. Per archiviare: FLAC. Per modificare: WAV.
Quale bitrate dovrei scegliere?
Per la musica: 192 a 320 kbps MP3 o AAC (320 è trasparente per la maggior parte degli ascoltatori; 192 è il default de facto della libreria). Per voce/podcast: 64 a 128 kbps mono è abbondante (file più piccoli, nessuna perdita di qualità per il parlato). Per archiviazione: non scegliere un bitrate, usa lossless (FLAC o WAV). Scegliere un bitrate più alto del bitrate audio della sorgente non aiuta; abbina o sali leggermente solo.
L'estrazione sarà lossless o lossy?
Dipende dal formato di destinazione. Estrarre in WAV o FLAC è lossless: ogni campione della sorgente decodificata è preservato. Estrarre in MP3, AAC, OGG o Opus è lossy: l'encoder scarta alcuni dettagli inudibili per risparmiare spazio. Se l'audio sorgente era già lossy (la maggior parte degli MP4 ha AAC dentro), anche un estratto lossless è una "copia lossless di sorgente lossy", non una riproduzione perfetta della registrazione originale.
Perché l'estrazione è a volte quasi istantanea e a volte lenta?
Se il codec audio sorgente corrisponde al target (raro in questo strumento perché i target sono solitamente MP3/WAV mentre le sorgenti sono solitamente AAC), lo strumento può fare uno stream copy che riscrive solo il contenitore senza ricodificare. Lo stream copy termina in pochi secondi per qualsiasi dimensione di file. La ricodifica è vincolata dalla tua CPU e richiede tempo proporzionale alla durata dell'audio: 1 a 5x tempo reale per MP3/AAC su un laptop tipico.
Esiste un equivalente desktop o riga di comando?
Sì. FFmpeg CLI: ffmpeg -i input.mp4 -vn -c:a libmp3lame -b:a 192k output.mp3. Per stream copy: ffmpeg -i input.mp4 -vn -c:a copy output.m4a. VLC ha una finestra di dialogo Converti/Salva che estrae l'audio tramite il suo FFmpeg integrato. Audacity può importare video ed esportare audio in qualsiasi formato. Tutti producono output essenzialmente identico a questo strumento browser perché condividono gli stessi codec sottostanti.
Posso estrarre solo una porzione dell'audio?
In questo strumento, non direttamente: l'estrazione elabora l'intera traccia audio. Per estrarre un segmento, usa prima un trimmer video per tagliare il tuo video nell'intervallo desiderato, poi estrai l'audio. Oppure in FFmpeg CLI: ffmpeg -i input.mp4 -vn -ss 00:01:30 -to 00:03:45 -c:a libmp3lame -b:a 192k clip.mp3 estrae da 1:30 a 3:45.