Tagliatore audio

Taglia e ritaglia file audio alla durata esatta desiderata. Imposta inizio e fine, visualizza l'anteprima ed esporta. Nessun invio, nessuna iscrizione.

I tuoi file non lasciano mai il tuo dispositivo
Rilascia qui un file audio o clicca per sfogliare

MP3, WAV, OGG, AAC, FLAC, M4A

Come funziona

  1. Carica un file audio: seleziona un file MP3, WAV, OGG, FLAC o M4A dal tuo dispositivo.
  2. Imposta i punti di inizio e fine: trascina le maniglie sulla forma d'onda o inserisci timestamp precisi per delimitare il segmento da conservare.
  3. Visualizza l'anteprima della selezione: riproduci solo il segmento tagliato prima dell'esportazione.
  4. Scarica il clip: esporta l'audio tagliato sul tuo dispositivo, nessun invio a un server.

Breve storia della Web Audio API

La Web Audio API è l'interfaccia JavaScript standardizzata dal W3C per processare e sintetizzare audio nei browser web, la tecnologia fondamentale che permette a una pagina web di decodificare un MP3 in memoria, disegnare una forma d'onda, instradare l'audio attraverso filtri o riprodurre toni sintetizzati senza plugin. Il primo prototipo fu costruito da Chris Rogers in Apple all'interno del progetto WebKit nel 2010. Il W3C Audio Working Group pubblicò la sua First Public Working Draft il 14 dicembre 2011; dopo quasi un decennio di revisioni e cicli di implementazione browser, il W3C pubblicò la Web Audio API come W3C Recommendation il 17 giugno 2021. Il documento Recommendation ringrazia esplicitamente Chris Rogers come "former specification editor and original author of this specification." Tre classi fanno la maggior parte del lavoro in qualsiasi strumento audio lato browser: AudioContext (il contenitore di livello superiore), AudioBuffer (un blocco in memoria di audio PCM decodificato con i dati dei canali esposti come Float32Array) e AudioBufferSourceNode (un nodo di riproduzione one-shot). Il modello completo del grafo supporta molti altri tipi di nodo: gain, filtro, panner, analyser, convolver, delay, e può costruire qualsiasi cosa da un accordatore per chitarra a un sintetizzatore. Questo trimmer usa solo la parte di decodifica (AudioContext.decodeAudioData()) per la visualizzazione della forma d'onda; il taglio vero e proprio passa attraverso ffmpeg.wasm.

Formati supportati

WAV (1991, Microsoft + IBM) è il Waveform Audio File Format, un contenitore RIFF che contiene campioni PCM lineari non compressi. Il WAV in qualità CD è 44.100 campioni × 2 canali × 16 bit al secondo ≈ 10,1 MB al minuto, motivo per cui un brano di quattro minuti in WAV è circa 40 MB. L'header della dimensione del data-chunk a 32 bit di WAV limita un singolo file a 4 GB; registrazioni più lunghe richiedono le estensioni RF64 o W64. WAV è il formato di interscambio universale proprio perché è non compresso, semplice da analizzare e privo di brevetti. MP3 (ISO/IEC 11172-3, 1993) è il nome colloquiale di MPEG-1 Audio Layer III, sviluppato al Fraunhofer Institute di Erlangen, in Germania, con contributi chiave da Karlheinz Brandenburg, Heinz Gerhäuser, Bernhard Grill, Jürgen Herre e Harald Popp. MP3 è stato per due decenni gravato da brevetti; l'ultimo di quei brevetti è scaduto il 16 aprile 2017 negli Stati Uniti, e Fraunhofer ha annunciato formalmente la chiusura del suo programma di licensing MP3 il 23 aprile 2017. Quella scadenza dei brevetti è il motivo per cui encoder MP3 gratuiti e royalty-free (libmp3lame, lamejs) sono diventati distribuibili senza controversie negli strumenti lato browser.

AAC (ISO/IEC 13818-7, 1997) e M4A: AAC fu progettato come successore di MP3, con qualità migliore allo stesso bitrate. M4A non è un codec separato: è un file MPEG-4 Part 14 (.mp4) che trasporta solo audio. Apple ha popolarizzato l'estensione .m4a quando ha lanciato l'iTunes Music Store il 28 aprile 2003, usando AAC a 128 kbps come formato di acquisto predefinito. OGG Vorbis (Xiph.Org, 2000-2002) è un codec lossy gratuito, aperto e libero da brevetti, la risposta di Xiph al clima di brevetti attorno a MP3 alla fine degli anni '90. L'encoder di riferimento, libvorbis, ha raggiunto la versione 1.0 a luglio 2002. Wikipedia, Spotify (inizialmente), innumerevoli giochi e distribuzioni Linux distribuiscono Vorbis. FLAC (Free Lossless Audio Codec, Xiph.Org, 20 luglio 2001) comprime in modo lossless: l'output decodificato è bit per bit identico all'input. La compressione tipica è il 50-60% della dimensione del WAV sorgente. FLAC è il formato di archivio de facto per la distribuzione lossless di musica (Bandcamp, Qobuz, HDtracks, Internet Archive). Opus (IETF RFC 6716, settembre 2012) è il codec royalty-free più moderno, progettato congiuntamente da Xiph.Org, Mozilla e Skype/Microsoft; fonde il codec vocale SILK di Skype con il codec musicale CELT di Xiph in un unico codec variabile eccellente sull'intera gamma da 6 kbps per la voce a 510 kbps per musica stereo. Opus è obbligatorio da implementare in WebRTC.

Come funziona davvero la decodifica audio del browser

Quando trascini un MP3 di 4 MB sulla pagina del trimmer, questa sequenza viene eseguita interamente nel tuo browser. FileReader.readAsArrayBuffer(file) legge i byte dal disco locale in un ArrayBuffer JavaScript; questa è una lettura locale, nessun upload. La pagina crea un AudioContext (con un fallback per i prefissi WebKit più vecchi). audioCtx.decodeAudioData(arrayBuffer) esegue il decoder audio nativo del browser in modo asincrono, tipicamente il codec di sistema, e restituisce un AudioBuffer. L'AudioBuffer espone getChannelData(0) che restituisce un Float32Array dei campioni del canale sinistro normalizzati da −1,0 a +1,0. Per un sorgente mono di 4 minuti a 44,1 kHz si tratta di circa 10,6 milioni di float, 42 MB di memoria. La routine di disegno della forma d'onda effettua un sotto-campionamento di quell'array in un picco per colonna di pixel sul canvas. L'AudioContext viene quindi chiuso; nient'altro mantiene un riferimento al buffer, quindi la memoria viene rilasciata. Per il taglio vero e proprio, ffmpeg.wasm opera sui byte codificati originali nel suo filesystem virtuale: la decodifica Web Audio è puramente per l'immagine. Quali formati decodeAudioData accetta dipende dal browser ospite, non dalle specifiche. Praticamente nel 2026: MP3 e WAV sono decodificati universalmente; OGG Vorbis funziona in Chrome, Firefox e Safari recente; AAC/M4A in Safari, Chrome, Edge e Firefox moderno; FLAC in tutti i browser principali da circa il 2017; Opus in tutti i browser moderni.

Rendering della forma d'onda: la tecnica del picco-per-pixel

Disegnare una forma d'onda è concettualmente semplice ma facile da fare male. La tecnica standard, usata qui, è l'inviluppo min/max: scegli una larghezza target in pixel (la larghezza del canvas); calcola la dimensione del passo come samples.length / width; per ogni colonna di pixel di output esamina i suoi step campioni e trova il minimo e il massimo locali; disegna una singola linea verticale dal campione minimo a quello massimo. Il risultato è il familiare aspetto a "inviluppo" specchiato che si vede in ogni DAW moderna. Perché l'inviluppo min/max invece di RMS o singolo campione? Un approccio ingenuo "per ogni pixel, traccia un campione" perde il dettaglio dei transienti: un campione silenzioso potrebbe atterrare su un pixel che doveva rappresentare un transiente forte, producendo una forma d'onda apparentemente piatta e ingannevole. RMS (root-mean-square) dà una curva di intensità percettivamente accurata ma perde l'informazione sui picchi. L'inviluppo min/max è il compromesso visivo che ha dominato l'UI delle DAW almeno da Pro Tools e rimane la convenzione in wavesurfer.js, peaks.js (BBC R&D, progettato per giornalisti che annotano audio long-form) e Audacity. L'implementazione qui usa devicePixelRatio per lo scaling high-DPI così che la forma d'onda resti nitida sui display Retina. Una limitazione onesta: getChannelData(0) restituisce solo il primo canale, quindi i file stereo mostrano il canale sinistro; il taglio vero e proprio, eseguito tramite ffmpeg, preserva tutti i canali.

Matematica del taglio sample-accurate

Un taglio è concettualmente semplice: produrre un nuovo file contenente solo i campioni tra il tempo t_start e il tempo t_end della sorgente. Ci sono due strade. L'approccio a livello di campione converte i tempi in indici di campione (start_frame = round(t_start × sampleRate)), alloca un nuovo AudioBuffer di lunghezza end_frame − start_frame, copia i campioni per canale, poi ricodifica: è ciò che faresti con la sola Web Audio API. Il taglio a livello di contenitore (ciò che fa questo strumento tramite FFmpeg) passa -ss start -to end a FFmpeg e lo lascia stream-are il bitstream codificato in uscita, ricodificando attraverso il codec di output scelto. Il taglio guidato da FFmpeg è più robusto perché l'encoder gestisce framing, header e metadati; il percorso solo Web-Audio richiede di scrivere un proprio encoder MP3 o Vorbis per l'output, cosa molto più complicata. Il sample rate conta: 44,1 kHz è lo standard del Compact Disc e il rate dominante per la musica, scelto per essere sopra il limite di Nyquist per l'udito umano (~20 kHz × 2 = 40 kHz minimo) e compatibile con i registratori a nastro PAL/NTSC usati per masterizzare i primi CD. 48 kHz è lo standard per cinema, TV e video digitale. 16 kHz è il rate de facto per riconoscimento vocale e VoIP; 8 kHz è la classica telefonia su linea fissa. 96 kHz e 192 kHz sono rate audio ad alta risoluzione. Questo strumento eredita di default il sample rate dell'input tramite FFmpeg, preservando la fedeltà a meno che non sia esplicitamente necessario diversamente. L'UI accetta tempi a un decimale di secondo (0:03,5); FFmpeg internamente è sample-accurate, quindi una granularità di 0,1 secondi si traduce in ~4.410 campioni a 44,1 kHz, ben dentro l'accuratezza percepibile dall'umano.

Perché ffmpeg.wasm e non lamejs

Il più grande mal di testa storico nell'editing audio lato browser era la codifica MP3. Decodificare è gratis: lo fa il browser. Codificare richiede un encoder MP3 in JavaScript o WebAssembly. Due opzioni dominano. lamejs è un port in puro JavaScript del veterano encoder LAME MP3 (originariamente di Andreas Krennmair / zhuker su GitHub, mediante traspilazione meccanica del sorgente C di LAME in JS). Il vantaggio è il footprint piccolo (~150 KB minificato) e zero dipendenze: aggiungi un tag script e puoi codificare MP3 in forse 50 righe di codice. Gli svantaggi sono che fa solo MP3, l'API è macchinosa e le prestazioni su file lunghi sono mediocri perché è JS interpretato anziché WebAssembly compilato. ffmpeg.wasm è una build WebAssembly di FFmpeg, il coltellino svizzero universale dell'elaborazione audio/video. Il vantaggio è l'universalità: ogni codec che FFmpeg supporta (MP3, WAV, OGG, AAC, FLAC, Opus, decine di formati oscuri), ogni contenitore, ogni trasformazione. Lo svantaggio è la dimensione: il bundle WebAssembly è di diversi MB, molto più grande di lamejs da solo. Questo strumento usa ffmpeg.wasm perché ti dà tre veri codec di output (MP3 tramite libmp3lame, WAV tramite pcm_s16le, OGG tramite libvorbis) da un unico motore condiviso, con la stessa meccanica di taglio applicata a tutti; lamejs avrebbe limitato l'output al solo MP3. Il compromesso è il costo della dimensione del bundle alla prima visita.

Casi d'uso comuni

Ambito onesto: cosa non fa questo strumento

Questo è uno strumento di taglio singolo file focalizzato, non una digital audio workstation. Cose che non fa, e che concorrenti più elaborati gestiscono: nessun fade in / fade out (la clip esportata inizia e finisce bruscamente nei punti di taglio); nessun multi-traccia o mix (un file dentro, un file tagliato fuori); nessun effetto (niente EQ, compressione, normalizzazione, riduzione del rumore, riverbero); nessuna divisione di un file in più clip in una sola passata (per tagliare tre sezioni si taglia tre volte); nessun cambio di guadagno o volume; nessuna riproduzione della sola regione tagliata: il player audio riproduce l'intero file sorgente con un cursore animato sopra la forma d'onda durante la riproduzione. Per editing multi-traccia, fade, effetti e mastering, usa Audacity (open-source, rilasciato da Dominic Mazzoni e Roger Dannenberg il 28 maggio 2000 alla Carnegie Mellon, ancora attivamente sviluppato nel 2026), Adobe Audition (commerciale) o Reaper (commerciale, prova gratuita generosa). Per un taglio one-and-done senza setup, questo strumento è la forma giusta. Il posizionamento sulla privacy è genuino: le registrazioni vocali sono dati personali, spesso contengono parlato identificabile o suono di sottofondo da uno spazio privato; caricarle su un "audio cutter online gratuito" è un rischio reale di privacy che un'architettura solo-browser elimina del tutto.

Privacy: perché questa architettura conta per l'audio

Le registrazioni audio portano più informazioni identificative della maggior parte dei tipi di file. Un memo vocale contiene parlato identificabile (le impronte vocali sono univocamente identificative). Un brano può essere materiale protetto da copyright. Una registrazione di una riunione può contenere discussione aziendale riservata o dettagli medici personali. Gli editor audio lato server richiedono il caricamento del file, il che significa che una copia resta nei log del server, possibilmente in una cache CDN, possibilmente in una pipeline di analytics, possibilmente in un backup. Per musica commerciale ordinaria questo è innocuo. Per memo vocali, registrazioni di riunioni, dettature, ritagli di podcast, registrazioni di eventi familiari o qualunque altra cosa che non vorresti vedere copiata sul disco di uno sconosciuto, non lo è. Questo strumento esegue l'intera pipeline (selezione del file, decodifica, rendering della forma d'onda, taglio, ricodifica, download) localmente nel tuo browser. Niente upload, niente chiamata API, niente entry di log. Puoi verificarlo aprendo il pannello Network di DevTools mentre tagli: non ci sono richieste in uscita che trasportano dati audio. Dopo che il bundle WebAssembly di FFmpeg si è caricato una volta, puoi mettere la pagina offline (modalità aereo) e lo strumento continua a funzionare, la prova empirica più forte che nulla viene caricato.

Domande frequenti

Quali formati posso importare ed esportare?

Input: MP3, WAV, OGG (Vorbis), AAC, FLAC, M4A: tutto ciò che il decodeAudioData del tuo browser può leggere. I browser moderni coprono tutti questi. Output: MP3 (LAME a bitrate variabile ~190 kbps, il punto dolce per la musica), WAV (PCM lineare 16-bit, lossless) o OGG Vorbis (~160 kbps VBR, qualità trasparente e libero da brevetti). Sia la codifica che la decodifica passano per ffmpeg.wasm nel tuo browser, quindi nessun server è mai coinvolto.

C'è un limite di dimensione del file?

Non c'è un limite lato server perché non avviene alcun upload. Il tetto pratico è la memoria disponibile del tuo dispositivo: il file deve essere decodificato in un Float32Array JavaScript per la visualizzazione della forma d'onda, il che significa che un sorgente mono di 4 minuti a 44,1 kHz richiede circa 42 MB di RAM durante l'elaborazione. File fino a circa 100 MB funzionano comodamente su un laptop tipico; file più lunghi (podcast di più ore, album interi) potrebbero rallentare o fallire su mobile di fascia bassa. Se un caricamento si blocca, prova un file più piccolo o taglia a segmenti.

Il taglio riduce la qualità audio?

Per output WAV: no, WAV è lossless, quindi la regione tagliata è bit per bit identica ai campioni sorgente tra i punti di taglio. Per output MP3 e OGG: viene aggiunta una piccola generazione aggiuntiva di quantizzazione lossy perché la sorgente viene ricodificata. Le impostazioni dell'encoder usate qui (LAME VBR ~190 kbps per MP3, libvorbis qualità 5 ≈ 160 kbps per OGG) sono ben sopra la soglia che la maggior parte degli ascoltatori può percepire. Se prevedi di rieditare la clip tagliata in seguito, scegli WAV; se vuoi un file piccolo per la distribuzione, MP3 o OGG.

Supporta fade in / fade out?

No, il taglio è netto a entrambe le estremità. Per fade, editing multi-traccia, effetti o mastering, usa Audacity (open-source, gratuito, multipiattaforma, rilasciato il 28 maggio 2000 alla Carnegie Mellon) o Adobe Audition. Questo strumento è la forma giusta per "ho solo bisogno di una clip tagliata pulita"; per qualsiasi cosa più elaborata, una vera DAW è lo strumento giusto.

Perché la forma d'onda mostra solo un canale?

La forma d'onda disegna il primo canale (il canale sinistro in un file stereo) come un singolo inviluppo per colonna di pixel. Disegnare entrambi i canali in colori diversi raddoppierebbe lo spazio sullo schermo o richiederebbe la sovrapposizione delle forme d'onda, entrambe più rumorose della visualizzazione a canale singolo per un'UI di scrubbing rapido. Il taglio in sé preserva tutti i canali (FFmpeg li copia così come sono dalla sorgente), quindi una registrazione stereo resta stereo in output, anche se contenuto solo-canale-destro (un dettaglio panneggiato a destra) non appare nell'immagine.

I miei file audio vengono caricati?

No. Ogni passaggio (selezione del file, decodifica, rendering della forma d'onda, taglio, ricodifica, download) viene eseguito localmente nel tuo browser tramite JavaScript e ffmpeg.wasm. Niente upload, niente chiamata API, niente entry di log. Puoi verificarlo aprendo il pannello Network di DevTools mentre tagli. Dopo che il bundle ffmpeg.wasm si è caricato una volta, puoi mettere la pagina offline e lo strumento continua a funzionare, la prova più forte che nulla viene caricato. Sicuro per memo vocali, registrazioni di riunioni, dettature mediche o qualsiasi audio che non vorresti vedere copiato sul disco di uno sconosciuto.

Strumenti correlati