ऑडियो ट्रिमर
ऑडियो फ़ाइलों को सटीक अवधि तक काटें और ट्रिम करें। प्रारंभ और अंत सेट करें, पूर्वावलोकन करें और निर्यात करें। कोई अपलोड नहीं, कोई साइन-अप नहीं।
MP3, WAV, OGG, AAC, FLAC, M4A
यह कैसे काम करता है
- एक ऑडियो फ़ाइल लोड करें। MP3, WAV, OGG, AAC, FLAC या M4A फ़ाइल को छोड़ें या चुनें। ब्राउज़र वेवफ़ॉर्म बनाने के लिए उसे लोकल स्तर पर डिकोड करता है; कुछ भी अपलोड नहीं होता।
- शुरू और अंत के बिंदु तय करें। वेवफ़ॉर्म पर सीधे हैंडल खींचें, या मिलीसेकंड तक सटीक टाइमस्टैंप टाइप करें। चयन रखे जाने वाले हिस्से को हाइलाइट करता है।
- समायोजन के दौरान स्रोत का पूर्वावलोकन करें। ऑडियो प्लेयर मूल फ़ाइल को वेवफ़ॉर्म पर ओवरले किए गए प्लेहेड के साथ बजाता है, जो कान से सटीक कट बिंदु ढूँढ़ने में उपयोगी है।
- आउटपुट फ़ॉर्मैट चुनें और ट्रिम करें। MP3 (LAME VBR ~190 kbps), WAV (16-बिट PCM, हानि-रहित) या OGG Vorbis (~160 kbps VBR)। ट्रिम आपके ब्राउज़र में ffmpeg.wasm के माध्यम से चलता है; तैयार होते ही ट्रिम की गई फ़ाइल डाउनलोड हो जाती है।
Web Audio API का संक्षिप्त इतिहास
Web Audio API वह W3C-मानकीकृत JavaScript इंटरफ़ेस है जो वेब ब्राउज़रों में ऑडियो को प्रोसेस और सिंथेसाइज़ करने के लिए है, यानी वह बुनियादी तकनीक जो किसी वेबपेज को मेमोरी में MP3 को डिकोड करने, वेवफ़ॉर्म खींचने, ऑडियो को फ़िल्टरों के माध्यम से रूट करने या बिना किसी प्लगइन के सिंथेसाइज़्ड टोन बजाने में सक्षम बनाती है। पहला प्रोटोटाइप 2010 में Apple में WebKit प्रोजेक्ट के भीतर Chris Rogers ने बनाया। W3C Audio Working Group ने अपना First Public Working Draft 14 दिसंबर 2011 को प्रकाशित किया; लगभग एक दशक के संशोधनों और ब्राउज़र क्रियान्वयन चक्रों के बाद, W3C ने Web Audio API को 17 जून 2021 को W3C Recommendation के रूप में प्रकाशित किया। Recommendation दस्तावेज़ Chris Rogers को स्पष्ट रूप से "former specification editor and original author of this specification" के रूप में धन्यवाद देता है। तीन क्लासें ब्राउज़र-साइड किसी भी ऑडियो टूल का अधिकांश काम संभालती हैं: AudioContext (शीर्ष-स्तरीय कंटेनर), AudioBuffer (डिकोड किए गए PCM ऑडियो का इन-मेमोरी टुकड़ा, जिसके चैनल डेटा को Float32Array के रूप में उजागर किया जाता है) और AudioBufferSourceNode (एकल-शॉट प्लेबैक नोड)। पूरा ग्राफ़ मॉडल कई और नोड प्रकारों का समर्थन करता है, जैसे gain, filter, panner, analyser, convolver, delay, और गिटार ट्यूनर से लेकर सिंथेसाइज़र तक सब कुछ बनाने में सक्षम है। यह ट्रिमर वेवफ़ॉर्म दिखाने के लिए केवल डिकोडिंग भाग (AudioContext.decodeAudioData()) का उपयोग करता है; वास्तविक कट ffmpeg.wasm के माध्यम से चलता है।
इस टूल द्वारा पढ़े जाने वाले ऑडियो फ़ॉर्मैट का दौरा
WAV (1991, Microsoft + IBM) Waveform Audio File Format है, यानी एक RIFF कंटेनर जिसमें असंपीड़ित रैखिक PCM नमूने रहते हैं। CD-गुणवत्ता वाला WAV प्रति सेकंड 44,100 नमूने × 2 चैनल × 16 बिट ≈ 10.1 MB प्रति मिनट है, यही कारण है कि चार मिनट का गाना WAV में लगभग 40 MB का होता है। WAV का 32-बिट डेटा-चंक आकार हेडर एक फ़ाइल को 4 GB तक सीमित करता है; उससे लंबी रिकॉर्डिंग के लिए RF64 या W64 एक्सटेंशन ज़रूरी हैं। WAV वही सर्वव्यापी इंटरचेंज फ़ॉर्मैट है, ठीक इसलिए क्योंकि वह असंपीड़ित है, पार्स करने में सरल है और पेटेंट-मुक्त है। MP3 (ISO/IEC 11172-3, 1993) MPEG-1 Audio Layer III का प्रचलित नाम है, जिसे Erlangen, जर्मनी के Fraunhofer Institute में Karlheinz Brandenburg, Heinz Gerhäuser, Bernhard Grill, Jürgen Herre और Harald Popp के प्रमुख योगदानों के साथ विकसित किया गया था। MP3 दो दशकों तक पेटेंट-बाधित रहा; उन पेटेंटों में से अंतिम 16 अप्रैल 2017 को संयुक्त राज्य अमेरिका में समाप्त हो गया, और Fraunhofer ने 23 अप्रैल 2017 को अपने MP3 लाइसेंसिंग कार्यक्रम के समापन की औपचारिक घोषणा की। यह पेटेंट-समाप्ति ही वजह है कि मुफ़्त, रॉयल्टी-मुक्त MP3 एनकोडर (libmp3lame, lamejs) ब्राउज़र-साइड टूल में बिना किसी विवाद के शिप किए जाने योग्य बने।
AAC (ISO/IEC 13818-7, 1997) और M4A: AAC को MP3 के उत्तराधिकारी के रूप में डिज़ाइन किया गया था, उसी बिटरेट पर बेहतर गुणवत्ता के साथ। M4A अलग कोडेक नहीं है: यह एक MPEG-4 Part 14 फ़ाइल (.mp4) है जो केवल ऑडियो रखती है। Apple ने 28 अप्रैल 2003 को iTunes Music Store के लॉन्च के समय .m4a एक्सटेंशन को लोकप्रिय बनाया, जिसमें 128 kbps पर AAC डिफ़ॉल्ट खरीद फ़ॉर्मैट था। OGG Vorbis (Xiph.Org, 2000-2002) एक मुक्त, खुला, पेटेंट-अबाधित हानि-युक्त कोडेक है, यानी 1990 के दशक के अंत में MP3 के इर्द-गिर्द के पेटेंट माहौल पर Xiph का जवाब। संदर्भ एनकोडर libvorbis ने जुलाई 2002 में संस्करण 1.0 हासिल किया। Wikipedia, Spotify (शुरू में), अनगिनत खेल और Linux वितरण Vorbis शिप करते हैं। FLAC (Free Lossless Audio Codec, Xiph.Org, 20 जुलाई 2001) हानि-रहित ढंग से संपीड़न करता है: डिकोडेड आउटपुट इनपुट से बिट-दर-बिट समान होता है। सामान्य संपीड़न स्रोत WAV आकार का 50-60 % रहता है। FLAC हानि-रहित संगीत वितरण (Bandcamp, Qobuz, HDtracks, Internet Archive) के लिए वस्तुतः मानक संग्रह फ़ॉर्मैट बन गया है। Opus (IETF RFC 6716, सितंबर 2012) सबसे आधुनिक रॉयल्टी-मुक्त कोडेक है, जिसे Xiph.Org, Mozilla और Skype/Microsoft ने मिलकर डिज़ाइन किया; यह Skype के SILK स्पीच कोडेक को Xiph के CELT म्यूज़िक कोडेक के साथ एक चर कोडेक में जोड़ता है, जो 6 kbps स्पीच से लेकर 510 kbps स्टीरियो म्यूज़िक तक पूरी रेंज में उत्कृष्ट है। Opus WebRTC में लागू करना अनिवार्य है।
ब्राउज़र में ऑडियो डिकोडिंग वास्तव में कैसे काम करती है
जब आप ट्रिमर पेज पर 4 MB का MP3 छोड़ते हैं, तो यह क्रम पूरी तरह आपके ब्राउज़र में चलता है। FileReader.readAsArrayBuffer(file) लोकल डिस्क से बाइट्स को JavaScript ArrayBuffer में पढ़ता है; यह एक लोकल पठन है, अपलोड नहीं। पेज एक AudioContext बनाता है (पुराने WebKit उपसर्गों के लिए फ़ॉलबैक के साथ)। audioCtx.decodeAudioData(arrayBuffer) ब्राउज़र के मूल ऑडियो डिकोडर को एसिंक्रोनस रूप से चलाता है (आमतौर पर सिस्टम कोडेक) और एक AudioBuffer लौटाता है। AudioBuffer getChannelData(0) को उजागर करता है, जो बाएँ चैनल के नमूनों का Float32Array लौटाता है, जो −1.0 से +1.0 के बीच सामान्यीकृत होते हैं। 4 मिनट के मोनो 44.1 kHz स्रोत के लिए यह लगभग 1 करोड़ 6 लाख फ़्लोट्स बनते हैं, यानी 42 MB मेमोरी। वेवफ़ॉर्म-ड्रॉइंग रूटीन उस ऐरे को कैनवास के प्रति पिक्सेल कॉलम एक पीक तक डाउनसैंपल करता है। उसके बाद AudioContext बंद कर दिया जाता है; बफ़र पर कोई अन्य संदर्भ नहीं रहता, इसलिए मेमोरी मुक्त हो जाती है। वास्तविक ट्रिम के लिए, ffmpeg.wasm अपने वर्चुअल फ़ाइल सिस्टम में मूल एनकोडेड बाइट्स पर काम करता है; Web Audio डिकोड केवल चित्र के लिए है। decodeAudioData कौन-से फ़ॉर्मैट स्वीकार करता है, यह मेज़बान ब्राउज़र पर निर्भर है, स्पेसिफ़िकेशन पर नहीं। 2026 में व्यवहार में: MP3 और WAV सर्वव्यापी रूप से डिकोड होते हैं; OGG Vorbis Chrome, Firefox और हाल के Safari में चलता है; AAC/M4A Safari, Chrome, Edge और आधुनिक Firefox में; FLAC लगभग 2017 से सभी प्रमुख ब्राउज़रों में; Opus सभी आधुनिक ब्राउज़रों में।
वेवफ़ॉर्म रेंडरिंग, पीक-प्रति-पिक्सेल तकनीक
वेवफ़ॉर्म खींचना सैद्धांतिक रूप से सरल है, लेकिन आसानी से ख़राब किया जा सकता है। यहाँ इस्तेमाल की गई मानक तकनीक है min/max एनवेलप: पिक्सेल में लक्ष्य चौड़ाई चुनें (कैनवास की चौड़ाई); स्टेप आकार को samples.length / width के रूप में गणना करें; आउटपुट के प्रत्येक पिक्सेल कॉलम के लिए उसके step नमूनों को स्कैन करें और स्थानीय न्यूनतम और अधिकतम खोजें; न्यूनतम नमूने से अधिकतम नमूने तक एक एकल ऊर्ध्वाधर रेखा खींचें। परिणाम वही परिचित दर्पण जैसी "एनवेलप" शक्ल है जो आप किसी भी आधुनिक DAW में देखते हैं। RMS या एकल-नमूने के बजाय min/max एनवेलप क्यों? सरल "प्रति पिक्सेल एक नमूना प्लॉट करो" तरीक़ा क्षणिक विवरण खो देता है: एक धीमा नमूना उस पिक्सेल पर पड़ सकता है जिसे जोरदार ट्रांसिएंट का प्रतिनिधित्व करना था, और भ्रामक रूप से सपाट दिखने वाला वेवफ़ॉर्म बना देता है। RMS (मूल-मध्य-वर्ग) एक अनुभूतिगत रूप से सटीक लाउडनेस वक्र देता है, लेकिन पीक जानकारी खो देता है। min/max एनवेलप वही दृश्य समझौता है जो कम-से-कम Pro Tools से DAW UI पर हावी रहा है और wavesurfer.js, peaks.js (BBC R&D, लंबे ऑडियो को एनोटेट करने वाले पत्रकारों के लिए डिज़ाइन किया गया) और Audacity में परंपरा बना हुआ है। यहाँ कार्यान्वयन उच्च-DPI स्केलिंग के लिए devicePixelRatio का उपयोग करता है, ताकि वेवफ़ॉर्म Retina डिस्प्ले पर तीखा बना रहे। एक ईमानदार सीमा: getChannelData(0) केवल पहला चैनल लौटाता है, इसलिए स्टीरियो फ़ाइलें बाएँ चैनल को रेंडर करती हैं। ट्रिम स्वयं, ffmpeg के माध्यम से चलकर, सभी चैनल बनाए रखता है।
नमूना-स्तर पर सटीक ट्रिमिंग की गणित
एक ट्रिम सैद्धांतिक रूप से सरल है: एक नई फ़ाइल बनाना जिसमें केवल स्रोत के समय t_start और समय t_end के बीच के नमूने हों। दो रास्ते हैं। नमूना-स्तरीय दृष्टिकोण समय को नमूना सूचकांकों में बदलता है (start_frame = round(t_start × sampleRate)), लंबाई end_frame − start_frame का एक नया AudioBuffer आवंटित करता है, चैनल-वार नमूने कॉपी करता है, फिर पुनः एनकोड करता है: यही आप शुद्ध Web Audio API के साथ करते। कंटेनर-स्तरीय कट (जो यह टूल FFmpeg के माध्यम से करता है) FFmpeg को -ss start -to end भेजता है और उसे एनकोडेड बिटस्ट्रीम बाहर निकालने देता है, चुने गए आउटपुट कोडेक के माध्यम से पुनः एनकोड करते हुए। FFmpeg-संचालित कट अधिक भरोसेमंद है क्योंकि एनकोडर फ़्रेमिंग, हेडर और मेटाडेटा संभालता है; केवल Web Audio वाला रास्ता आउटपुट के लिए अपना MP3 या Vorbis एनकोडर लिखने की माँग करता है, जो काफ़ी ज़्यादा झंझट है। नमूना दर मायने रखती है: 44.1 kHz Compact Disc मानक है और संगीत के लिए प्रमुख दर है, जिसे मानव श्रवण की Nyquist सीमा (~20 kHz × 2 = न्यूनतम 40 kHz) से ऊपर रखने के लिए और शुरुआती CD मास्टर करने में इस्तेमाल किए गए PAL/NTSC वीडियो टेप डेक से सुसंगत होने के लिए चुना गया। 48 kHz सिनेमा, टीवी और डिजिटल वीडियो के लिए मानक है। 16 kHz स्पीच रिकग्निशन और VoIP के लिए वस्तुतः दर है; 8 kHz क्लासिक लैंडलाइन टेलीफ़ोनी। 96 kHz और 192 kHz उच्च-रिज़ोल्यूशन ऑडियो दरें हैं। यह टूल डिफ़ॉल्ट रूप से FFmpeg के माध्यम से इनपुट की नमूना दर को विरासत में लेता है, जब तक आप स्पष्ट रूप से कुछ और न चाहें, मूल विश्वसनीयता बनाए रखता है। UI एक दशमलव सेकंड तक के समय स्वीकार करता है (0:03.5); FFmpeg आंतरिक रूप से नमूना-सटीक है, इसलिए 0.1 सेकंड की ग्रेन्युलैरिटी 44.1 kHz पर लगभग 4,410 नमूनों से मेल खाती है, जो मानव-अनुभवजन्य सटीकता के भीतर है।
lamejs के बजाय ffmpeg.wasm क्यों
ब्राउज़र-साइड ऑडियो संपादन की सबसे बड़ी ऐतिहासिक सिरदर्द MP3 को एनकोड करना थी। डिकोडिंग मुफ़्त है, ब्राउज़र वह करता है। एनकोडिंग के लिए JavaScript या WebAssembly MP3 एनकोडर चाहिए। दो विकल्प हावी हैं। lamejs पुराने भरोसेमंद LAME MP3 एनकोडर का शुद्ध JavaScript पोर्ट है (मूल रूप से GitHub पर Andreas Krennmair / zhuker द्वारा, LAME के C स्रोत को यांत्रिक रूप से JS में ट्रांसपाइल करके)। फ़ायदा छोटा फ़ुटप्रिंट है (~150 KB मिनिफ़ाइड) और शून्य निर्भरताएँ; एक script टैग जोड़ें, और लगभग 50 लाइनों में MP3 एनकोड कर लें। नुकसान यह है कि यह केवल MP3 करता है, API झंझटी है, और लंबी फ़ाइलों पर प्रदर्शन मध्यम है क्योंकि यह कंपाइल किया हुआ WebAssembly नहीं, बल्कि व्याख्या किया गया JS है। ffmpeg.wasm FFmpeg का WebAssembly बिल्ड है, यानी ऑडियो/वीडियो प्रसंस्करण का सर्वव्यापी स्विस-आर्मी चाक़ू। फ़ायदा सर्वव्यापकता है: हर कोडेक जो FFmpeg समर्थन करता है (MP3, WAV, OGG, AAC, FLAC, Opus, दर्जनों कम-ज्ञात फ़ॉर्मैट), हर कंटेनर, हर परिवर्तन। नुकसान आकार है: WebAssembly बंडल कई MB का है, अकेले lamejs से कहीं ज़्यादा। यह टूल ffmpeg.wasm का उपयोग करता है क्योंकि यह एक साझा इंजन से तीन वास्तविक आउटपुट कोडेक देता है (libmp3lame के माध्यम से MP3, pcm_s16le के माध्यम से WAV, libvorbis के माध्यम से OGG), सबके लिए वही ट्रिम यांत्रिकी लागू है; lamejs ने आउटपुट को केवल MP3 तक सीमित कर दिया होता। समझौता पहली विज़िट पर बंडल आकार की लागत है।
सामान्य उपयोग के मामले
- रिंगटोन बनाना। iPhone रिंगटोन 30 सेकंड से कम होने चाहिए; कई Android फ़ोन 40-60 सेकंड पर सीमित होते हैं। किसी गाने की सबसे पहचानीय हुक को ट्रिम करना क्लासिक उपयोग है, और गोपनीयता-सजग भी, क्योंकि कॉपीराइटेड गाने को ट्रिम के लिए तीसरे-पक्ष की साइट पर अपलोड करना छोटा पर वास्तविक एक्सपोज़र है।
- पॉडकास्ट क्लिप निकालना। 90 मिनट के एपिसोड में से सोशल-मीडिया प्रचार के लिए 30-सेकंड का हाइलाइट खींचना। वेवफ़ॉर्म वाक्य की सीमा पर सटीक इन/आउट बिंदु ढूँढ़ना प्लेयर में अंधेरे में स्क्रब करने से कहीं आसान बनाता है।
- वॉइस मेमो ट्रिम करना। वॉइस मेमो में लगभग हमेशा शुरू में मृत हवा होती है (आप रिकॉर्ड दबाते हैं, फिर बोलना शुरू करते हैं) और अंत में (आप बोलना बंद करते हैं, फिर रोकते हैं)। मौन काटना फ़ाइल आकार घटाता है और अनुभूत गुणवत्ता बढ़ाता है।
- वीडियो संपादन के लिए संगीत सैंपल निकालना। वीडियो क्लिप के नीचे पृष्ठभूमि के तौर पर इस्तेमाल करने के लिए किसी गाने का 6-सेकंड लूप। ट्रिम करें, WAV (हानि-रहित, क्योंकि आप वीडियो में फिर से एनकोड करेंगे) के रूप में निर्यात करें, अपने वीडियो संपादक में आयात करें।
- इंट्रो जिंगल हटाना। ट्रांसक्रिप्शन सेवा को भेजने से पहले चैनल का मानक इंट्रो हटाने के लिए पॉडकास्ट या YouTube ऑडियो रिप को साफ़ करना।
- क्लासरूम और प्रस्तुति की तैयारी। स्लाइड डेक या इंटरैक्टिव पाठ में उपयोग के लिए एक साउंड इफ़ेक्ट, संगीत क्लिप या भाषण उद्धरण को ट्रिम करना।
ईमानदार दायरा: यह टूल क्या नहीं करता
यह एक केंद्रित एकल-फ़ाइल ट्रिम टूल है, डिजिटल ऑडियो वर्कस्टेशन नहीं। ऐसी चीज़ें जो यह नहीं करता, और जो विस्तृत प्रतिस्पर्धी संभालते हैं: कोई फ़ेड इन / फ़ेड आउट नहीं (निर्यात किया गया क्लिप ट्रिम बिंदुओं पर अचानक शुरू और समाप्त होता है); कोई मल्टी-ट्रैक या मिक्सिंग नहीं (एक फ़ाइल अंदर, एक ट्रिम की गई फ़ाइल बाहर); कोई इफ़ेक्ट नहीं (कोई EQ, कंप्रेशन, सामान्यीकरण, शोर कमी, रीवर्ब नहीं); एक पास में किसी फ़ाइल को अनेक क्लिपों में विभाजित करना नहीं (तीन हिस्से काटने के लिए तीन बार ट्रिम करते हैं); कोई गेन या वॉल्यूम बदलाव नहीं; केवल ट्रिम क्षेत्र की प्लेबैक नहीं: ऑडियो प्लेयर पूरी स्रोत फ़ाइल बजाता है, प्लेबैक के दौरान वेवफ़ॉर्म पर एनिमेटेड प्लेहेड के साथ। मल्टी-ट्रैक संपादन, फ़ेड, इफ़ेक्ट और मास्टरिंग के लिए Audacity (open-source, 28 मई 2000 को Carnegie Mellon में Dominic Mazzoni और Roger Dannenberg द्वारा प्रकाशित, 2026 में अब भी सक्रिय रूप से विकसित), Adobe Audition (व्यावसायिक) या Reaper (व्यावसायिक, उदार मुफ़्त परीक्षण) का उपयोग करें। बिना किसी सेटअप के एक-बारगी ट्रिमिंग के लिए, यह टूल सही आकार है। गोपनीयता की स्थिति वास्तविक है: ध्वनि रिकॉर्डिंग व्यक्तिगत डेटा हैं, अक्सर निजी स्थान से पहचानयोग्य भाषण या पृष्ठभूमि ध्वनि के साथ; उन्हें "मुफ़्त ऑनलाइन ऑडियो कटर" पर अपलोड करना एक वास्तविक गोपनीयता जोखिम है, जिसे केवल-ब्राउज़र वास्तुकला पूरी तरह से बायपास कर देती है।
गोपनीयता: ऑडियो के लिए यह वास्तुकला क्यों मायने रखती है
ऑडियो रिकॉर्डिंग अधिकांश फ़ाइल प्रकारों की तुलना में अधिक पहचान-योग्य जानकारी ले जाती हैं। एक वॉइस मेमो में पहचानयोग्य भाषण होता है (वॉइस फ़िंगरप्रिंट विशिष्ट रूप से पहचानने वाले हैं)। एक गाना कॉपीराइटेड सामग्री हो सकता है। एक मीटिंग रिकॉर्डिंग में गोपनीय व्यावसायिक चर्चा या व्यक्तिगत चिकित्सा विवरण हो सकता है। सर्वर-साइड ऑडियो संपादक फ़ाइल अपलोड की माँग करते हैं, यानी सर्वर के लॉग में एक प्रति बैठती है, संभवतः CDN कैश में, संभवतः किसी एनालिटिक्स पाइपलाइन में, संभवतः किसी बैकअप में। साधारण व्यावसायिक संगीत के लिए यह हानिरहित है। वॉइस मेमो, मीटिंग रिकॉर्डिंग, श्रुतलेख, पॉडकास्ट आउटटेक, परिवारिक रिकॉर्डिंग या ऐसी कोई भी चीज़ जिसे आप किसी अजनबी की हार्ड डिस्क पर कॉपी होते नहीं देखना चाहते, उसके लिए यह नहीं है। यह टूल पूरी पाइपलाइन (फ़ाइल चयन, डिकोड, वेवफ़ॉर्म रेंडर, ट्रिम, पुनः एनकोड, डाउनलोड) आपके ब्राउज़र में स्थानीय रूप से चलाता है। कोई अपलोड नहीं, कोई API कॉल नहीं, कोई लॉग एंट्री नहीं। आप ट्रिम करते समय DevTools की Network टैब खोलकर सत्यापित कर सकते हैं: कोई भी आउटगोइंग अनुरोध ऑडियो डेटा नहीं ले जा रहा है। FFmpeg WebAssembly बंडल एक बार लोड होने के बाद, आप पेज को ऑफ़लाइन (एयरप्लेन मोड) कर सकते हैं और टूल फिर भी काम करता है, जो सबसे मज़बूत अनुभवजन्य प्रमाण है कि कुछ भी अपलोड नहीं हो रहा।
अक्सर पूछे जाने वाले प्रश्न
मैं किन फ़ॉर्मैट को आयात और निर्यात कर सकता हूँ?
इनपुट: MP3, WAV, OGG (Vorbis), AAC, FLAC, M4A, यानी जो भी आपके ब्राउज़र का decodeAudioData पढ़ सके। आधुनिक ब्राउज़र इन सबको कवर करते हैं। आउटपुट: MP3 (LAME वैरिएबल बिटरेट ~190 kbps, संगीत के लिए स्वीट स्पॉट), WAV (16-बिट लीनियर PCM, हानि-रहित) या OGG Vorbis (~160 kbps VBR, पारदर्शी गुणवत्ता और पेटेंट-मुक्त)। एनकोडिंग और डिकोडिंग दोनों आपके ब्राउज़र में ffmpeg.wasm के माध्यम से चलते हैं, इसलिए कोई सर्वर कभी शामिल नहीं होता।
क्या फ़ाइल आकार की कोई सीमा है?
सर्वर-साइड कोई सीमा नहीं है क्योंकि कोई अपलोड ही नहीं होता। व्यावहारिक छत आपके डिवाइस की उपलब्ध मेमोरी है: वेवफ़ॉर्म प्रदर्शन के लिए फ़ाइल को JavaScript Float32Array में डिकोड करना पड़ता है, जिसका मतलब है कि 4 मिनट के मोनो 44.1 kHz स्रोत को प्रसंस्करण के दौरान लगभग 42 MB RAM चाहिए। लगभग 100 MB तक की फ़ाइलें सामान्य लैपटॉप पर आराम से चलती हैं; लंबी फ़ाइलें (बहु-घंटे के पॉडकास्ट, पूरे एल्बम) निम्न-स्तरीय मोबाइल पर धीमी हो सकती हैं या विफल हो सकती हैं। यदि कोई लोड फ़्रीज़ हो जाए, तो छोटी फ़ाइल आज़माएँ या खंडों में ट्रिम करें।
क्या ट्रिमिंग ऑडियो गुणवत्ता घटाती है?
WAV आउटपुट के लिए: नहीं, WAV हानि-रहित है, इसलिए ट्रिम किया गया क्षेत्र ट्रिम बिंदुओं के बीच के स्रोत नमूनों से बिट-दर-बिट समान है। MP3 और OGG आउटपुट के लिए: हानि-युक्त परिमाणीकरण की एक छोटी अतिरिक्त पीढ़ी जोड़ी जाती है क्योंकि स्रोत को पुनः एनकोड किया जा रहा है। यहाँ इस्तेमाल की गई एनकोडर सेटिंग्स (MP3 के लिए LAME VBR ~190 kbps, OGG के लिए libvorbis गुणवत्ता 5 ≈ 160 kbps) उस सीमा से बहुत ऊपर हैं जिसे अधिकांश श्रोता समझ सकते हैं। यदि आप बाद में ट्रिम किए गए क्लिप को पुनः संपादित करने की योजना बना रहे हैं, तो WAV चुनें; यदि आप वितरण के लिए छोटी फ़ाइल चाहते हैं, तो MP3 या OGG।
क्या यह फ़ेड इन / फ़ेड आउट का समर्थन करता है?
नहीं, ट्रिम दोनों छोरों पर एक तीखा कट है। फ़ेड, मल्टी-ट्रैक संपादन, इफ़ेक्ट या मास्टरिंग के लिए Audacity (open-source, मुफ़्त, क्रॉस-प्लेटफ़ॉर्म, 28 मई 2000 को Carnegie Mellon में जारी) या Adobe Audition का उपयोग करें। यह टूल "मुझे बस एक साफ़-सुथरा कट चाहिए" के लिए सही आकार है; किसी भी अधिक विस्तृत चीज़ के लिए, असली DAW ही सही उपकरण है।
वेवफ़ॉर्म केवल एक चैनल क्यों दिखाता है?
वेवफ़ॉर्म पहले चैनल (स्टीरियो फ़ाइल में बायाँ चैनल) को प्रति पिक्सेल कॉलम एक एनवेलप के रूप में खींचता है। दोनों चैनलों को विभिन्न रंगों में खींचना स्क्रीन स्पेस को दोगुना कर देगा या वेवफ़ॉर्म्स को ओवरलैप करना पड़ेगा, ये दोनों ही त्वरित स्क्रबिंग UI के लिए एकल-चैनल प्रदर्शन से अधिक शोरगुल वाले हैं। ट्रिम स्वयं सभी चैनल बनाए रखता है, FFmpeg उन्हें स्रोत से जैसा है वैसा कॉपी करता है, इसलिए स्टीरियो रिकॉर्डिंग आउटपुट पर भी स्टीरियो रहती है, भले ही केवल-दाएँ-चैनल वाला विवरण (एक हार्ड-राइट-पैन्ड डिटेल) चित्र में नहीं दिखे।
क्या मेरी ऑडियो फ़ाइलें अपलोड हो रही हैं?
नहीं। हर चरण (फ़ाइल चयन, डिकोड, वेवफ़ॉर्म रेंडर, ट्रिम, पुनः एनकोड, डाउनलोड) JavaScript और ffmpeg.wasm के माध्यम से आपके ब्राउज़र में स्थानीय रूप से चलता है। कोई अपलोड नहीं, कोई API कॉल नहीं, कोई लॉग एंट्री नहीं। आप ट्रिम करते समय DevTools की Network टैब खोलकर सत्यापित कर सकते हैं। ffmpeg.wasm बंडल एक बार लोड होने के बाद, आप पेज को ऑफ़लाइन कर सकते हैं और टूल फिर भी काम करता है, जो सबसे मज़बूत प्रमाण है कि कुछ भी अपलोड नहीं हो रहा। वॉइस मेमो, मीटिंग रिकॉर्डिंग, मेडिकल डिक्टेशन या ऐसा कोई भी ऑडियो जिसे आप अजनबी की हार्ड डिस्क पर कॉपी होते नहीं देखना चाहते, उसके लिए सुरक्षित।