Video-Schneider
Schneiden Sie Videodateien zu, indem Sie Start- und Endzeit setzen. Schneller oder präziser Modus.
Videodatei per Drag-and-Drop hier ablegen
oder klicken zum Auswählen · MP4, WebM, MOV, AVI, MKV (max. 2 GB)
So funktioniert es
- Videodatei laden: Wählen Sie eine beliebige MP4-, WebM-, MOV- oder AVI-Datei von Ihrem Gerät, kein Upload an einen Server nötig.
- Schnittpunkte setzen: Nutzen Sie die Timeline-Griffe oder geben Sie genaue Start- und Endzeiten ein, um den zu behaltenden Clip zu definieren.
- Schnitt vorab anhören und sehen: Spielen Sie das gewählte Segment ab, um den Schnitt vor dem Export zu bestätigen.
- Clip herunterladen: Exportieren Sie das geschnittene Video direkt auf Ihr Gerät im Originalformat.
Warum den Video-Trimmer nutzen?
Die meisten Videoschnitt-Apps verlangen Installation, Abonnements oder Uploads in Cloud-Server. Dieser browserbasierte Trimmer verarbeitet das Video vollständig auf Ihrem Gerät über WebCodecs und FFmpeg.wasm, Ihr Material verlässt Ihren Rechner nie. Ideal, um schnell Intros und Outros zu schneiden, Clips für Social Media zu isolieren, unerwünschte Abschnitte aus Aufnahmen zu entfernen und vor dem Teilen zuzuschneiden. Keine Qualitätseinbußen durch Neukodierung, sofern Sie kein anderes Ausgabeformat wählen, und keine Größenlimits außer dem verfügbaren Gerätespeicher.
Unterstützte Formate
- Eingabe: MP4, WebM, MOV, AVI, MKV und weitere gängige Videoformate
- Ausgabe: MP4 (H.264), WebM, optimiert für das Teilen im Web
- Datenschutz: 100 % clientseitig, Dateien verlassen Ihren Browser nie
- Präzision: bildgenaues Schneiden mit Millisekunden-Steuerung von Start und Ende
Schneiden, Kürzen, Teilen, und warum die Wörter wichtig sind
In der Umgangssprache sind «kürzen», «schneiden» und «teilen» austauschbar. In Video-Werkzeugen beschreiben sie drei verschiedene Operationen. Eine Kürzung entfernt Inhalt vom Anfang und/oder vom Ende und behält alles in der Mitte. Ein Schnitt in der editorischen Terminologie ist die Grenze zwischen zwei benachbarten Aufnahmen in einem fertigen Schnitt. Eine Teilung nimmt einen Clip und teilt ihn an einem gewählten Punkt in zwei Clips. Aus Sicht des Nutzers führt dieses Tool eine Kürzung durch, Sie setzen einen Anfang und ein Ende, und es behält, was dazwischen liegt.
Die interessante Frage ist, wie es die unerwünschten Bytes entfernt. Zwei grundlegend verschiedene Ansätze produzieren verschiedene Dateien.
Fast (Stream-Copy) vs Precise (Neucodierung)
Stream-Copy, der «Fast»-Modus, schaut sich das Bild überhaupt nicht an. Er öffnet den Container, findet die Byte-Bereiche, die dem angeforderten Zeitfenster entsprechen, kopiert diese Bytes wortwörtlich in einen neuen Container, korrigiert den Index und die Timestamps und schreibt das Ergebnis. Es gibt keine Decodierung, keine Neucodierung, keinen Qualitätsverlust. Auf einer modernen Maschine kann eine 500-MB-H.264-Datei auf diese Weise in weit unter einer Sekunde gekürzt werden, weil die Arbeit im Wesentlichen Datei-I/O ist, nicht Arithmetik. Der Haken: Die Kopier-Operation kann nur an bestimmten Bildern beginnen und enden, speziell an I-Frames: und diese sind nicht notwendigerweise dort, wo Sie gezeigt haben. Der Anfang des resultierenden Clips kann also vorwärts oder rückwärts irgendwo zwischen null und zehn Sekunden verschoben sein, abhängig von den Codec-Einstellungen, mit denen die Datei ursprünglich codiert wurde.
Die Neucodierung, «Precise»-Modus, decodiert den gesamten betroffenen Abschnitt zurück zu rohen Pixeln, verwirft die Bilder vor dem angeforderten Anfang und nach dem angeforderten Ende und codiert den Rest neu. Dies erzeugt einen Clip, der genau am gewählten Bild beginnt und endet (bildgenau, in industrieller Terminologie) zum Preis einer vollständigen Codierung. Eine vollständige Codierung ist hundert- oder tausendmal langsamer als eine Stream-Copy und führt eine Generation Kompressionsverlust ein, weil verlustbehaftete Codecs nicht idempotent sind: Codieren, Decodieren und Neucodieren desselben Bildes gibt Ihnen nicht genau dasselbe Bild zurück. Der Verlust ist bei hohen Bitraten klein, aber nicht null, und er akkumuliert sich, wenn dieselbe Datei wiederholt gekürzt wird.
Der Fast-Pfad ist korrekt für 95% der Fälle, in denen der Nutzer Intros, Outros oder grobes Anfangs- und Endmaterial entfernt und sich nicht darum kümmert, ob der Schnitt eine halbe Sekunde von dort entfernt ist, wo er gezeigt hat. Der Precise-Pfad ist das richtige Werkzeug, wenn der Schnitt auf ein bestimmtes Bild landen muss, eine Pointe, ein Soundeffekt, eine Sync-Marke für eine nachgelagerte Bearbeitung.
I-Frames, P-Frames, B-Frames und das GOP
Jeder moderne Video-Codec (H.264, H.265 (HEVC), VP9, AV1) komprimiert Video, indem er die Tatsache ausnutzt, dass aufeinanderfolgende Bilder fast dasselbe Bild sind. Anstatt jedes Bild unabhängig zu codieren, codiert der Codec einen kleinen Bruchteil von Bildern vollständig und den Rest als Unterschiede zu ihren Nachbarn. Die vollständigen Bilder sind I-Frames (intra-codiert). Die Differenz-Bilder gibt es in zwei Varianten: P-Frames (nur aus früheren Bildern vorhergesagt) und B-Frames (biprediktiv codiert, sie können sowohl frühere als auch spätere Bilder referenzieren). Die Sequenz I, dann ein Lauf von P- und B-Bildern, dann ein weiteres I, wird als Group of Pictures oder GOP bezeichnet. Innerhalb eines GOP kann kein Bild ohne Bezug auf das I-Frame am Anfang decodiert werden. Zwischen GOPs gibt es keine Abhängigkeit: Ein Player kann an jedem beliebigen I-Frame in die Datei einsteigen und von dort aus mit dem Decodieren beginnen.
Deshalb ist Stream-Copy-Kürzung auf Keyframe-Grenzen beschränkt. Um eine neue Datei an einem Nicht-I-Frame zu starten, müssten Sie das I-Frame am Anfang des GOP decodieren, dann jedes P- und B-Frame bis zu Ihrem gewählten Punkt decodieren und dann mit dem Schreiben beginnen, was genau das ist, was der Precise-Pfad tut. Eine typische H.264-Datei verwendet eine GOP-Länge von zwei bis vier Sekunden. FFmpegs libx264 hat einen Standard von etwa 250 Frames (~10 Sekunden bei 25 fps, ~8,3 Sekunden bei 30 fps). Streaming-Anbieter verkürzen das auf zwei Sekunden, um mit HLS- und DASH-Segmentgrenzen abzustimmen. H.265 toleriert längere GOPs effizienter und wird oft auf vier bis zehn Sekunden konfiguriert. VP9 (libvpx) hat einen Standard für maximale Keyframe-Distanz von 240 Frames. AV1 landet typischerweise im Bereich von 2-6 Sekunden. Die praktische Implikation: Ein Nutzer, der einen Schnitt bei Minute 1 Sekunde 30 anfordert, kann, je nachdem, womit die Datei ursprünglich codiert wurde, mit einem Stream-Copy-Ergebnis enden, das irgendwo zwischen Minute 1 Sekunde 24 und Minute 1 Sekunde 32 beginnt.
Eine kurze Geschichte von FFmpeg
FFmpeg wurde am 20. Dezember 2000 von Fabrice Bellard gestartet, dem französischen Informatiker, der zuvor den QEMU-Virtualisierer und den TCC-C-Compiler geschrieben hatte. Er committete unter dem Pseudonym Gérard Lantau. Der Name kommt von «FF» für fast forward und «mpeg» für die Familie der Codecs, für die er ursprünglich entworfen wurde. Die Architektur trennte von Anfang an Codec-Implementierung (libavcodec) von Container-Parsing (libavformat), weshalb FFmpeg im Laufe der Jahre so leicht erweitert werden konnte. Bellard übergab die Wartung 2004 an Michael Niedermayer. Das Projekt überlebte einen berühmten Fork im Jahr 2011, als sich eine Gruppe von Entwicklern aufgrund von Governance-Streitigkeiten in ein Projekt namens Libav abspaltete; die beiden Projekte vereinigten sich bis 2018 wieder im Geist (wenn auch nicht formal), wobei die meisten Verbesserungen von Libav in FFmpeg zurück eingespeist wurden.
Heute ist FFmpeg die stille Infrastruktur unter einem enormen Bruchteil des weltweiten Videos, YouTube, Netflix, VLC, OBS Studio, Audacity, HandBrake, Plex und die meisten professionellen Broadcast-Pipelines verwenden es irgendwo in ihrem Stack. Die aktuelle stabile Version ab 2026 liegt in der 8.x-Serie. Die Lizenz ist dual LGPL-2.1-or-later oder GPL-2.0-or-later, abhängig davon, welche optionalen Komponenten beim Kompilieren aktiviert werden.
FFmpeg.wasm, FFmpeg im Browser
Im November 2020 veröffentlichte ein taiwanischer Ingenieur namens Jerome Wu: bereits bekannt für die Tesseract.js-Portierung der Tesseract OCR-Engine, die erste Version von FFmpeg.wasm, einer WebAssembly-Kompilierung von FFmpeg, die vollständig im Browser läuft. Er kündigte das Projekt am 4. November 2020 an. Bis 2026 ist das Projekt erheblich gereift, mit der aktuellen Version in der 0.12-Serie und aktiven Community-Forks. Das npm-Paket bündelt jetzt die WebAssembly-Kernbinärdatei, einen JavaScript-Wrapper, der die Nachrichtenübergabe zwischen dem Haupt-Thread und dem Worker-Thread, der das WASM ausführt, handhabt, und ein virtuelles Dateisystem, das es dem Benutzer erlaubt, Dateien mit gewöhnlichen JavaScript-Blob- und File-Objekten hinein und hinaus zu bewegen.
Das Projekt hat eine berüchtigte Anforderung, die jeden Entwickler erwischt, der es zum ersten Mal einsetzen will. FFmpeg.wasm verwendet SharedArrayBuffer, die JavaScript-API zum Teilen von Speicher zwischen dem Haupt-Thread und Worker-Threads. Nachdem die Spectre- und Meltdown-CPU-Schwachstellen 2018 offengelegt wurden, verschärften die Browser die Bedingungen: Die Seite muss mit zwei spezifischen HTTP-Headern bedient werden, Cross-Origin-Opener-Policy: same-origin und Cross-Origin-Embedder-Policy: require-corp, und jede Cross-Origin-Ressource auf der Seite muss entweder über CORS opt-in geben oder von derselben Origin kommen. Ohne diese Header ist SharedArrayBuffer undefined und FFmpeg.wasm wird nicht initialisiert. Chrome setzt das strikt durch; Firefox und Edge folgen Chrome; Safari schloss sich ab Version 15.2 an.
Containerformate
Ein Container ist die Datei-Hülle. Er codiert das Bild nicht; er verpackt codierte Bilder und Audio zusammen mit Timing und Metadaten.
- MP4 / MOV. Geschwister. MOV ist das QuickTime File Format, das Apple Anfang der 1990er definierte. 2001 übernahm die Motion Picture Experts Group eine verallgemeinerte Version der Box-Struktur von QuickTime als Basis für das ISO Base Media File Format, standardisiert als ISO/IEC 14496-12 (erste Veröffentlichung 2004). MP4, formell MPEG-4 Part 14 / ISO/IEC 14496-14 (2003), ist die bekannteste Instanziierung von ISOBMFF. Die Header-Box
mooventhält den Index (die Tabelle von Byte-Offsets und Timestamps, die der Trimmer wissen muss, um zu wissen, wo geschnitten werden soll), während diemdat-Box die tatsächlichen codierten Probendaten enthält. Die beiden sind konzeptionell trennbar, was das schnelle chirurgische Trimmen erlaubt. - WebM ist eine Teilmenge von Matroska, einem Container, der erstmals am 6. Dezember 2002 als Fork eines früheren Projekts (des Multimedia Container Format) angekündigt wurde. WebM wurde von Google am 19. Mai 2010 bei Google I/O als der offizielle Container für die offene, lizenzfreie Kombination aus VP8-Video und Vorbis-Audio gestartet. Heute trägt WebM gemeinhin VP9- oder AV1-Video und Opus-Audio. Die binäre Codierung ist EBML (Extensible Binary Meta Language).
- AVI: Audio Video Interleave, ist der älteste der Gruppe. Microsoft führte es im November 1992 als Teil von Video for Windows ein. Es ist älter als die moderne Ära des Multi-Stream-, Variable-Frame-Rate-, Modern-Codec-Videos, und das zeigt sich: B-Frame-Unterstützung ist umständlich, Audio-Sync ist über 4 GB hinaus fragil, das Indexformat ist begrenzt. Moderne Tools akzeptieren AVI als Eingabe, produzieren es aber praktisch nie als Ausgabe.
- MKV ist der vollständige Matroska-Container, von dem WebM das eingeschränkte Profil ist. Matroska unterstützt eine beliebige Anzahl von Audio-, Video-, Untertitel- und Kapitelspuren und ist der De-facto-Container für die Nicht-Streaming-Distribution hochwertiger Videos. Browser spielen rohes MKV nicht nativ ab, aber FFmpeg.wasm kann es lesen und schreiben.
Browser-Video-APIs, was tatsächlich verfügbar ist
Das HTML5 <video>-Element wurde am 28. Oktober 2014 zur W3C-Empfehlung, nach etwa einem Jahrzehnt der Entwicklung. Vor HTML5 bedeutete das Einbetten von Video Adobe Flash oder Microsoft Silverlight. Das Element selbst hat keine Bearbeitungs-API, es gibt keine video.trim(start, end)-Methode, keine video.cut(), keine eingebaute Möglichkeit, ein Segment zu extrahieren. Um etwas über Play, Pause und Seek hinaus zu tun, muss der Entwickler zu einer niedrigeren API greifen oder FFmpeg in die Seite kompilieren.
Media Source Extensions (MSE) ist eine W3C-Spezifikation, die es JavaScript ermöglicht, den Byte-Strom zu konstruieren, der das <video>-Element speist. Erreichte 2014 Candidate Recommendation; in Produktion verwendet von YouTube bereits ab September 2013 und von Netflix ab Juni 2014. Sein primärer Anwendungsfall ist adaptives Streaming (er stellt decodierte Frames nicht zur Verfügung, also kann er allein keine Neucodierung durchführen. WebCodecs ist die niedrigere Alternative) stellt JavaScript die im Browser eingebauten Video- und Audio-Codec-Implementierungen direkt zur Verfügung, mit VideoDecoder- und VideoEncoder-Schnittstellen. WebCodecs wurde offiziell in Chrome 94 am 21. September 2021 nach einem Origin-Trial in Chrome 93 ausgeliefert und hat seitdem Firefox und Safari erreicht. Der aktuelle Stand der Technik ist, dass Tools WebCodecs verwenden, wenn es verfügbar und der Codec unterstützt ist, und ansonsten auf FFmpeg.wasm zurückfallen. Dieses Tool verwendet beides.
Längenbegrenzungen von Social-Plattformen, warum Leute Trimmer öffnen
Ein großer Teil der Nachfrage nach Browser-basiertem Trimmen kommt von der Vorbereitung von Videos für den Upload auf Social-Plattformen, jede mit ihrer eigenen maximalen Länge:
- TikTok: Uploads bis zu 10 Minuten für Videos, die in der App aufgenommen wurden.
- Instagram Reels: Uploads bis zu 20 Minuten aus der Kamerarolle, aber der Algorithmus hört auf, Reels, die länger als ~3 Minuten sind, aktiv Nicht-Followern zu empfehlen, die praktisch effektive Obergrenze liegt näher an dieser Zahl.
- YouTube Shorts: ursprünglich auf 60 Sekunden begrenzt; am 15. Oktober 2024 auf 3 Minuten erhöht.
- X (Twitter): Nicht-Premium-Konten sind auf 140 Sekunden begrenzt. X-Premium-Abonnenten können bis zu 4 Stunden in 1080p auf Web/iOS hochladen, oder 2 Stunden in 1080p, bevor sie auf 720p herabgestuft werden. Android Premium ist unabhängig davon auf 10 Minuten begrenzt.
- LinkedIn: bis zu 10 Minuten vom Mobilgerät, 15 Minuten vom Desktop, mit einer Dateigrößenbegrenzung von 5 GB.
Diese Zahlen verschieben sich ständig, wenn Plattformen iterieren, aber das allgemeine Muster «Plattform X wird Ihren Upload ablehnen, wenn er Y Minuten überschreitet» ist dauerhaft und ist einer der häufigsten Gründe, warum ein Endbenutzer überhaupt einen Trimmer öffnet.
Wann ein Desktop-Editor das bessere Werkzeug ist
Für Benutzer, für die ein Browser-Trimmer unzureichend ist, dreht sich das professionelle Ökosystem um einige etablierte Desktop-Anwendungen. Apple ProRes ist eine Familie von Zwischen-Codecs, die Apple im April 2007 zusammen mit Final Cut Studio 2 einführte, für die Bearbeitung, nicht für die Auslieferung konzipiert. Final Cut Pro, ursprünglich 1999 von Macromedia veröffentlicht und ein Jahr später von Apple übernommen, wurde am 21. Juni 2011 als Final Cut Pro X neu gebaut und neu veröffentlicht; nur macOS und der Standard-Editor in einem großen Teil der Dokumentations- und Broadcast-Welt. DaVinci Resolve, ursprünglich ein High-End-Farbkorrektursystem, wurde 2009 von Blackmagic Design übernommen und schrittweise zu einer vollständigen Suite für Bearbeitung/Audio-Post/Visuelle-Effekte/Farbkorrektur umgebaut, verfügbar für macOS, Windows und Linux, mit einer kostenlosen Basisversion, die die Ökonomie des Bearbeitungsmarktes erheblich verändert hat. Adobe Premiere Pro ist der dritte große Akteur und dominiert einen großen Teil der Film- und TV-Industrie. Keine davon ist geeignet für den Benutzer, der die ersten zehn Sekunden eines mit dem Telefon aufgenommenen Clips entfernen will, bevor er ihn auf TikTok postet, was genau die Lücke ist, die ein Browser-Trimmer füllt.
Warum «kein Upload» hier speziell wichtig ist
Die wichtigste Eigenschaft eines Browser-basierten Video-Trimmers ist, dass die Datei die Maschine des Benutzers nicht verlässt. Die Videodaten werden von einer File-Eingabe direkt in den JavaScript-Speicher geladen, von WebAssembly innerhalb des Browser-Prozesses verarbeitet, und das Ergebnis wird als Download angeboten. Es gibt kein Hochladen, keinen Dritten, der die Datei lesen kann, keine Cloud-Rechnung, die mit der Benutzeranzahl skaliert, keine Datenaufbewahrungspolitik, die geschrieben oder geprüft werden muss. Für sensible Inhalte (aufgezeichnete Meetings, persönliches Material, alles, was aus rechtlichen oder vertraglichen Gründen nicht zu einem Dritten hochgeladen werden könnte) ist das die einzige Architektur, die Sinn ergibt.
Der Nachteil ist, dass der Benutzer die Rechenkosten trägt. Ein Trimmer, der auf einer Serverfarm läuft, kann einen 4K-Clip in wenigen Sekunden neu codieren, weil er Zugang zu GPU-Codierungshardware hat; dieselbe Operation in FFmpeg.wasm, das in Software auf einer Laptop-CPU läuft, kann ein oder zwei Minuten dauern. Der Fast-Pfad (Stream-Copy) umgeht das weitgehend, indem er das Codieren ganz vermeidet, weshalb er der richtige Standard für fast jeden Gelegenheits-Trimming-Anwendungsfall ist. Der Precise-Pfad (Neucodierung) ist der richtige Standard nur, wenn der Benutzer explizit Bildgenauigkeit auf Kosten des Wartens benötigt.
Weitere Fragen
Warum beginnt mein Fast-Trimm früher oder später, als ich angefordert habe?
Weil der Fast-Modus (Stream-Copy) nur an einem Keyframe (I-Frame) beginnen kann, und das nächste Keyframe vor Ihrem angeforderten Anfang kann bis zu einem ganzen GOP früher sein, irgendwo zwischen 2 und 10 Sekunden, je nachdem, wie die Quelle codiert wurde. Wenn Sie den Schnitt an einem bestimmten Frame brauchen, wechseln Sie in den Precise-Modus, der neu codiert und genau am gewählten Frame landet, auf Kosten einer längeren Wartezeit und einer kleinen Generation Kompressionsverlust.
Warum ist das Audio nach meinem Fast-Trimm nicht synchron?
Üblicherweise, weil der Schnittpunkt innerhalb eines Video-GOP gelandet ist und der Audio-Frame an diesem Timestamp nicht mit einem Video-Keyframe übereinstimmt. Der Fast-Modus verschiebt den Videostart auf das nächste Keyframe, kann aber die Audio-Timestamps unverändert tragen, was einen Versatz erzeugt. Die Standard-FFmpeg-Lösung ist das Flag -avoid_negative_ts make_zero, das alle Timestamps neu basiert, sodass der erste null ist. Wenn Synchronisation kritisch ist, resampelt der Precise-Modus das Audio, um es mit dem neuen Anfang abzugleichen, und vermeidet diese Klasse von Problemen.
Kann ich in ein anderes Format als die Eingabe exportieren?
Für Formatkonvertierung ist das Video-Converter-Tool zweckspezifisch und bietet mehr Optionen. Der Trimmer ist für den gleichen-Codec, gleichen-Container-Fall optimiert (Fast-Modus bewahrt die ursprüngliche Codierung vollständig) oder für die Neucodierung in einen kleinen Satz web-freundlicher Ausgaben im Precise-Modus. Neucodierung kostet immer CPU-Zeit und eine Generation Qualitätsverlust; wenn Sie nur den Container ändern müssen, ohne das Bild neu zu codieren, ist ein ffmpeg -c copy-Äquivalent das richtige Tool.
Warum funktioniert AVI-Eingabe, aber AVI-Ausgabe nicht?
AVI ist älter als die meisten modernen Codec-Funktionen (B-Frames sind umständlich, Audio-Sync ist über 4 GB hinaus fragil, das Indexformat ist begrenzt), und moderne Tools behandeln es im Allgemeinen nur als Legacy-Eingabeformat. AVI-Eingaben werden in Ordnung gelesen; Ausgaben sind standardmäßig MP4 oder WebM, das sind die aktiv gewarteten ISOBMFF/Matroska-Familien und spielen in jedem modernen Browser und Player.