Kostenloser PDF-Metadaten-Editor
Bearbeiten Sie PDF-Metadaten, Titel, Autor, Thema, Schlüsselwörter und mehr. Läuft vollständig in Ihrem Browser.
Was sind PDF-Metadaten?
PDF-Metadaten sind Informationen über das Dokument, die nicht im sichtbaren Inhalt erscheinen. Dazu gehören Titel, Autor, Thema, Schlüsselwörter, Erstellungsdatum und weitere Eigenschaften. Diese Informationen unterstützen Dokumenten-Organisation, Auffindbarkeit und Identifizierung.
Warum PDF-Metadaten bearbeiten?
- Organisation · Sorgen Sie für konsistente Metadaten über Dokumente hinweg, für besseres Ablegen und Suchen.
- Professionalität · Stellen Sie sicher, dass Dokumente die richtigen Autor- und Titelangaben enthalten.
- SEO und Auffindbarkeit · Schlüsselwörter in den Metadaten unterstützen die Auffindbarkeit von Dokumenten.
- Eigenschaftskorrektur · Korrigieren Sie falsche oder fehlende Autor-, Titel- oder Themenangaben.
Häufige Fragen
Verändert das Bearbeiten der Metadaten den PDF-Inhalt?
Nein. Es werden nur die Metadaten geändert. Inhalt, Seiten und Formatierung des PDFs bleiben unverändert.
Kann ich Metadaten verschlüsselter PDFs bearbeiten?
Wenn ein PDF passwortgeschützt ist, können Sie seine Metadaten mit diesem Tool nicht bearbeiten. Die Datei muss zuerst entsperrt werden.
Welche Dateigrößenbeschränkung gilt?
Dieses Tool unterstützt PDFs bis zu 10 MB. Größere Dateien können länger zur Verarbeitung benötigen.
Was PDF-Metadaten eigentlich sind
Eine PDF-Datei kann Metadaten auf Dokumentebene an zwei Stellen gleichzeitig tragen. Der ursprüngliche Mechanismus, vorhanden seit PDF 1.0 (1993), ist das Document Information Dictionary (genannt „DocInfo“ oder /Info): ein Schlüssel/Wert-Objekt, das vom PDF-Trailer aus referenziert wird. PDF 1.4 (2001) ergänzte einen zweiten, reichhaltigeren Mechanismus, einen XMP-Metadatenstrom, ein XML-Paket (RDF/XML konform zu Adobes eXtensible Metadata Platform), eingebettet als Stream-Objekt, das am Dokumentkatalog hängt. XMP wurde 2012 zu einem offenen ISO-Standard (ISO 16684-1).
Die beiden Speicher sind nicht dasselbe und können sich widersprechen. Adobes Referenz und die ISO-32000-Standards sagen beide, dass XMP bevorzugt wird, wenn es vorhanden ist, und dass DocInfo als veraltetes Spiegelbild behandelt werden sollte. In ISO 32000-2 (PDF 2.0) ist das ältere DocInfo-Dictionary formal für alles abgekündigt außer CreationDate und ModDate (die Signatur-Handler weiterhin verwenden). In der Praxis liest fast jeder Reader (Adobe Acrobat, Foxit, Vorschau unter macOS, Browser-Viewer) standardmäßig DocInfo und greift nur für Felder wie das Copyright, die DocInfo nie unterstützte, auf XMP zurück.
Die Standard-DocInfo-Felder sind Title, Author, Subject, Keywords, Creator (die Anwendung, aus der das Dokument stammt, z. B. „Microsoft Word“), Producer (die Anwendung, die das eigentliche PDF erzeugt hat, z. B. „Adobe PDF Library 17.0“), CreationDate, ModDate (im PDF-Datumsformat wie D:20240315093000-04'00') und Trapped. XMP ordnet Felder in Namensräume: Dublin Cores dc:title, dc:creator, dc:rights, dc:language; XMP-MMs DocumentID, InstanceID und das Bearbeitungsprotokoll History; Konformitätsmarker für PDF/A und PDF/UA; sowie beliebige eigene Namensräume, die ein Werkzeug hinzufügen möchte. Dieser Editor stellt die meistgenutzten DocInfo-Felder direkt bereit; reine XMP-Felder erfordern einen spezialisierteren Editor.
Eine kurze Geschichte
PDF begann mit John Warnocks internem Adobe-Memo von 1991 (dem „Camelot“-Papier), das ein portables Dokumentformat vorschlug, das die visuelle Wiedergabetreue über Geräte hinweg bewahrte. Adobe lieferte PDF 1.0 mit Acrobat 1.0 im Jahr 1993; das DocInfo-Dictionary war vom ersten Tag an dabei. Im Laufe der 1990er- und frühen 2000er-Jahre ergänzte das Format Verschlüsselung, Hyperlinks, Formulare, JavaScript, Transparenz, Barrierefreiheit per Tagged PDF (PDF 1.4, 2001) und den XMP-Metadatenmechanismus (ebenfalls PDF 1.4). PDF/A (die Archivierungs-Teilmenge, die eingebettetes XMP vorschreibt und Verschlüsselung verbietet) wurde 2005 als ISO 19005-1 verabschiedet. Adobe übertrug PDF 2008 an die ISO, wo PDF 1.7 zu ISO 32000-1:2008 wurde. ISO 32000-2:2017 veröffentlichte PDF 2.0, wobei die wichtigste Metadatenänderung die Abkündigung von DocInfo zugunsten von XMP war. Die Überarbeitung von 2020 und die kostenlose Freigabe der Spezifikation durch die PDF Association im April 2023 bedeuten, dass der Standard nun frei zugänglich ist.
Das Datenschutzproblem, was PDFs preisgeben
Ein von typischer Bürosoftware erstelltes PDF verrät wesentlich mehr über seine Herkunft, als den meisten Nutzern bewusst ist. Aus einem einzigen PDF lässt sich in der Regel Folgendes extrahieren:
- Vollständiger Name des Autors. Microsoft Word schreibt
Authoraus dem Office-Konto des Nutzers oder dem bei der Installation registrierten Windows-Benutzernamen. LibreOffice schreibt den Vor-/Nachnamen des Nutzers aus den Benutzerdaten-Einstellungen. Pages unter macOS verwendet den System-Eintrag „Vollständiger Name“. Ein aus einem dieser Programme als PDF gespeichertes Dokument übernimmt den eingebetteten Wert automatisch. - Die gesamte Bearbeitungshistorie. XMPs
xmpMM:Historyzeichnet jedes Speicher- und Konvertierungsereignis mit Zeitstempel, Softwarenamen und Instanz-UUID auf und erzeugt ein teilweises Revisionsprotokoll des Dokuments. - Software-Identifikation bis hinunter zu Version und Build. Das Feld
Producerlautet typischerweise „Microsoft® Word for Microsoft 365“ oder „Adobe PDF Library 17.00.6“ oder „Skia/PDF m120“ (Chromes Druck-in-PDF). Das erstellt einen Fingerabdruck von Betriebssystem und Patch-Stand der Arbeitsstation. - Erstellungszeitstempel + Änderungszeitstempel + der Abstand dazwischen. Ein Abstand von 4 Sekunden deutet auf einen Druck-in-PDF hin; ein Abstand von 45 Minuten deutet auf umfangreiche Bearbeitung hin. Zusammen können diese feststellen, wann, wo und von wem ein Dokument verfasst wurde.
- EXIF eingebetteter Bilder. Wenn ein Bild mit EXIF-GPS-Koordinaten in ein Word- oder InDesign-Dokument gezogen und als PDF exportiert wird, behält der zugrunde liegende Bild-Stream oft die EXIF-Tags bei, einschließlich Breiten- und Längengrad. ExifTool holt sie sogar aus „eingebetteten“ Bildern heraus.
- Anmerkungen aus der Änderungsverfolgung. Aus Word mit aktiviertem „Markup anzeigen“ exportierte PDFs betten Initialen und Zeitstempel der Prüfer in Anmerkungs-Streams ein (technisch eher Inhalt als Metadaten, aber oft unsichtbar, bis ein Reader das Kommentar-Panel aufklappt).
Bemerkenswerte Fälle aus der Praxis
- Manafort-Gerichtsschriftsatz (Januar 2019): Die Verteidiger von Paul Manafort reichten ein Gerichtsdokument ein, bei dem über den Text gezeichnete PDF-Schwärzungsrechtecke verwendet wurden. Der Text selbst blieb im Content-Stream unangetastet und wurde von Reportern innerhalb von Stunden mit einfachem Kopieren und Einfügen extrahiert, wodurch Behauptungen offengelegt wurden, Manafort habe US-Umfragedaten mit einem mit dem russischen Geheimdienst verbundenen Bekannten geteilt. Die begleitenden Metadaten nannten außerdem die Maschine und Software der Anwaltskanzlei, die es erzeugt hatten.
- „Dodgy Dossier“ der britischen Regierung (Februar 2003): Das Dokument „Iraq, Its Infrastructure of Concealment, Deception and Intimidation“ hatte Bearbeitungshistorie-Metadaten, die vier Autoren nannten, darunter einen US-amerikanischen Doktoranden, dessen Abschlussarbeit von 2002 hineinkopiert worden war. Die verborgene Autorenschaftsspur des Word-Dokuments war der entscheidende Beweis.
- TSA-Sicherheitshandbuch (Dezember 2009): Die TSA veröffentlichte eine geschwärzte Fassung ihrer Standardarbeitsanweisungen zur Passagierkontrolle. Die Schwärzungen waren Bildüberlagerungen über dem Originaltext in einem PDF; der zugrunde liegende Text war extrahierbar. Das vollständige Dokument, einschließlich der Namen verbündeter Regierungen, deren Passinhaber verstärkt kontrolliert wurden, gelangte an die Öffentlichkeit.
- „Author: Name der gegnerischen Kanzlei“: wiederholte Vorfälle in Anwaltskanzleien, bei denen ausgehende PDF-Schriftsätze den Namen der gegnerischen Kanzlei im Feld
Authorenthalten, weil jemand aus einem Beweismittel-PDF in ein neues Word-Dokument kopiert hat und das Zieldokument den Autor der Quelle übernahm. Viele Kanzleien verlangen heute Words „Dokumentprüfung“ oder Acrobats „Dokument bereinigen“ vor jedem externen Versand.
Ehrlicher Geltungsbereich dieses Werkzeugs
Dieser Editor lässt Sie die Standard-DocInfo-Felder ansehen und überschreiben. Er ist wirklich nützlich, um Autorennamen vor dem externen Versand eines Dokuments zu bereinigen, falsche Titel-Metadaten zu korrigieren, die Ihr Dokumentenmanagementsystem verwirren, oder den Fingerabdruck einer Arbeitsstation aus einer Pressemitteilung zu entfernen. Es ist kein vollständiges Bereinigungswerkzeug. Im Einzelnen:
- Bild-EXIF in eingebetteten Fotos kann weiterhin GPS-Koordinaten und Kameradetails enthalten.
- Änderungsverfolgung und Prüferkommentare, die als Anmerkungen gespeichert sind, werden nicht entfernt.
- Verborgener Text unter „Schwärzungs“-Rechtecken ist weiterhin extrahierbar; ein schwarzes Rechteck über Text zu zeichnen entfernt den Text nicht aus dem Content-Stream des PDF. Das ist die häufigste Quelle versehentlicher Offenlegung.
- Das Bearbeitungsprotokoll
xmpMM:Historyim XMP-Stream wird nicht zwingend gelöscht. - Eingebettete Schriftart-Teilmengen können die ursprüngliche Arbeitsstation identifizieren, falls ungewöhnliche Schriftarten verwendet wurden.
- Drucker-Tracking-Punkte (gelbe Mikropunktmuster, die die meisten Farblaserdrucker einbetten) liegen auf Inhaltsebene und bleiben von der Metadatenbearbeitung unberührt; der Fall Reality Winner (Juni 2017) hing an diesen.
Für einen vollständigen Bereinigungsdurchlauf bei einem sensiblen Dokument sind die richtigen Werkzeuge der Befehl „Dokument bereinigen“ von Adobe Acrobat Pro, die Option -remove-metadata des quelloffenen Kommandozeilenwerkzeugs cpdf oder die Direktive -all= von ExifTool, gefolgt von einer manuellen Prüfung. Sensible Arbeitsabläufe erstellen das Dokument oft aus extrahiertem reinem Text neu, anstatt zu versuchen, das Original zu säubern.
Werkzeuge zum Ansehen von Metadaten
- Adobe Acrobat: Datei → Eigenschaften. Zeigt die DocInfo-Felder und ein separates Panel „Zusätzliche Metadaten“ für das XMP-Paket.
- ExifTool (Phil Harvey), der Goldstandard für die Kommandozeile.
exiftool file.pdfgibt alles aus;exiftool -all= file.pdfentfernt alles. - pdfinfo (Teil von poppler-utils), schneller CLI-Auszug von DocInfo plus Details auf Seitenebene.
- pdf.js / PDF.js (die Bibliothek, die Firefox zum Rendern von PDFs verwendet) stellt Metadaten über
doc.getMetadata()zum browserseitigen Lesen bereit. - pdf-lib: die JavaScript-Bibliothek, die den Bearbeitungsdurchlauf dieses Werkzeugs antreibt; stellt
setTitle(),setAuthor()usw. bereit und schreibt ein vollständig konformes PDF zurück.
Wann Sie dazu greifen würden
- Bereinigen von Autoren-/Erstellernamen, bevor Sie ein Dokument außerhalb Ihrer Organisation versenden.
- Festlegen einheitlicher Titel-Metadaten für einen Stapel von Dokumenten, die in einem Dokumentenmanagementsystem oder Bibliothekskatalog landen werden.
- Hinzufügen von Schlüsselwörtern für interne Volltextsuchsysteme, die sie als Auffindbarkeits-Boost nutzen.
- Korrigieren des falschen Titels, wenn „Speichern unter PDF“ einen irreführenden Dateinamen übernommen hat.
- Geltendmachen von Copyright / Lizenz über das Feld
Authorund (für Werkzeuge, die XMP verarbeiten)dc:rights. - Schnelle Datenschutz-Bereinigung für Routinedokumente, beachten Sie für besonders heikle Fälle jedoch den obigen Hinweis zum Geltungsbereich.
Weitere Fragen
Warum erscheinen meine Änderungen manchmal in DocInfo, aber nicht in XMP (oder umgekehrt)?
Weil PDFs beide Speicher tragen und sich diese widersprechen können. Dieser Editor schreibt nach DocInfo (das Feld, das jeder Reader prüft). XMP wird für Felder aktualisiert, die ein klares DocInfo-Äquivalent haben. Manche Viewer (insbesondere Adobe Acrobat) lesen zuerst XMP; wenn Sie nach dem Bearbeiten „veraltete“ Metadaten sehen, öffnen Sie das Dokument mit einem anderen Reader, um zu prüfen, ob das Problem nur XMP betrifft oder ob Ihr Reader lediglich die alte Version zwischenspeichert.
Zerstört dieses Werkzeug eine digitale Signatur?
Ja, fast immer. Eine digitale Signatur auf einem PDF schützt das gesamte Dokument einschließlich der Metadaten; das Ändern eines einzigen Bytes zerstört die kryptografische Verifikation der Signatur. Wenn Sie Metadaten auf einem signierten PDF bearbeiten müssen, müssen Sie entweder zuerst die Signatur entfernen (mit Erlaubnis des Unterzeichners), die Metadaten bearbeiten und es neu signieren lassen; oder die Metadatenänderungen vor dem Signieren im ursprünglichen Arbeitsablauf vornehmen.
Was ist mit PDF/A-Archivdateien?
PDF/A-Dateien haben zusätzliche XMP-Anforderungen (die Marker pdfaid:part und pdfaid:conformance sowie erforderliche Dublin-Core-Felder). Das Bearbeiten der DocInfo eines PDF/A, ohne das XMP-Paket zu aktualisieren, kann die Datei technisch aus der PDF/A-Konformität nehmen. Verwenden Sie für Archivierungs-Arbeitsabläufe einen PDF/A-fähigen Editor wie Acrobat Pro oder veraPDF.
Wie erstelle ich ein „völlig anonymes“ PDF?
Für Routinedokumente: Bearbeiten Sie hier die DocInfo, um identifizierende Felder zu leeren, und lassen Sie das Ergebnis dann durch Acrobats „Dokument bereinigen“ oder cpdf -remove-metadata laufen. Für besonders heikle Anonymisierung (Whistleblowing, Journalismus, rechtliche Offenlegung): Erstellen Sie das PDF von Grund auf neu auf einer anderen Maschine, nur mit extrahiertem reinem Text, ohne Bilder, die aus dem Original stammen. Drucken-und-erneut-Scannen funktioniert ebenfalls (die OCR-Ebene des neu gescannten PDF ist frisch erzeugt), auf Kosten von Dateigröße und Bildqualität.
Werden Daten an einen Server gesendet?
Nein. Das PDF wird von pdf-lib lokal in Ihrem Browser geparst und neu geschrieben; die geänderte Datei wird direkt auf Ihr Gerät heruntergeladen. Nichts von Ihrem PDF verlässt die Seite, nützlich, wenn das Dokument interne Autorennamen, Kundeninformationen oder vertrauliche Betreffzeilen enthält, die Sie lieber nicht zu einem Drittanbieterdienst hochladen möchten. Die pdf-lib-Bibliothek selbst wird einmal von einem öffentlichen CDN mit Subresource-Integrity-Verifikation geladen und dann zwischengespeichert.