Konverter Word ke PDF

Konversi berkas Word (.docx) Anda menjadi PDF secara instan. Tidak perlu pendaftaran. Berkas Anda tidak pernah meninggalkan perangkat Anda.

100% sisi klien · file Anda tidak pernah meninggalkan perangkat
Letakkan berkas Word di sini atau klik untuk menelusuri

Mendukung .docx · hingga 25 MB

Catatan: format kompleks seperti tabel, gambar, dan kolom mungkin disederhanakan selama konversi.

Cara kerja

  1. Unggah berkas Word: letakkan atau pilih berkas .docx untuk dikonversi.
  2. Konfigurasikan opsi: pilih ukuran halaman dan margin yang diinginkan.
  3. Konversi: klik «Konversi ke PDF» untuk menghasilkan PDF Anda. Konversi terjadi secara instan di peramban Anda.

Mengapa mengonversi ke PDF?

PDF adalah format dokumen universal. Mengonversi dokumen Word ke PDF memastikan format yang konsisten di semua perangkat dan sistem operasi, membuat dokumen hanya-baca untuk menghindari modifikasi yang tidak disengaja, mengurangi ukuran berkas, dan ideal untuk berbagi, mengarsipkan, dan pengiriman profesional. PDF kompatibel di mana saja dan mempertahankan format aslinya.

Apa sebenarnya makna «DOCX ke PDF»

Sebuah file `.docx` bukan dokumen tunggal seperti tampilannya di Word. File ini adalah arsip ZIP (wadah Open Packaging Conventions yang didefinisikan ISO/IEC 29500-2) yang menampung sebuah pohon berkas XML, gambar tersemat, dan metadata relasi. Teks utama dokumen tinggal di word/document.xml sebagai markup WordprocessingML; gaya paragraf di word/styles.xml; penomoran daftar di word/numbering.xml; gambar tersemat di word/media/. Ganti nama `.docx` mana pun menjadi `.zip` dan ekstrak untuk melihat strukturnya dengan editor teks. Format ini diperkenalkan bersama Microsoft Office 2007, distandardisasi sebagai ECMA-376 pada Desember 2006 dan sebagai ISO/IEC 29500 pada 2008, dan hari ini menjadi format Word default yang digunakan ratusan juta penulis.

Sebuah PDF (Portable Document Format) menggambarkan paradigma sebaliknya: halaman bertata letak tetap dengan glif pada koordinat tepat, font tersemat, dan posisi mutlak. Bila DOCX berbasis aliran (teks mengatur ulang aliran saat ukuran halaman, margin, atau font berubah), PDF berbasis posisi piksel (setiap karakter menempati satu titik tertentu di sistem koordinat halaman). Konversi di antara keduanya secara struktural adalah penerjemahan antar-paradigma: format penulisan yang fleksibel berubah menjadi format penyajian yang dibekukan. Setiap alat konversi, baik Microsoft Word sendiri, konverter tanpa antarmuka LibreOffice, mesin awan Smallpdf, atau alat peramban ini, menghadapi celah inheren yang sama: sumber menggambarkan niat, tujuan menggambarkan tampilan, dan niat harus dikomit ke tampilan tertentu selama konversi.

Pendekatan konversi yang berbeda menerima kompromi berbeda di hadapan celah itu. «Simpan sebagai PDF» milik Word menggunakan mesin render yang sama dengan yang menampilkan dokumen di layar, sehingga konversi pada dasarnya adalah «merender ke permukaan PDF alih-alih permukaan layar»; ketepatan luar biasa dan teks dalam keluaran dapat dipilih. Layanan awan biasanya memakai LibreOffice di sisi server atau mesin berbasis kepemilikan; ketepatan tinggi, teks dapat dipilih, berkas terunggah. Alat peramban ini memakai jalur berbeda (dijelaskan di bagian berikut) yang mengoptimalkan untuk privasi dan jangkauan (peramban apa pun, perangkat apa pun, tanpa pemasangan, tanpa unggahan) dan menerima penalti ketepatan sebagai gantinya. Tidak ada pendekatan yang secara universal terbaik; masing-masing cocok untuk alur kerja yang berbeda.

Cara alat ini bekerja di balik layar

Konversi berjalan sepenuhnya di peramban Anda melalui jalur tiga tahap: mammoth.js mengurai DOCX menjadi HTML semantik, html2canvas (dipanggil oleh html2pdf.js) melukis HTML itu pada elemen `<canvas>` di luar layar menggunakan primitif render peramban itu sendiri, dan jsPDF (juga dipanggil oleh html2pdf.js) membungkus canvas sebagai data gambar JPEG, meletakkannya pada halaman PDF, dan menambahkan pemutus halaman pada batas yang tersirat dari ukuran halaman dan margin yang dikonfigurasi. PDF keluaran adalah rangkaian gambar bitmap satu halaman penuh, satu atau lebih per halaman sumber, ditambah header metadata PDF.

Konsekuensi penting dari jalur ini layak dinyatakan secara jujur sejak awal: PDF keluaran berbasis bitmap, bukan berbasis teks. Karakter yang terlihat di tubuh PDF adalah piksel di dalam sebuah gambar, bukan operator pemosisi teks dengan data font tersemat. Secara praktis, ini berarti: pencarian dalam PDF tidak akan menemukan kata; salin-tempel dari tubuh halaman tidak menghasilkan apa-apa yang berguna; pembaca layar tidak dapat membaca konten sebagai teks; OCR diperlukan jika PDF dialirkan ke alat pengolah teks selanjutnya. Untuk alur di mana salah satu hal ini penting (penemuan hukum, pengajuan aksesibilitas, arsip dokumen yang ditujukan untuk pencarian, apa pun yang akan diurai perangkat lunak), alat yang tepat adalah «Berkas → Simpan sebagai PDF» di Microsoft Word atau «Berkas → Ekspor sebagai PDF» di LibreOffice; keduanya menghasilkan PDF berbasis teks dari sumber DOCX dengan teks yang dapat dipilih, dicari, dan diakses pembaca layar. Tujuan alat ini adalah menghantarkan PDF yang bersih secara visual dari dokumen Word tanpa pernah mengunggah dokumen ke mana pun; keluaran bitmap adalah biaya jaminan privasi itu.

Saat Anda memilih `.docx`, File API peramban menyerahkan byte ke mammoth.js. mammoth memperlakukan DOCX sebagai paket OPC, mengambil word/document.xml, dan menelusuri pohon WordprocessingML: `<w:p>` menjadi `<p>`, `<w:tbl>` menjadi `<table>`, run berhuruf tebal/miring menjadi markup sejajar, hyperlink menjadi `<a>`, gambar tersemat di `word/media/` menjadi tag `<img>` sejajar berkode base64. Alat ini lalu merender HTML di dalam wadah DOM tersembunyi, menerapkan ukuran halaman dan margin yang dipilih sebagai CSS, dan memanggil html2pdf pada wadah itu. html2pdf menelusuri wadah, membaginya menjadi halaman virtual pada batas halaman CSS, memanggil html2canvas pada setiap potongan seukuran halaman, dan menyusun bitmap canvas yang dihasilkan menjadi dokumen jsPDF. Seluruh jalur tidak membuat permintaan jaringan apa pun setelah pemuatan awal pustaka.

Tiga pustaka di balik konversi

mammoth.js adalah pengurai DOCX. Dibuat oleh Michael Williamson di bawah lisensi BSD-2-Clause dan dipelihara di GitHub di mwilliamson/mammoth.js. Filosofi desainnya, yang dinyatakan Williamson sendiri, adalah bahwa konversi harus melestarikan konten semantik (paragraf, judul, daftar, tabel, catatan kaki, hyperlink, gambar tersemat) alih-alih pemformatan langsung (font spesifik, ukuran, warna, jarak). Sang penulis berargumen bahwa dokumen berpindah antar-konteks (Word, web, ePub, PDF) dan gaya visual yang cocok untuk satu konteks jarang cocok untuk yang lain; membawa struktur semantik lebih berguna daripada membawa tampilan persis. Bundel peramban berukuran sekitar 600 KB termini.

jsPDF adalah penulis PDF. Dibuat oleh James Hall (GitHub: MrRio) pada 2010, kini dipelihara bersama yWorks GmbH, di bawah lisensi MIT, di GitHub di parallax/jsPDF. jsPDF dapat menulis PDF dari teks, grafik vektor, gambar, dan canvas HTML; di alat ini ia mengonsumsi bitmap canvas dari html2canvas dan menyusunnya menjadi halaman PDF. html2canvas, oleh Niklas von Hertzen (lisensi MIT), adalah perender HTML-ke-canvas yang melukis simpul DOM pada `<canvas>` menggunakan CSS terkomputasi setiap elemen. html2pdf.js oleh Erik Koopmans (lisensi MIT) adalah perekatnya: ia mengoordinasi html2canvas dan jsPDF, menangani pemberian halaman, memaparkan API konfigurasi yang bersih, dan mengemas semuanya menjadi satu bundel berukuran sekitar 350 KB termini.

Total jejak pemuatan pertama sekitar 950 KB. Kedua pustaka di-cache oleh peramban setelah kunjungan pertama, jadi kunjungan berikutnya seketika dari sudut pandang jaringan. Keempat proyek (mammoth.js, html2canvas, jsPDF, html2pdf.js) berlisensi sumber terbuka MIT atau BSD, dan telah dipasang di puluhan ribu proyek produksi. Jalur ini sudah matang, dipahami dengan baik, dan teruji medan untuk kasus penggunaannya: konversi DOCX ke PDF dengan ketepatan visual tanpa render di sisi server.

Sejarah singkat DOCX dan standar OOXML

Alur dunia nyata yang mendorong konversi Word ke PDF

Jebakan umum dan artinya

Privasi: dokumen tetap di perangkat Anda

Setiap layanan cloud besar untuk Word ke PDF (Smallpdf, iLovePDF, Adobe Acrobat Online, PDF24, Sejda, Soda PDF) mengunggah berkas Anda ke server operator, menguraikannya di sisi server menggunakan LibreOffice atau mesin berbasis kepemilikan, merender PDF, dan mengirimkannya kembali sebagai unduhan. Implikasi privasinya tidak sepele karena dokumen Word secara rutin bersifat pribadi atau sensitif: CV dan surat lamaran berisi alamat rumah, nomor telepon, dan riwayat pekerjaan; surat lamaran dan esai pribadi berisi pengungkapan diri yang jujur; formulir SDM berisi ekspektasi gaji; kontrak berisi syarat komersial; surat catatan medis berisi informasi kesehatan terlindungi; draf hukum berisi konten yang dilindungi rahasia pengacara-klien. Penyedia besar menerbitkan kebijakan privasi yang berjanji menghapus dalam satu atau dua jam dan mengenkripsi saat transit dengan TLS, dan yang terbesar memegang sertifikasi ISO/IEC 27001 dan keselarasan dengan GDPR. Mereka memiliki alasan komersial kuat untuk menepati komitmen tersebut. Tetapi «dihapus dalam satu jam» bukanlah «tidak pernah dilihat»: selama satu jam itu, konten berkas berada di infrastruktur mereka, dapat diakses oleh proses atau orang mana pun dengan izin yang sesuai, dan terlihat di log dan cadangan sesuai retensi yang berlaku.

Konverter ini tidak mengunggah apa pun. mammoth.js dan html2pdf.js sepenuhnya berjalan di tab peramban Anda; byte berkas dibaca oleh File API, diproses di JavaScript, dan PDF keluaran dikembalikan sebagai unduhan Blob. Anda dapat memverifikasi ketiadaan unggahan dengan membuka alat pengembang peramban di tab Jaringan sebelum mengklik Konversi: tidak ada permintaan yang dibuat dengan konten berkas Anda. Lalu lintas jaringan satu-satunya adalah unggahan sekali pakai dari CDN dari kedua pustaka pada kunjungan pertama (sekitar 950 KB total termini), yang terjadi sekali lalu tetap di cache peramban. Aktifkan mode pesawat setelah halaman dimuat dan konverter tetap bekerja pada berkas lokal. Pertukarannya, seperti dijelaskan di bagian cara alat ini bekerja, adalah PDF keluaran berbasis bitmap: kehilangan kemampuan pilih dan cari teks yang dipertahankan konverter sisi-server. Untuk sebagian besar alur pribadi Word ke PDF (CV, surat lamaran, memo internal, draf kontrak, formulir lamaran), keluaran bitmap sudah baik dan jaminan privasi sepadan dengan pertukarannya. Untuk dokumen yang memerlukan teks dapat dipilih di keluaran, jawaban yang tepat adalah «Simpan sebagai PDF» milik Word atau «Ekspor sebagai PDF» milik LibreOffice, keduanya juga offline dan pribadi jika dokumen tidak perlu meninggalkan mesin lokal.

Ketika alat lain adalah pilihan yang tepat

Fitur

Pertanyaan yang sering diajukan

Format Word apa yang didukung?

Konverter ini mendukung berkas .docx (Microsoft Word 2007 dan yang lebih baru). Berkas .doc lama tidak didukung; Anda dapat mengonversinya menjadi .docx di Microsoft Word lalu menggunakan alat ini.

Apakah format saya akan dipertahankan?

Sebagian besar format dipertahankan, termasuk font, ukuran, warna, dan tata letak dasar. Namun, elemen kompleks seperti tabel lanjutan, tata letak multi-kolom, dan objek tertanam mungkin disederhanakan atau disesuaikan selama konversi.

Apakah dokumen Word saya dikirim ke server?

Tidak. Semua konversi terjadi secara lokal di peramban Anda melalui pustaka Mammoth dan html2pdf. Berkas Word Anda tidak pernah meninggalkan perangkat Anda, untuk privasi dan keamanan total.

Bisakah saya mengonversi beberapa berkas sekaligus?

Alat ini mengonversi satu berkas Word pada satu waktu. Untuk setiap konversi, cukup unggah berkas .docx baru dan konversikan.

Berapa batas ukuran berkas?

Berkas hingga 25 MB didukung. Berkas yang sangat besar mungkin membutuhkan waktu lebih lama tergantung pada memori yang tersedia di peramban Anda.

Bisakah saya menyesuaikan margin dan ukuran halaman?

Ya. Sebelum mengonversi, Anda dapat memilih ukuran halaman (A4 atau Letter) dan lebar margin (Normal, Sempit, atau Lebar).

Pertanyaan yang lebih sering diajukan

Mengapa teks di PDF tidak dapat dipilih?

Alat ini menghasilkan PDF berbasis bitmap: ia merender dokumen Word menjadi HTML, melukis HTML itu pada canvas di luar layar menggunakan peramban, lalu menyematkan canvas sebagai gambar ke dalam PDF. Karena itu PDF keluaran berisi foto halaman, bukan karakter dengan posisi. Salin-tempel dari tubuh halaman tidak memberikan apa pun yang berguna, dan fungsi cari dalam PDF tidak akan menemukan kata. Untuk alur yang membutuhkan teks dapat dipilih (penemuan hukum, basis data riset, aksesibilitas), gunakan «Berkas → Simpan sebagai PDF» di Microsoft Word atau «Berkas → Ekspor sebagai PDF» di LibreOffice; keduanya menghasilkan PDF berbasis teks dari sumber DOCX.

Mengapa fontnya berbeda dari dokumen Word asli saya?

mammoth.js, pustaka yang alat ini gunakan untuk mengurai DOCX, dengan sengaja berfokus pada konten semantik (paragraf, judul, daftar, tabel) alih-alih pemformatan langsung (font spesifik, ukuran persis, warna). Peramban merender HTML yang dihasilkan menggunakan font yang Anda pasang secara lokal. Jika dokumen Word Anda menggunakan font perusahaan atau merek kustom yang hanya ada di mesin kerja Anda, PDF akan tampil dalam font fallback peramban (biasanya sans-serif generik). Untuk menjaga font, pasang font yang sama di perangkat Anda, atau gunakan «Simpan sebagai PDF» milik Word, yang menyematkan font yang dirujuk dokumen Anda.

Apakah alat ini bekerja offline?

Ya, setelah kunjungan pertama. Pustaka-pustaka (mammoth sekitar 600 KB, html2pdf sekitar 350 KB) dimuat sekali dari CDN lalu di-cache oleh peramban. Kunjungan berikutnya ke konverter bekerja sepenuhnya offline, selama cache peramban tidak dibersihkan di antaranya. Konversi itu sendiri sejak awal tidak butuh jaringan; hanya pemuatan awal pustaka yang butuh. Anda dapat memverifikasi dengan mengaktifkan mode pesawat setelah membuka halaman sekali dan mengonversi DOCX lokal.

Bisakah saya mengonversi berkas .doc lama (Word 97-2003)?

Tidak. Alat ini hanya menerima .docx (Office Open XML), format yang diperkenalkan di Word 2007. Format biner .doc lama memerlukan pengurai yang berbeda (mammoth hanya menangani .docx berbasis XML). Untuk mengonversi berkas .doc, buka dulu di Word atau LibreOffice dan Simpan sebagai .docx, lalu konversi di sini. Konversi .doc ke .docx adalah operasi satu klik di kedua alat dan mempertahankan konten.

Apakah hyperlink akan dapat diklik di PDF yang dihasilkan?

Hyperlink di dokumen sumber muncul sebagai teks yang bergaya visual (biru, bergaris bawah) di PDF tetapi tidak interaktif: karena tubuh PDF adalah gambar bitmap dari HTML yang dirender, mengklik teks tautan di pembaca PDF tidak akan menavigasikan ke mana-mana. Jika Anda perlu tautan yang dapat diklik di PDF keluaran, gunakan «Simpan sebagai PDF» milik Word (yang melestarikan anotasi tautan PDF) atau «Ekspor sebagai PDF» milik LibreOffice. Keduanya menghasilkan PDF di mana hyperlink tetap berfungsi setelah konversi.

Apakah ada padanan desktop atau baris perintah?

Ya, beberapa. Pendekatan standar sisi server dan baris perintah adalah mode tanpa antarmuka LibreOffice: soffice --headless --convert-to pdf input.docx --outdir output/ mengonversi berkas di tempat, ramah batch, tanpa perlu GUI. LibreOffice dapat dipasang di Linux, macOS, dan Windows; baris perintah yang sama bekerja di semua. Untuk keluaran piksel-identik dengan Word secara programatik, Microsoft Word + otomasi COM PowerShell di Windows adalah standar emas (membutuhkan Word terpasang). Pustaka mammoth.js dan html2pdf.js yang sama yang digunakan alat ini juga berjalan di Node.js untuk konversi berskrip tanpa peramban dengan profil ketepatan yang sama. Pandoc dengan mesin LaTeX adalah opsi lain untuk alur penerbitan akademis.

Alat terkait