Konverter Word ke PDF
Konversi berkas Word (.docx) Anda menjadi PDF secara instan. Tidak perlu pendaftaran. Berkas Anda tidak pernah meninggalkan perangkat Anda.
Mendukung .docx · hingga 25 MB
Cara kerja
- Unggah berkas Word: letakkan atau pilih berkas .docx untuk dikonversi.
- Konfigurasikan opsi: pilih ukuran halaman dan margin yang diinginkan.
- Konversi: klik «Konversi ke PDF» untuk menghasilkan PDF Anda. Konversi terjadi secara instan di peramban Anda.
Mengapa mengonversi ke PDF?
PDF adalah format dokumen universal. Mengonversi dokumen Word ke PDF memastikan format yang konsisten di semua perangkat dan sistem operasi, membuat dokumen hanya-baca untuk menghindari modifikasi yang tidak disengaja, mengurangi ukuran berkas, dan ideal untuk berbagi, mengarsipkan, dan pengiriman profesional. PDF kompatibel di mana saja dan mempertahankan format aslinya.
Apa sebenarnya makna «DOCX ke PDF»
Sebuah file `.docx` bukan dokumen tunggal seperti tampilannya di Word. File ini adalah arsip ZIP (wadah Open Packaging Conventions yang didefinisikan ISO/IEC 29500-2) yang menampung sebuah pohon berkas XML, gambar tersemat, dan metadata relasi. Teks utama dokumen tinggal di word/document.xml sebagai markup WordprocessingML; gaya paragraf di word/styles.xml; penomoran daftar di word/numbering.xml; gambar tersemat di word/media/. Ganti nama `.docx` mana pun menjadi `.zip` dan ekstrak untuk melihat strukturnya dengan editor teks. Format ini diperkenalkan bersama Microsoft Office 2007, distandardisasi sebagai ECMA-376 pada Desember 2006 dan sebagai ISO/IEC 29500 pada 2008, dan hari ini menjadi format Word default yang digunakan ratusan juta penulis.
Sebuah PDF (Portable Document Format) menggambarkan paradigma sebaliknya: halaman bertata letak tetap dengan glif pada koordinat tepat, font tersemat, dan posisi mutlak. Bila DOCX berbasis aliran (teks mengatur ulang aliran saat ukuran halaman, margin, atau font berubah), PDF berbasis posisi piksel (setiap karakter menempati satu titik tertentu di sistem koordinat halaman). Konversi di antara keduanya secara struktural adalah penerjemahan antar-paradigma: format penulisan yang fleksibel berubah menjadi format penyajian yang dibekukan. Setiap alat konversi, baik Microsoft Word sendiri, konverter tanpa antarmuka LibreOffice, mesin awan Smallpdf, atau alat peramban ini, menghadapi celah inheren yang sama: sumber menggambarkan niat, tujuan menggambarkan tampilan, dan niat harus dikomit ke tampilan tertentu selama konversi.
Pendekatan konversi yang berbeda menerima kompromi berbeda di hadapan celah itu. «Simpan sebagai PDF» milik Word menggunakan mesin render yang sama dengan yang menampilkan dokumen di layar, sehingga konversi pada dasarnya adalah «merender ke permukaan PDF alih-alih permukaan layar»; ketepatan luar biasa dan teks dalam keluaran dapat dipilih. Layanan awan biasanya memakai LibreOffice di sisi server atau mesin berbasis kepemilikan; ketepatan tinggi, teks dapat dipilih, berkas terunggah. Alat peramban ini memakai jalur berbeda (dijelaskan di bagian berikut) yang mengoptimalkan untuk privasi dan jangkauan (peramban apa pun, perangkat apa pun, tanpa pemasangan, tanpa unggahan) dan menerima penalti ketepatan sebagai gantinya. Tidak ada pendekatan yang secara universal terbaik; masing-masing cocok untuk alur kerja yang berbeda.
Cara alat ini bekerja di balik layar
Konversi berjalan sepenuhnya di peramban Anda melalui jalur tiga tahap: mammoth.js mengurai DOCX menjadi HTML semantik, html2canvas (dipanggil oleh html2pdf.js) melukis HTML itu pada elemen `<canvas>` di luar layar menggunakan primitif render peramban itu sendiri, dan jsPDF (juga dipanggil oleh html2pdf.js) membungkus canvas sebagai data gambar JPEG, meletakkannya pada halaman PDF, dan menambahkan pemutus halaman pada batas yang tersirat dari ukuran halaman dan margin yang dikonfigurasi. PDF keluaran adalah rangkaian gambar bitmap satu halaman penuh, satu atau lebih per halaman sumber, ditambah header metadata PDF.
Konsekuensi penting dari jalur ini layak dinyatakan secara jujur sejak awal: PDF keluaran berbasis bitmap, bukan berbasis teks. Karakter yang terlihat di tubuh PDF adalah piksel di dalam sebuah gambar, bukan operator pemosisi teks dengan data font tersemat. Secara praktis, ini berarti: pencarian dalam PDF tidak akan menemukan kata; salin-tempel dari tubuh halaman tidak menghasilkan apa-apa yang berguna; pembaca layar tidak dapat membaca konten sebagai teks; OCR diperlukan jika PDF dialirkan ke alat pengolah teks selanjutnya. Untuk alur di mana salah satu hal ini penting (penemuan hukum, pengajuan aksesibilitas, arsip dokumen yang ditujukan untuk pencarian, apa pun yang akan diurai perangkat lunak), alat yang tepat adalah «Berkas → Simpan sebagai PDF» di Microsoft Word atau «Berkas → Ekspor sebagai PDF» di LibreOffice; keduanya menghasilkan PDF berbasis teks dari sumber DOCX dengan teks yang dapat dipilih, dicari, dan diakses pembaca layar. Tujuan alat ini adalah menghantarkan PDF yang bersih secara visual dari dokumen Word tanpa pernah mengunggah dokumen ke mana pun; keluaran bitmap adalah biaya jaminan privasi itu.
Saat Anda memilih `.docx`, File API peramban menyerahkan byte ke mammoth.js. mammoth memperlakukan DOCX sebagai paket OPC, mengambil word/document.xml, dan menelusuri pohon WordprocessingML: `<w:p>` menjadi `<p>`, `<w:tbl>` menjadi `<table>`, run berhuruf tebal/miring menjadi markup sejajar, hyperlink menjadi `<a>`, gambar tersemat di `word/media/` menjadi tag `<img>` sejajar berkode base64. Alat ini lalu merender HTML di dalam wadah DOM tersembunyi, menerapkan ukuran halaman dan margin yang dipilih sebagai CSS, dan memanggil html2pdf pada wadah itu. html2pdf menelusuri wadah, membaginya menjadi halaman virtual pada batas halaman CSS, memanggil html2canvas pada setiap potongan seukuran halaman, dan menyusun bitmap canvas yang dihasilkan menjadi dokumen jsPDF. Seluruh jalur tidak membuat permintaan jaringan apa pun setelah pemuatan awal pustaka.
Tiga pustaka di balik konversi
mammoth.js adalah pengurai DOCX. Dibuat oleh Michael Williamson di bawah lisensi BSD-2-Clause dan dipelihara di GitHub di mwilliamson/mammoth.js. Filosofi desainnya, yang dinyatakan Williamson sendiri, adalah bahwa konversi harus melestarikan konten semantik (paragraf, judul, daftar, tabel, catatan kaki, hyperlink, gambar tersemat) alih-alih pemformatan langsung (font spesifik, ukuran, warna, jarak). Sang penulis berargumen bahwa dokumen berpindah antar-konteks (Word, web, ePub, PDF) dan gaya visual yang cocok untuk satu konteks jarang cocok untuk yang lain; membawa struktur semantik lebih berguna daripada membawa tampilan persis. Bundel peramban berukuran sekitar 600 KB termini.
jsPDF adalah penulis PDF. Dibuat oleh James Hall (GitHub: MrRio) pada 2010, kini dipelihara bersama yWorks GmbH, di bawah lisensi MIT, di GitHub di parallax/jsPDF. jsPDF dapat menulis PDF dari teks, grafik vektor, gambar, dan canvas HTML; di alat ini ia mengonsumsi bitmap canvas dari html2canvas dan menyusunnya menjadi halaman PDF. html2canvas, oleh Niklas von Hertzen (lisensi MIT), adalah perender HTML-ke-canvas yang melukis simpul DOM pada `<canvas>` menggunakan CSS terkomputasi setiap elemen. html2pdf.js oleh Erik Koopmans (lisensi MIT) adalah perekatnya: ia mengoordinasi html2canvas dan jsPDF, menangani pemberian halaman, memaparkan API konfigurasi yang bersih, dan mengemas semuanya menjadi satu bundel berukuran sekitar 350 KB termini.
Total jejak pemuatan pertama sekitar 950 KB. Kedua pustaka di-cache oleh peramban setelah kunjungan pertama, jadi kunjungan berikutnya seketika dari sudut pandang jaringan. Keempat proyek (mammoth.js, html2canvas, jsPDF, html2pdf.js) berlisensi sumber terbuka MIT atau BSD, dan telah dipasang di puluhan ribu proyek produksi. Jalur ini sudah matang, dipahami dengan baik, dan teruji medan untuk kasus penggunaannya: konversi DOCX ke PDF dengan ketepatan visual tanpa render di sisi server.
Sejarah singkat DOCX dan standar OOXML
- Word .doc (1983 hingga 2007). Format biner `.doc` milik Microsoft, digunakan setiap versi Word dari Word 1.0 sampai Word 2003. Berbasis kepemilikan, tanpa dokumentasi sebagian besar masa hidupnya, dibalik-rekayasa oleh pesaing untuk mendukung interoperabilitas.
- OOXML diumumkan (November 2005). Microsoft menerbitkan rancangan pertama Office Open XML, sebuah format berbasis XML yang ditujukan menggantikan biner `.doc`, `.xls`, dan `.ppt`. Pengajuan dilakukan ke Ecma International untuk distandardisasi.
- ECMA-376 edisi pertama (Desember 2006). Ecma International meratifikasi OOXML sebagai ECMA-376 edisi pertama: standar resmi pertama untuk apa yang kini menjadi `.docx`, `.xlsx`, `.pptx`. Spesifikasinya lebih dari 6.000 halaman.
- Office 2007 dirilis (Januari 2007). Microsoft Office 2007 diluncurkan dengan `.docx` sebagai format penyimpanan default. Office 2003 menerima paket kompatibilitas gratis yang memungkinkannya membuka format baru.
- Ratifikasi ISO/IEC 29500:2008 (November 2008). Setelah proses jalur cepat yang kontroversial yang menarik kritik kuat dari komunitas sumber terbuka dan kubu OpenDocument Format (ODF), ISO dan IEC mengadopsi OOXML sebagai ISO/IEC 29500:2008. Spesifikasi mendefinisikan dua varian: Strict (bersih dan sesuai ISO) dan Transitional (varian yang sebenarnya ditulis Word secara default, dengan konstruksi kompatibilitas mundur dipertahankan).
- Hari ini (2026). Hampir setiap `.docx` di dunia nyata adalah OOXML Transitional, dihasilkan oleh Word, LibreOffice, Google Docs, Apple Pages, WPS Office, atau salah satu dari banyak alat dokumen SaaS. Format ini kini di mana-mana: menjadi default di setiap lapis ekonomi penulisan dokumen, dari penulis individu hingga sistem manajemen dokumen perusahaan.
Alur dunia nyata yang mendorong konversi Word ke PDF
- Pengajuan CV atau résumé ke perekrut dan platform kerja. Setiap platform kerja besar (LinkedIn Recruiter, Indeed, Workday, Greenhouse, portal kerja pemerintah) mengharapkan PDF. Penulis menyusun di Word, mengonversi sebelum mengirim. Privasi penting karena CV berisi detail kontak pribadi, alamat, dan riwayat pekerjaan.
- Surat lamaran dan esai aplikasi. Universitas, program beasiswa, lamaran pemerintah, dan rekrutmen korporat semuanya bertumpu pada PDF sebagai format pengajuan. Word tetap menjadi alat penyusunan pilihan karena periksa tata bahasa, komentar, dan dukungan revisi; PDF adalah format pengiriman karena pemformatannya dikunci.
- Kontrak dan dokumen hukum sebelum ditandatangani. Konversikan ke PDF sebelum mengedarkan draf kontrak agar pihak lawan melihat dokumen bertata letak tetap. Setelah ditandatangani, PDF yang sudah ditandatangani menjadi versi kanonik. Konversi harus terjadi pada perangkat tepercaya karena dokumennya rahasia.
- Karya ilmiah, tesis, dan kiriman ke jurnal. Sebagian besar jurnal dan repositori universitas menerima PDF sebagai format kiriman. Penulis menyusun di Word (atau LaTeX) dan mengirimkan PDF. Untuk pengguna LaTeX alat ini tidak relevan; tetapi bagi populasi pengguna Word yang sangat besar di ilmu sosial, humaniora, manajemen, dan hukum, ini alur standarnya.
- Laporan internal dan cuplikan arsip. Konversikan laporan Word menjadi PDF untuk pengarsipan permanen. PDF adalah catatan resmi; sumber Word boleh terus berevolusi sebagai draf. Banyak industri berbasis regulasi (keuangan, kesehatan, hukum) membutuhkan PDF untuk arsip kepatuhan.
- Distribusi melalui email yang andal. PDF dirender secara konsisten di klien email, sesuatu yang tidak dilakukan `.docx`. Outlook, Gmail, Apple Mail, dan aplikasi email seluler semuanya membuka PDF secara sejajar; `.docx` mengharuskan penerima memasang Word atau aplikasi yang kompatibel. PDF adalah format distribusi paling minim gesekan untuk dokumen yang dikirim ke audiens nonteknis.
Jebakan umum dan artinya
- Teks dalam PDF tidak dapat dipilih atau dicari. Ini sesuai desain, bukan bug. Jalur ini meraster HTML yang dirender, sehingga tubuh PDF adalah gambar bitmap. Pencarian dalam PDF, salin-tempel, dan akses pembaca layar ke teks tubuh tidak akan bekerja. Untuk dokumen di mana teks dapat dipilih itu penting (hukum, pengarsipan, aksesibilitas, basis data dokumen), gunakan «Berkas → Simpan sebagai PDF» di Microsoft Word atau «Berkas → Ekspor sebagai PDF» di LibreOffice. Keduanya menghasilkan PDF berbasis teks dari sumber DOCX.
- Font dalam PDF tidak cocok dengan dokumen Word aslinya. mammoth.js dengan sengaja berfokus pada konten semantik dan tidak memindahkan metadata font langsung; peramban merender HTML dengan font yang tersedia secara lokal. Jika dokumen Word Anda menggunakan font perusahaan kustom yang hanya terpasang di mesin kerja Anda, PDF akan dirender dalam font fallback peramban. Solusinya adalah memasang font sumber pada perangkat yang melakukan konversi, atau menggunakan «Simpan sebagai PDF» milik Word, yang menyematkan font yang dirujuk dokumen.
- Tabel kompleks akan disederhanakan atau tampil kurang sempurna. mammoth menangani tabel standar (baris, kolom, batas sel) dengan baik. Sel-sel dengan banyak penggabungan, tabel yang sangat tersarang, dan tabel dengan pemformatan kondisional rumit bisa disederhanakan atau rusak secara visual karena keluaran HTML mammoth adalah himpunan bagian dari apa yang dihasilkan perender Word. Untuk laporan berbobot tabel, alat yang tepat adalah ekspor PDF asli dari Word.
- Tata letak multi-kolom berubah menjadi satu kolom. mammoth tidak melestarikan arahan `<w:cols>` milik Word. Artikel gaya koran dua kolom menjadi satu kolom di HTML yang dihasilkan dan karenanya di PDF. Untuk dokumen yang benar-benar memerlukan tata letak kolom pada keluaran, gunakan «Berkas → Simpan sebagai PDF» di Word atau mode tanpa antarmuka di LibreOffice; keduanya melestarikan struktur kolom selama konversi.
- Header, footer, dan nomor halaman dari sumber hilang. mammoth berfokus pada tubuh dokumen dan tidak memindahkan header, footer, atau bidang nomor halaman milik Word. html2pdf menambahkan paginasinya sendiri tetapi tidak dapat menyuntikkan header/footer Word yang asli. Alternatif untuk dokumen yang membutuhkan header/footer aslinya adalah mengonversi melalui Word, atau mengonversi di sini lalu menambahkan nomor halaman di belakang dengan Nomor Halaman PDF Gratis Online.
- Komentar dan perubahan yang dilacak tidak muncul. Secara default mammoth memperlakukan komentar dan tanda revisi sebagai metadata dan mengabaikannya. PDF yang dihasilkan mencerminkan dokumen dengan semua revisi efektif diterima (keadaan
word/document.xmldengan mengabaikan elemen revisi). Jika Anda butuh komentar atau markup terlihat di PDF, gunakan «Berkas → Simpan sebagai PDF» di Word dengan opsi «Cetak Markup» diaktifkan, atau setujui/tolak semua revisi di Word terlebih dahulu lalu konversi. - Dokumen yang sangat besar dapat membekukan tab. mammoth dan html2canvas keduanya memuat dan memproses seluruh dokumen di memori secara sinkron. Dokumen di atas 100 halaman atau dengan banyak gambar tersemat dapat menjenuhkan memori peramban, terutama pada perangkat seluler dengan RAM 4 GB atau kurang. Mitigasinya adalah membagi dokumen di Word terlebih dahulu, mengonversi bagian-bagian terpisah, lalu menggabungkan PDF yang dihasilkan dengan Gabung PDF Online Gratis.
Privasi: dokumen tetap di perangkat Anda
Setiap layanan cloud besar untuk Word ke PDF (Smallpdf, iLovePDF, Adobe Acrobat Online, PDF24, Sejda, Soda PDF) mengunggah berkas Anda ke server operator, menguraikannya di sisi server menggunakan LibreOffice atau mesin berbasis kepemilikan, merender PDF, dan mengirimkannya kembali sebagai unduhan. Implikasi privasinya tidak sepele karena dokumen Word secara rutin bersifat pribadi atau sensitif: CV dan surat lamaran berisi alamat rumah, nomor telepon, dan riwayat pekerjaan; surat lamaran dan esai pribadi berisi pengungkapan diri yang jujur; formulir SDM berisi ekspektasi gaji; kontrak berisi syarat komersial; surat catatan medis berisi informasi kesehatan terlindungi; draf hukum berisi konten yang dilindungi rahasia pengacara-klien. Penyedia besar menerbitkan kebijakan privasi yang berjanji menghapus dalam satu atau dua jam dan mengenkripsi saat transit dengan TLS, dan yang terbesar memegang sertifikasi ISO/IEC 27001 dan keselarasan dengan GDPR. Mereka memiliki alasan komersial kuat untuk menepati komitmen tersebut. Tetapi «dihapus dalam satu jam» bukanlah «tidak pernah dilihat»: selama satu jam itu, konten berkas berada di infrastruktur mereka, dapat diakses oleh proses atau orang mana pun dengan izin yang sesuai, dan terlihat di log dan cadangan sesuai retensi yang berlaku.
Konverter ini tidak mengunggah apa pun. mammoth.js dan html2pdf.js sepenuhnya berjalan di tab peramban Anda; byte berkas dibaca oleh File API, diproses di JavaScript, dan PDF keluaran dikembalikan sebagai unduhan Blob. Anda dapat memverifikasi ketiadaan unggahan dengan membuka alat pengembang peramban di tab Jaringan sebelum mengklik Konversi: tidak ada permintaan yang dibuat dengan konten berkas Anda. Lalu lintas jaringan satu-satunya adalah unggahan sekali pakai dari CDN dari kedua pustaka pada kunjungan pertama (sekitar 950 KB total termini), yang terjadi sekali lalu tetap di cache peramban. Aktifkan mode pesawat setelah halaman dimuat dan konverter tetap bekerja pada berkas lokal. Pertukarannya, seperti dijelaskan di bagian cara alat ini bekerja, adalah PDF keluaran berbasis bitmap: kehilangan kemampuan pilih dan cari teks yang dipertahankan konverter sisi-server. Untuk sebagian besar alur pribadi Word ke PDF (CV, surat lamaran, memo internal, draf kontrak, formulir lamaran), keluaran bitmap sudah baik dan jaminan privasi sepadan dengan pertukarannya. Untuk dokumen yang memerlukan teks dapat dipilih di keluaran, jawaban yang tepat adalah «Simpan sebagai PDF» milik Word atau «Ekspor sebagai PDF» milik LibreOffice, keduanya juga offline dan pribadi jika dokumen tidak perlu meninggalkan mesin lokal.
Ketika alat lain adalah pilihan yang tepat
- PDF keluaran memerlukan teks yang dapat dipilih dan dicari. Penemuan hukum, arsip dokumen, pengajuan aksesibilitas, apa pun yang akan diindeks mesin pencari atau dibaca pembaca layar: keluaran alat ini hanya bitmap dan tidak akan cukup. Gunakan «Berkas → Simpan sebagai PDF» di Microsoft Word atau «Berkas → Ekspor sebagai PDF» di LibreOffice. Keduanya dapat berjalan offline dan menghasilkan PDF berbasis teks.
- Dokumen memiliki tata letak kompleks, persamaan, atau objek tersemat. Koran multi-kolom, makalah akademis berat matematika, dokumen dengan grafik Excel atau slide PowerPoint tersemat, tabel kompleks dengan banyak penggabungan: kasus-kasus ini lebih cocok dengan perender asli Word atau konversi tanpa antarmuka LibreOffice. Pendekatan «semantik dulu» dari mammoth dengan sengaja membuang atau menyederhanakan hal yang tidak dapat ia wakili dengan rapi.
- Anda perlu mengonversi banyak berkas dalam batch. Alat ini menerima satu dokumen pada satu waktu dan jalur render bersifat satu utas. Untuk batch, perintah CLI standar adalah
soffice --headless --convert-to pdf *.docx --outdir output/menggunakan LibreOffice. Sebagai alternatif, pustaka mammoth dan html2pdf yang sama yang digunakan alat ini juga berjalan di Node.js untuk konversi berskrip dengan profil ketepatan yang sama. - Dokumen sangat besar (lebih dari 100 halaman atau memuat banyak gambar besar). mammoth + html2canvas memuat dan memproses seluruh dokumen di memori; dokumen besar dapat membekukan tab peramban, terutama di seluler. Anda dapat membagi di Word terlebih dahulu dan mengonversi bagian-bagian secara terpisah (lalu menggabungkan dengan Gabung PDF Online Gratis), atau memakai alat desktop yang mengaliri dokumen dari disk: Word, LibreOffice, atau konverter baris perintah.
Fitur
- Konversi cepat: konversi Word → PDF instan, tanpa menunggu.
- Dapat disesuaikan: pilih ukuran halaman (A4 atau Letter) dan margin.
- Privasi: semua pemrosesan lokal di peramban Anda. Berkas tidak pernah dikirim ke server.
- Sederhana: seret-letakkan berkas Word Anda dan klik konversi.
- Satu berkas pada satu waktu: konversi satu dokumen Word pada satu waktu untuk hasil terbaik.
Pertanyaan yang sering diajukan
Format Word apa yang didukung?
Konverter ini mendukung berkas .docx (Microsoft Word 2007 dan yang lebih baru). Berkas .doc lama tidak didukung; Anda dapat mengonversinya menjadi .docx di Microsoft Word lalu menggunakan alat ini.
Apakah format saya akan dipertahankan?
Sebagian besar format dipertahankan, termasuk font, ukuran, warna, dan tata letak dasar. Namun, elemen kompleks seperti tabel lanjutan, tata letak multi-kolom, dan objek tertanam mungkin disederhanakan atau disesuaikan selama konversi.
Apakah dokumen Word saya dikirim ke server?
Tidak. Semua konversi terjadi secara lokal di peramban Anda melalui pustaka Mammoth dan html2pdf. Berkas Word Anda tidak pernah meninggalkan perangkat Anda, untuk privasi dan keamanan total.
Bisakah saya mengonversi beberapa berkas sekaligus?
Alat ini mengonversi satu berkas Word pada satu waktu. Untuk setiap konversi, cukup unggah berkas .docx baru dan konversikan.
Berapa batas ukuran berkas?
Berkas hingga 25 MB didukung. Berkas yang sangat besar mungkin membutuhkan waktu lebih lama tergantung pada memori yang tersedia di peramban Anda.
Bisakah saya menyesuaikan margin dan ukuran halaman?
Ya. Sebelum mengonversi, Anda dapat memilih ukuran halaman (A4 atau Letter) dan lebar margin (Normal, Sempit, atau Lebar).
Pertanyaan yang lebih sering diajukan
Mengapa teks di PDF tidak dapat dipilih?
Alat ini menghasilkan PDF berbasis bitmap: ia merender dokumen Word menjadi HTML, melukis HTML itu pada canvas di luar layar menggunakan peramban, lalu menyematkan canvas sebagai gambar ke dalam PDF. Karena itu PDF keluaran berisi foto halaman, bukan karakter dengan posisi. Salin-tempel dari tubuh halaman tidak memberikan apa pun yang berguna, dan fungsi cari dalam PDF tidak akan menemukan kata. Untuk alur yang membutuhkan teks dapat dipilih (penemuan hukum, basis data riset, aksesibilitas), gunakan «Berkas → Simpan sebagai PDF» di Microsoft Word atau «Berkas → Ekspor sebagai PDF» di LibreOffice; keduanya menghasilkan PDF berbasis teks dari sumber DOCX.
Mengapa fontnya berbeda dari dokumen Word asli saya?
mammoth.js, pustaka yang alat ini gunakan untuk mengurai DOCX, dengan sengaja berfokus pada konten semantik (paragraf, judul, daftar, tabel) alih-alih pemformatan langsung (font spesifik, ukuran persis, warna). Peramban merender HTML yang dihasilkan menggunakan font yang Anda pasang secara lokal. Jika dokumen Word Anda menggunakan font perusahaan atau merek kustom yang hanya ada di mesin kerja Anda, PDF akan tampil dalam font fallback peramban (biasanya sans-serif generik). Untuk menjaga font, pasang font yang sama di perangkat Anda, atau gunakan «Simpan sebagai PDF» milik Word, yang menyematkan font yang dirujuk dokumen Anda.
Apakah alat ini bekerja offline?
Ya, setelah kunjungan pertama. Pustaka-pustaka (mammoth sekitar 600 KB, html2pdf sekitar 350 KB) dimuat sekali dari CDN lalu di-cache oleh peramban. Kunjungan berikutnya ke konverter bekerja sepenuhnya offline, selama cache peramban tidak dibersihkan di antaranya. Konversi itu sendiri sejak awal tidak butuh jaringan; hanya pemuatan awal pustaka yang butuh. Anda dapat memverifikasi dengan mengaktifkan mode pesawat setelah membuka halaman sekali dan mengonversi DOCX lokal.
Bisakah saya mengonversi berkas .doc lama (Word 97-2003)?
Tidak. Alat ini hanya menerima .docx (Office Open XML), format yang diperkenalkan di Word 2007. Format biner .doc lama memerlukan pengurai yang berbeda (mammoth hanya menangani .docx berbasis XML). Untuk mengonversi berkas .doc, buka dulu di Word atau LibreOffice dan Simpan sebagai .docx, lalu konversi di sini. Konversi .doc ke .docx adalah operasi satu klik di kedua alat dan mempertahankan konten.
Apakah hyperlink akan dapat diklik di PDF yang dihasilkan?
Hyperlink di dokumen sumber muncul sebagai teks yang bergaya visual (biru, bergaris bawah) di PDF tetapi tidak interaktif: karena tubuh PDF adalah gambar bitmap dari HTML yang dirender, mengklik teks tautan di pembaca PDF tidak akan menavigasikan ke mana-mana. Jika Anda perlu tautan yang dapat diklik di PDF keluaran, gunakan «Simpan sebagai PDF» milik Word (yang melestarikan anotasi tautan PDF) atau «Ekspor sebagai PDF» milik LibreOffice. Keduanya menghasilkan PDF di mana hyperlink tetap berfungsi setelah konversi.
Apakah ada padanan desktop atau baris perintah?
Ya, beberapa. Pendekatan standar sisi server dan baris perintah adalah mode tanpa antarmuka LibreOffice: soffice --headless --convert-to pdf input.docx --outdir output/ mengonversi berkas di tempat, ramah batch, tanpa perlu GUI. LibreOffice dapat dipasang di Linux, macOS, dan Windows; baris perintah yang sama bekerja di semua. Untuk keluaran piksel-identik dengan Word secara programatik, Microsoft Word + otomasi COM PowerShell di Windows adalah standar emas (membutuhkan Word terpasang). Pustaka mammoth.js dan html2pdf.js yang sama yang digunakan alat ini juga berjalan di Node.js untuk konversi berskrip tanpa peramban dengan profil ketepatan yang sama. Pandoc dengan mesin LaTeX adalah opsi lain untuk alur penerbitan akademis.