sábado, 27 de octubre de 2007

Pdftk: modificación de ficheros en pdf

He encontrado una utilidad para modificar ficheros en formato pdf. Se llama Pdftk y se gestiona por medio de la consola o de forma gráfica mediante Guipdftk (que no he conseguido instalar en Ubuntu). Este programa nos permite realizar las siguientes acciones:

* Unir documentos en pdf.
* Dividir páginas en un documento nuevo.
* Rotar documentos en pdf o páginas.
* Desencriptar el documento (requiere contraseña).
* Encriptar el documento como se quiera.
* Rellenar formas con datos en X/FDF o aplanar formas.
* Generar plantillas de datos en FDF.
* Aplicar una marca de agua o un sello.
* Informar de la métrica y los marcadores.
* Actularizar metadatos del pdf.
* Adjuntar ficheros a páginas del pdf o al documento íntegro.
* Separar ficheros adjuntos
* Separar un pdf en páginas sueltas
* Comprimir o volver a comprimir.
* Reparar documentos corruptos si es posible.

Ejemplos prácticos

Unir dos o más PDFs en un documento nuevo

pdftk 1.pdf 2.pdf 3.pdf cat output 123.pdf

o (usando variables):

pdftk A=1.pdf B=2.pdf cat A B output 12.pdf

o (usando comodines):

pdftk *.pdf cat output combined.pdf

Separar páginas seleccionadas de varios PDFs a un documento nuevo

pdftk A=one.pdf B=two.pdf cat A1-7 B1-5 A8 output combined.pdf

Cifrar un documento usando 128-Bit (predeterminado) y retener todos los permisos (predeterminado)

pdftk mydoc.pdf output mydoc.128.pdf owner_pw foopass

Igual que lo anterior, exigiendo además una contraseña para abrir el PDF

pdftk mydoc.pdf output mydoc.128.pdf owner_pw foo user_pw baz


Igual que lo anterior permitendo la impresión (una vez que el PDF está abierto)

pdftk mydoc.pdf output mydoc.128.pdf owner_pw foo user_pw baz allow printing

Desencriptar un pdf

pdftk secured.pdf input_pw foopass output unsecured.pdf

Unir dos archivos, de los cuales uno está cifrado (el archivo resultante no está encriptado)

pdftk A=secured.pdf mydoc.pdf input_pw A=foopass cat output combined.pdf

Descomprimir los flujos de página para editar el código PDF en un editor de texto

pdftk mydoc.pdf output mydoc.clear.pdf uncompress

Reparar una tabla XREF o las longitudes de flujo de páginas de un pdf (si es posible)

pdftk broken.pdf output fixed.pdf

Separar un único documento en páginas sueltas y escribir los datos del documento a doc_data.txt

pdftk mydoc.pdf burst

Escribir un informe sobre los metadatos, marcadores y etiquetas de página de un PDF

pdftk mydoc.pdf dump_data output report.txt

No hay comentarios: