Cómo usar Python para convertir formato pdf a jpg
Se puede implementar usando la biblioteca wand de terceros (mi entorno: win10, python3)
Es necesario instalar Wand, imagemagick y ghostscript
El La instalación de Wand es muy simple: Dirija cmd para ejecutar pip install wand
y luego instale imagemagick. Descargue el enlace web desde aquí. Preste atención a si es de 32 bits o de 64 bits. ser consistente con el número de bits de Python.
Asegúrate de marcar Instalar bibliotecas y encabezados de desarrollo para C y C++ durante el proceso de instalación. Después de la instalación, configure la variable de entorno MAGICK_HOME en la ruta de instalación de imagemagick y agregue la ruta de instalación a la ruta.
Para obtener más información, consulte el enlace web de esta página.
Finalmente instale Ghostscript, descargue el enlace web aquí, seleccione la versión AGPL, preste atención a 32 bits o 64 bits.
El proceso de instalación es muy simple. Haga clic en Siguiente. Si no desea instalar en la unidad c, puede cambiar la ruta de instalación.
El último código (muy simple): #-*-?coding:utf-8?-*-
from?wand.image?import?Image
con?Imagen(filename="pdf_file_name",resolución=300)?as?img:
img.format?=?'jpeg'
img.save(filename= 'converted.jpg')
El pdf_file_name anterior ingresa el nombre del archivo pdf que se procesará y, finalmente, converted.jpg se generará en el directorio actual
Explicación: estas líneas Los códigos son relativamente simples. Está bien procesar archivos PDF con una pequeña cantidad de páginas, pero se atascará si hay demasiadas páginas. Pero puedes usar pyPDF2 para dividir pdf y luego convertirlo. Esta es una idea. Para obtener tutoriales sobre pyPDF2, ve a Baidu.