Как да извлечете и запазите изображения от PDF файл в Linux

Как да извлечете и запазите изображения от PDF файл в Linux
Как да извлечете и запазите изображения от PDF файл в Linux

Видео: Как да извлечете и запазите изображения от PDF файл в Linux

Видео: Как да извлечете и запазите изображения от PDF файл в Linux
Видео: MacBook Pro 2011: How to Fix the Defective GPU and Install Monterey - YouTube 2024, Може
Anonim
Можете лесно да конвертирате PDF файлове в редактируем текст в Linux, като използвате инструмента за обработка на команди "pdftotext". Ако обаче има оригинални PDF файлове, те не се извличат. За да извлечете изображения от PDF файл, можете да използвате друг инструмент на командния ред, наречен "pdfimages".
Можете лесно да конвертирате PDF файлове в редактируем текст в Linux, като използвате инструмента за обработка на команди "pdftotext". Ако обаче има оригинални PDF файлове, те не се извличат. За да извлечете изображения от PDF файл, можете да използвате друг инструмент на командния ред, наречен "pdfimages".

ЗАБЕЛЕЖКА: Когато казваме да въведете нещо в тази статия и има цитати около текста, НЕ пишете кавичките, освен ако не посочим друго.

Инструментът "pdfimages" е част от пакета poppler-utils. Можете да проверите дали той е инсталиран на вашата система и да го инсталирате, ако е необходимо, като използвате стъпките, описани в тази статия.

За да извлечете изображения от PDF файл с помощта на pdfimages, натиснете "Ctrl + Alt + T", за да отворите прозореца на терминала. Въведете следната команда в подканата.

pdfimages /home/lori/Documents/SampleWithImages.pdf /home/lori/Documents/ExtractedImages/image

ЗАБЕЛЕЖКА: За всички команди, показани в тази статия, заменете първия път в командата и името на PDF файла с пътя и името на файла за оригиналния PDF файл. Вторият път трябва да бъде пътят към основната папка, в която искате да запазите извлечените изображения. Думата "изображение" в края на втория път представлява всичко, с което искате да предложите името на файла си. Файловете на изображенията се номерират автоматично (000, 001, 002, 003 и т.н.). Ако искате да добавите текст към началото на всяко изображение, въведете този текст в края на втория път. В нашия пример всяко име на файла ще започне с "изображение", като например image-001.ppm, image-002.ppm и т.н. Добавя се тире между текста, който посочвате и номера.

Форматът на изображението по подразбиране е PPM (преносима pixmap) за немонометрични изображения или PBM (портативна растерна графика) за монохромни изображения. Тези формати са предназначени за лесно обмен между платформи.
Форматът на изображението по подразбиране е PPM (преносима pixmap) за немонометрични изображения или PBM (портативна растерна графика) за монохромни изображения. Тези формати са предназначени за лесно обмен между платформи.

ЗАБЕЛЕЖКА: Можете да получите два файла с изображения за всяко изображение във вашия PDF файл. Второто изображение за всяко изображение е празно, така че ще можете да кажете кои изображения съдържат изображенията от файла чрез миниизображението във файла в File Manager.

За да създадете графични файлове.jpg, добавете опцията "-j" към командата, както е показано по-долу.
За да създадете графични файлове.jpg, добавете опцията "-j" към командата, както е показано по-долу.

pdfimages -j /home/lori/Documents/SampleWithImages.pdf /home/lori/Documents/ExtractedImages/image

ЗАБЕЛЕЖКА: Можете също така да промените изхода по подразбиране на PNG, като използвате опцията "-png" или TIFF, като използвате опцията "-tiff".

Основният файл с изображения за всяко изображение се запазва като.jpg файл. Второто празно изображение все още е.ppm или.pbm файл.
Основният файл с изображения за всяко изображение се запазва като.jpg файл. Второто празно изображение все още е.ppm или.pbm файл.
Ако искате да конвертирате изображения само върху и след определена страница, използвайте опцията "-f" с номер, за да посочите първата страница, която да преобразувате, както е показано в примерната команда по-долу.
Ако искате да конвертирате изображения само върху и след определена страница, използвайте опцията "-f" с номер, за да посочите първата страница, която да преобразувате, както е показано в примерната команда по-долу.

pdfimages -f 2 -j /home/lori/Documents/SampleWithImages.pdf /home/lori/Documents/ExtractedImages/image

ЗАБЕЛЕЖКА: Ние комбинирахме опцията "-j" с опцията "-f", за да получим.jpg изображения и направихме същото с опцията "-l", посочена по-долу.

За да конвертирате всички изображения преди и на определена страница, използвайте опцията "-l" (малка буква "L", а не номер "1") с номер, за да посочите последната страница за конвертиране, както е показано по-долу.
За да конвертирате всички изображения преди и на определена страница, използвайте опцията "-l" (малка буква "L", а не номер "1") с номер, за да посочите последната страница за конвертиране, както е показано по-долу.

pdfimages -l 1 -j /home/lori/Documents/SampleWithImages.pdf /home/lori/Documents/ExtractedImages/image

ЗАБЕЛЕЖКА: Можете да използвате опциите "-f" и "-l" заедно, за да конвертирате изображения в определен диапазон от страници в средата на документа.

Ако в PDF файла има парола на собственика, използвайте опцията "-opw" и паролата в единични кавички, както е показано по-долу. Ако паролата в PDF файла е потребителска парола, вместо това използвайте опцията "-upw" с паролата.
Ако в PDF файла има парола на собственика, използвайте опцията "-opw" и паролата в единични кавички, както е показано по-долу. Ако паролата в PDF файла е потребителска парола, вместо това използвайте опцията "-upw" с паролата.

ЗАБЕЛЕЖКА: Уверете се, че има единични кавички около паролата ви в командата.

pdfimages -opw ‘password’ -j /home/lori/Documents/SampleWithImages.pdf /home/lori/Documents/ExtractedImages/image

Препоръчано: