pdfから画像を劣化なしで抜き出す方法

pdfimages コマンドを使うと,pdfファイルから画質を落とさずに画像を取り出すことができます.

pdfimages のインストール

Linuxdebianubuntuの場合

$ sudo port install poppler-utils

mac port の場合

$ sudo port install poppler

使い方

pdfのファイル名を input.pdf とします

$ pdfimages -png   input.pdf   img

これだけで画像を png形式のファイルとして抽出できます

pngファイルは,ファイル名が img-000.png から連番で img-001.png, img-002.png と自動採番されます.

ファイルサイズを小さくしたい場合は jpeg 形式の方が良いです.ただしjpeg なので画質が少し落ちます

$ pdfimages -jpg  input.pdf   img

より高度な使い方

ページ範囲を指定して、抽出する画像を絞り込むことができます

$ pdfimages -png  -f 開始ページ番号 -l 終了ページ番号 input.pdf   img

おそらくですが first なので "-f",last なので "-l" なのでしょう.

pdfimages の便利なところ

コピー&ペーストで画像を取り出すよりも楽
コピー&ペーストで画像を取り出すよりも,画質が良い
原理上,画質は劣化しません