Xpdf のインストール
コマンドラインからpdfをアレコレできる(Adobe Acrobatの2億倍かわいい)Xpdf というpdf操作ツールをインストールする。
環境
- mac (Catalina)
- Homebrew 2.2.1
Homebrew でインスコ
ターミナルから、次のコマンドで xpdf をインストール。
brew install xpdf
なんかエラーが出るとかいう記事も見かけたが、私の環境では特に問題なくインストールできた。
ちゃんとインストールできていれば、次のコマンドで実行ファイル(のエイリアス)があるディレクトリが表示される。
% which pdfimages /usr/local/bin/pdfimages
日本語の設定
下記サイトから language support packages の Japanese をDL。
DLしたディレクトリに移動して、tar.gz ファイルを解凍。
cd ~/Download tar xvf xpdf-japanese.tar.gz
解凍してできたものを /usr/local/share/xpdf/japanese/
に移動。
mkdir -p /usr/local/share/xpdf/japanese mv xpdf-japanese/* /usr/local/share/xpdf/japanese
ホームディレクトリに設定ファイル ~/.xpdfrc
を作成し、内容を追加する。
touch ~/.xpdfrc echo "textEncoding UTF-8" >> ~/.xpdfrc cat /usr/local/share/xpdf/japanese/add-to-xpdfrc >> ~/.xpdfrc
使い方メモ
pdfからjpg画像を抽出
pdfimages hoge.pdf hoge
pdfからテキストを抽出
pdftotext hoge.pdf
pdfの情報を表示
pdfinfo hoge.pdf