Ubuntu における PDF 操作ツール - Poppler

たまに、PDFにページを追加する必要があります...

目次

または、PDFから画像とテキストを抽出したい別の日もあります。このガイドは、2026年のドキュメントツール: Markdown、LaTeX、PDFおよび印刷ワークフロー ハブの一部です。

スパナーズはポータブルドキュメントを追いかけている 上記は、“スパナーズはポータブルドキュメントを追いかけている"というように「スパナーズ」がポータブルドキュメントを追いかけている様子を描いたFlux 1モデルによるAI生成画像です。

Popplerについて

Popplerは、Linuxシステム、特にUbuntuで使用される無料でオープンソースのPDFレンダリングライブラリです。PDFファイルを操作し、変換するためのコマンドラインユーティリティを提供しています。UbuntuおよびPopplerユーティリティの使用方法を以下にまとめます:

UbuntuにおけるPopplerとは?

  • Popplerはxpdf-3.0のコードベースに基づいたPDFレンダリングライブラリです。
  • PDFからテキストや画像を抽出し、PDFをマージ/分割し、他の形式に変換するための複数のコマンドラインツールを含みます。
  • GNOMEおよびKDEデスクトップ環境でよく使用されます。

インストール

UbuntuでPopplerユーティリティをインストールするには、以下のコマンドを実行してください:

sudo apt-get install poppler-utils

PopplerはXpdf PDFビューアーに基づいたPDFレンダリングライブラリです。

このパッケージには、PDFドキュメントの情報を取得し、他の形式に変換したり、PDFを操作したりするためのコマンドラインユーティリティ(Popplerに基づく)が含まれています:

  • pdfdetach – 埋め込まれたファイル(添付ファイル)を一覧表示または抽出
  • pdffonts – フォントアナライザ
  • pdfimages – 画像抽出
  • pdfinfo – ドキュメント情報
  • pdfseparate – ページ抽出ツール
  • pdfsig – デジタル署名の検証
  • pdftocairo – Cairoを使用したPDFをPNG/JPEG/PDF/PS/EPS/SVGに変換
  • pdftohtml – PDFをHTMLに変換
  • pdftoppm – PDFをPPM/PNG/JPEG画像に変換
  • pdftops – PDFをPostScript(PS)に変換
  • pdftotext – テキスト抽出
  • pdfunite – ドキュメントマージングツール

重要なPopplerユーティリティと使用方法

  1. pdfinfo – PDFのメタデータ(タイトル、著者、ページ数など)を取得

    pdfinfo file.pdf
    
  2. pdftotext – PDFからテキストを抽出

    pdftotext file.pdf [output.txt]
    
  3. pdfimages – PDFから画像を抽出

    pdfimages file.pdf output_prefix
    
  4. pdftoppm / pdftocairo – PDFページを画像(PNG、JPEGなど)に変換

    pdftoppm -png file.pdf output_prefix
    
  5. pdfseparate – PDFを個々のページに分割

    pdfseparate file.pdf output_%d.pdf
    
  6. pdfunite – 複数のPDFを1つにマージ

    pdfunite file1.pdf file2.pdf merged.pdf
    
  7. pdftohtml – PDFをHTMLに変換

    pdftohtml file.pdf [output.html]
    
  8. pdffonts – PDFで使用されているフォントを一覧表示

    pdffonts file.pdf
    

その他の注意点

  • 多くのコマンドは-hまたは--helpで詳細なオプションを表示できます。
  • Popplerは多くのLinuxシステムに事前にインストールされていますが、見つからない場合はpoppler-utilsaptでインストールできます。

Ubuntu Launchpadパッケージ情報

https://launchpad.net/ubuntu/+source/poppler

gir1.2-poppler-0.18: poppler-glibのGObject introspectionデータ
libpoppler-cpp-dev: PDFレンダリングライブラリ -- 開発ファイル(CPPインターフェース)
libpoppler-cpp1: PDFレンダリングライブラリ(CPP共有ライブラリ)
libpoppler-cpp1-dbgsym: Ubuntu pluckyでlibpoppler-cpp1-dbgsymの要約がありません。
libpoppler-dev: PDFレンダリングライブラリ -- 開発ファイル
libpoppler-glib-dev: PDFレンダリングライブラリ -- 開発ファイル(GLibインターフェース)
libpoppler-glib-doc: PDFレンダリングライブラリ -- GLibインターフェースのドキュメント
libpoppler-glib8t64: PDFレンダリングライブラリ(GLibベースの共有ライブラリ)
libpoppler-glib8t64-dbgsym: libpoppler-glib8t64のデバッグシンボル
libpoppler-private-dev: PDFレンダリングライブラリ -- プライベート開発ファイル
libpoppler-qt5-1t64: PDFレンダリングライブラリ(Qt 5ベースの共有ライブラリ)
libpoppler-qt5-1t64-dbgsym: libpoppler-qt5-1t64のデバッグシンボル
libpoppler-qt5-dev: PDFレンダリングライブラリ -- 開発ファイル(Qt 5インターフェース)
libpoppler-qt6-3t64: PDFレンダリングライブラリ(Qt 6ベースの共有ライブラリ)
libpoppler-qt6-3t64-dbgsym: libpoppler-qt6-3t64のデバッグシンボル
libpoppler-qt6-dev: PDFレンダリングライブラリ -- 開発ファイル(Qt 6インターフェース)
libpoppler140: PDFレンダリングライブラリ
libpoppler140-dbgsym: libpoppler140のデバッグシンボル
poppler-utils: Popplerに基づくPDFユーティリティ
poppler-utils-dbgsym: poppler-utilsのデバッグシンボル

有用なリンク