原创

PDFBOX スキアが作成したPDFファイルを読む

温馨提示:
本文最后更新于 2024年04月12日,已超过 41 天没有更新。若文章内的图片失效(无法正常加载),请留言反馈或直接联系我

PDFBOX で PDF ファイル(Skia/PDF m118 Google Docs Renderer)を読みましたが、何も読み取れません。このドキュメントには 1 ページしかなく、画像は含まれていません。 PDFTextStripper を使用してコンテンツを読んでみてください。

PDFBOX で Skia/PDF m118 Google ドキュメントを読む方法はわかりますか?

Acrobat Readerで開くことができます。

コードスニペット

    Document dataDocument = new Document();
    try {
        PDFTextStripper pdfTextStripper = new PDFTextStripper();

        pdfTextStripper.setParagraphStart("/t");
        pdfTextStripper.setSortByPosition(true);

        for (int i = 0; i < document.getNumberOfPages(); i++) {
            pdfTextStripper.setStartPage(i);
            pdfTextStripper.setEndPage(i);
            for (String line : pdfTextStripper.getText(document).split(pdfTextStripper.getParagraphStart())) {
                if (!line.isBlank() && line.length() > 3) {
                    dataDocument.getText().add(line);
                }
            }
            dataDocument.getText().add(":page=" + i);
        }

...

PDFBoxのバージョン

 implementation 'org.apache.pdfbox:pdfbox:2.0.30'

PDFファイル

これはドキュメントへのリンクです、https://jmp.sh/s/vTpGFHq6nLjzWXzBfxIAズラヤ

正文到此结束
热门推荐
本文目录