PDFBOX スキアが作成したPDFファイルを読む
温馨提示:
本文最后更新于 2024年04月12日,已超过 47 天没有更新。若文章内的图片失效(无法正常加载),请留言反馈或直接联系我。
PDFBOX で PDF ファイル(Skia/PDF m118 Google Docs Renderer)を読みましたが、何も読み取れません。このドキュメントには 1 ページしかなく、画像は含まれていません。 PDFTextStripper を使用してコンテンツを読んでみてください。
PDFBOX で Skia/PDF m118 Google ドキュメントを読む方法はわかりますか?
Acrobat Readerで開くことができます。
コードスニペット
Document dataDocument = new Document();
try {
PDFTextStripper pdfTextStripper = new PDFTextStripper();
pdfTextStripper.setParagraphStart("/t");
pdfTextStripper.setSortByPosition(true);
for (int i = 0; i < document.getNumberOfPages(); i++) {
pdfTextStripper.setStartPage(i);
pdfTextStripper.setEndPage(i);
for (String line : pdfTextStripper.getText(document).split(pdfTextStripper.getParagraphStart())) {
if (!line.isBlank() && line.length() > 3) {
dataDocument.getText().add(line);
}
}
dataDocument.getText().add(":page=" + i);
}
...
PDFBoxのバージョン
implementation 'org.apache.pdfbox:pdfbox:2.0.30'
PDFファイル
これはドキュメントへのリンクです、https://jmp.sh/s/vTpGFHq6nLjzWXzBfxIAズラヤ
正文到此结束
- 本文标签: 家庭宠物
- 本文链接: https://www.coder6.net/article/2543
- 版权声明: 本文由蚂蚁原创发布,转载请遵循《署名-非商业性使用-相同方式共享 4.0 国际 (CC BY-NC-SA 4.0)》许可协议授权
热门推荐
-
浏览(192) 评论(0)