PythonでPDFから任意の文字列を抽出したいです

6月 28, 2022

PDFから以下の文字だけを抜き出したいのですが、
「請求No. 1000000〇〇〇〇〇」(←〇は数字半角5桁)

↓のコードですと、全部テキストが抽出されてしまいます。
どう記載したらよろしいでしょうか。

from pdfminer.high_level import extract_text

FILE_PATH = 'C:/Users/Downloads/1.pdf'

text = extract_text(FILE_PATH)
print(text)

コメントを投稿

0 コメント