PDFから以下の文字だけを抜き出したいのですが、「請求No. 1000000〇〇〇〇〇」(←〇は数字半角5桁)
↓のコードですと、全部テキストが抽出されてしまいます。どう記載したらよろしいでしょうか。
from pdfminer.high_level import extract_text
FILE_PATH = 'C:/Users/Downloads/1.pdf'
text = extract_text(FILE_PATH)print(text)
0 コメント