ashavijit/pdf2txt.py

## pdf2txt.py
from io import StringIO
from typing import List
from PyPDF2 import PdfReader


def convert_pdf_to_txt(pdf_file_path: str) -> str:
    with open(pdf_file_path, 'rb') as f:
        pdf = PdfReader(f)
        pages: List[str] = []
        for page in pdf.pages:
            text = page.extract_text().strip()
            pages.append(text)
    return '\n'.join(pages)


if __name__ == '__main__':
    pdf_file_path = 'a.pdf'
    text = convert_pdf_to_txt(pdf_file_path)
    with open('example.txt', 'w') as f:
        f.write(text)
	from io import StringIO
	from typing import List
	from PyPDF2 import PdfReader


	def convert_pdf_to_txt(pdf_file_path: str) -> str:
	with open(pdf_file_path, 'rb') as f:
	pdf = PdfReader(f)
	pages: List[str] = []
	for page in pdf.pages:
	text = page.extract_text().strip()
	pages.append(text)
	return '\n'.join(pages)


	if __name__ == '__main__':
	pdf_file_path = 'a.pdf'
	text = convert_pdf_to_txt(pdf_file_path)
	with open('example.txt', 'w') as f:
	f.write(text)
No results found