• 목록
  • 아래로
  • 위로

PDF를 이미지 파일로 변경하는 모듈이 여러가지가 있지만 PDF2Image가 가장 널리 사용되는 것 같더군요 ^^

 

images = convert_from_path('/home/belval/example.pdf')

 

또는

 

images = convert_from_bytes(open('/home/belval/example.pdf', 'rb').read())

 

위와 같이 사용이 가능합니다.

 

 

 

아래와 같은 다양한 옵션이 가능합니다 ^^

 

convert_from_path(pdf_path, dpi=200, output_folder=None, first_page=None, last_page=None, fmt='ppm', jpegopt=None, thread_count=1, userpw=None, use_cropbox=False, strict=False, transparent=False, single_file=False, output_file=str(uuid.uuid4()), poppler_path=None, grayscale=False, size=None, paths_only=False, use_pdftocairo=False)

 

convert_from_bytes(pdf_file, dpi=200, output_folder=None, first_page=None, last_page=None, fmt='ppm', jpegopt=None, thread_count=1, userpw=None, use_cropbox=False, strict=False, transparent=False, single_file=False, output_file=str(uuid.uuid4()), poppler_path=None, grayscale=False, size=None, paths_only=False, use_pdftocairo=False)

 

 

파일 저장은 다음과 같이 할 수 있습니다.

 

for idx, img in enumerate(images):
    img.save('pdf_' + str(idx).zfill(len(str(len(images)))) + '.jpg', 'JPEG') # pdf_넘버링.jpg 이런 방식으로 네이밍을 합니다.

 

 

+)

Poppler를 설치해야 이 모듈을 제대로 사용할 수 있어요.

설치방법은 공홈에 있어요 ^^

설치 후에 poppler_path = '경로' 이런 방식으로 지정해줘야 되어요!

 

A python module that wraps the pdftoppm utility to convert PDF to PIL Image object - Belval/pdf2image

 

https://github.com/Belval/pdf2image

작성자
이니스프리 119 Lv. (0%) 2249040/115200000EXP

Make StudyForUs Great Again!

 

CSVpuymXAAAVVpd.jpg

댓글 0

권한이 없습니다.
번호 제목 글쓴이 날짜 조회 수
공지 [작업 완료] 설 명절 맞이 서버 업데이트 안내 3 마스터 마스터 24.02.11.17:21 1043
공지 [중요] 호스팅 만료와 관련하여 일부 수칙이 변경됩니다. 4 마스터 마스터 23.01.14.02:23 4712
174 [Python] Sending SMTP メール(Gmail) - Redmail module 이니스프리 이니스프리 22.06.02.20:38 123
173 [Python] Selenium에서 팝업을 허용하는 방법 이니스프리 이니스프리 18.11.01.21:37 2133
172 [Python] Requests에서 SSLError 발생 시 대처 방법 이니스프리 이니스프리 21.09.19.15:12 1224
171 [Python] Requests에서 JSON 데이터를 POST 전송하는 방법 x2 이니스프리 이니스프리 21.08.22.08:16 9710
170 [Python] random 함수가 계속하여 동일한 결과를 출력할 때 해결방법 이니스프리 이니스프리 24.05.15.19:32 116
169 [Python] Pytube를 이용하여 유튜브 영상을 간단히 다운받는 법에 대한 설명 이니스프리 이니스프리 20.11.01.14:25 477
168 [Python] PyMySQL에서 executemany()로 2 dimensional Array을 사용하여 DB에 적용하기 2 이니스프리 이니스프리 21.10.09.22:06 524
167 [Python] PyMuPDF의 사용방법 이니스프리 이니스프리 22.07.28.21:33 498
166 [Python] PyHWP의 hwp5txt를 利用하여 Hancom file을 불러오기 이니스프리 이니스프리 22.05.29.07:59 371
165 [Python] print() 문의 문자열 출력 형식 2 이니스프리 이니스프리 20.02.15.22:16 140
164 [Python] print 되는대로 string으로 변환하는 function 이니스프리 이니스프리 22.05.22.19:59 133
163 [Python] Poppler 등 설치하지 않고 PDF -> Image 하는 모듈 이니스프리 이니스프리 22.07.28.11:20 226
162 [Python] PDF2image 모듈이 실행되지 않을 때 이니스프리 이니스프리 21.06.23.20:36 2681
[Python] PDF2Image 모듈 - PDF 파일을 이미지 파일로 변환 이니스프리 이니스프리 20.05.30.21:01 2772
160 [Python] OrderedDict에 대한 간단한 소개 3 이니스프리 이니스프리 20.06.16.13:09 163
159 [Python] Ordered Set 이니스프리 이니스프리 23.09.19.20:24 200
158 [Python] Naver Login with requests 1 image Hanam09 Hanam09 21.07.17.01:48 2882
157 [Python] MP4 움짤을 clip하여 thumbnail 生成하기 이니스프리 이니스프리 22.06.09.08:35 173
156 [Python] MP4 50% 進行된 frame을 JPG thumbnail로 生成 이니스프리 이니스프리 22.06.06.15:15 133
155 [Python] MP4 -> JPG thumbnail 生成 1 이니스프리 이니스프리 22.06.04.16:38 131