• 목록
  • 아래로
  • 위로

PDF를 이미지 파일로 변경하는 모듈이 여러가지가 있지만 PDF2Image가 가장 널리 사용되는 것 같더군요 ^^

 

images = convert_from_path('/home/belval/example.pdf')

 

또는

 

images = convert_from_bytes(open('/home/belval/example.pdf', 'rb').read())

 

위와 같이 사용이 가능합니다.

 

 

 

아래와 같은 다양한 옵션이 가능합니다 ^^

 

convert_from_path(pdf_path, dpi=200, output_folder=None, first_page=None, last_page=None, fmt='ppm', jpegopt=None, thread_count=1, userpw=None, use_cropbox=False, strict=False, transparent=False, single_file=False, output_file=str(uuid.uuid4()), poppler_path=None, grayscale=False, size=None, paths_only=False, use_pdftocairo=False)

 

convert_from_bytes(pdf_file, dpi=200, output_folder=None, first_page=None, last_page=None, fmt='ppm', jpegopt=None, thread_count=1, userpw=None, use_cropbox=False, strict=False, transparent=False, single_file=False, output_file=str(uuid.uuid4()), poppler_path=None, grayscale=False, size=None, paths_only=False, use_pdftocairo=False)

 

 

파일 저장은 다음과 같이 할 수 있습니다.

 

for idx, img in enumerate(images):
    img.save('pdf_' + str(idx).zfill(len(str(len(images)))) + '.jpg', 'JPEG') # pdf_넘버링.jpg 이런 방식으로 네이밍을 합니다.

 

 

+)

Poppler를 설치해야 이 모듈을 제대로 사용할 수 있어요.

설치방법은 공홈에 있어요 ^^

설치 후에 poppler_path = '경로' 이런 방식으로 지정해줘야 되어요!

 

A python module that wraps the pdftoppm utility to convert PDF to PIL Image object - Belval/pdf2image

 

https://github.com/Belval/pdf2image

작성자
이니스프리 119 Lv. (0%) 1938630/115200000EXP

Make StudyForUs Great Again!

 

CSVpuymXAAAVVpd.jpg

댓글 0

권한이 없습니다.
번호 제목 글쓴이 날짜 조회 수
공지 [작업 완료] 설 명절 맞이 서버 업데이트 안내 3 마스터 마스터 24.02.11.17:21 860
공지 [중요] 호스팅 만료와 관련하여 일부 수칙이 변경됩니다. 4 마스터 마스터 23.01.14.02:23 4534
429 [학습정보] 구글 게이밍 아카데미 2/18 9 image 이니스프리 이니스프리 19.02.05.16:38 188
428 [끝말잇기] '슘'으로 시작되는 단어 중 XE타운에서 사용할 수 있는 단어 이니스프리 이니스프리 19.08.25.01:01 190
427 [Telegram] Bot의 inline keyboard 제거 이니스프리 이니스프리 22.07.01.20:35 190
426 Bose Sleepbuds의 사용 환경 등에 관하여 이니스프리 이니스프리 18.12.31.14:01 192
425 엠팍에서 첨부 이미지 크롤링을 할 때 400대 에러가 뜨는 경우 이니스프리 이니스프리 20.01.12.23:38 192
424 [파이썬] 딕셔너리의 키/값으로 정렬하기 이니스프리 이니스프리 20.02.02.23:25 195
423 [할인정보] 바디샵 3+3 $50 이상 브리티쉬로즈 증정 image 이니스프리 이니스프리 17.02.17.22:16 196
422 [생활정보] 기존 영역 벗어나 새로워진  편의점 크로스오버 상품 5 image 이니스프리 이니스프리 17.01.23.16:24 197
421 [Python] Bypassing Cloudflare's anti-bot page with Cloudscraper module 이니스프리 이니스프리 22.06.10.22:11 197
420 [할인정보] DHC - 2/15-2/16 스베스베 데이 전품목 30% SALE! 4 image 이니스프리 이니스프리 17.02.15.21:41 198
419 [Python] 윈도우에서 파이썬이 설치된 경로를 확인하는 방법 이니스프리 이니스프리 20.05.13.22:13 198
418 [Python] dictionary 자료형에서 setdefault와 update의 차이 이니스프리 이니스프리 20.04.05.18:12 199
417 [이벤트] 롯데리아 행쇼팩 9900원과 핫크리스피버거 1+1 image 부루마블 17.01.25.23:05 200
416 파이썬 & 데이터 분석 & 웹 크롤링 오프라인 강의 image 이니스프리 이니스프리 19.11.03.01:41 200
415 [Python] 네이버 블로그 크롤링할 때 PostList.nhn 관련 팁 (문자열에서 첫번째 행을 제거하기) 이니스프리 이니스프리 20.11.08.18:16 202
414 [Python] 확장자를 지정할 수 있는 백업 스크립트 이니스프리 이니스프리 20.05.13.21:58 203
413 [Matplotlib] X축 눈금 레이블 텍스트를 회전시키는 방법 이니스프리 이니스프리 22.07.18.21:05 204
412 [할인정보] 콰트로치즈와퍼주니어 44% 할인 + 오리지널 또는 골드 치킨프라이 50% 할인 3 image 이니스프리 이니스프리 17.03.13.12:18 208
411 이것 7가지 지키면 미세먼지 노출 줄일 수 있다! image 오후두시스토리 오후두시스토.. 17.04.06.11:12 208
410 [Python] How to send BOLD text with Telegram bot 이니스프리 이니스프리 23.08.10.19:51 210