• 목록
  • 아래로
  • 위로

PDF를 이미지 파일로 변경하는 모듈이 여러가지가 있지만 PDF2Image가 가장 널리 사용되는 것 같더군요 ^^

 

images = convert_from_path('/home/belval/example.pdf')

 

또는

 

images = convert_from_bytes(open('/home/belval/example.pdf', 'rb').read())

 

위와 같이 사용이 가능합니다.

 

 

 

아래와 같은 다양한 옵션이 가능합니다 ^^

 

convert_from_path(pdf_path, dpi=200, output_folder=None, first_page=None, last_page=None, fmt='ppm', jpegopt=None, thread_count=1, userpw=None, use_cropbox=False, strict=False, transparent=False, single_file=False, output_file=str(uuid.uuid4()), poppler_path=None, grayscale=False, size=None, paths_only=False, use_pdftocairo=False)

 

convert_from_bytes(pdf_file, dpi=200, output_folder=None, first_page=None, last_page=None, fmt='ppm', jpegopt=None, thread_count=1, userpw=None, use_cropbox=False, strict=False, transparent=False, single_file=False, output_file=str(uuid.uuid4()), poppler_path=None, grayscale=False, size=None, paths_only=False, use_pdftocairo=False)

 

 

파일 저장은 다음과 같이 할 수 있습니다.

 

for idx, img in enumerate(images):
    img.save('pdf_' + str(idx).zfill(len(str(len(images)))) + '.jpg', 'JPEG') # pdf_넘버링.jpg 이런 방식으로 네이밍을 합니다.

 

 

+)

Poppler를 설치해야 이 모듈을 제대로 사용할 수 있어요.

설치방법은 공홈에 있어요 ^^

설치 후에 poppler_path = '경로' 이런 방식으로 지정해줘야 되어요!

 

A python module that wraps the pdftoppm utility to convert PDF to PIL Image object - Belval/pdf2image

 

https://github.com/Belval/pdf2image

작성자
이니스프리 119 Lv. (2%) 3646440/115200000EXP

Make StudyForUs Great Again!

 

CSVpuymXAAAVVpd.jpg

댓글 0

권한이 없습니다.
번호 제목 글쓴이 날짜 조회 수
공지 시스템 점검 작업 완료 안내 10 마스터 마스터 24.09.05.16:25 868
공지 [중요] 호스팅 만료와 관련하여 일부 수칙이 변경됩니다. 4 마스터 마스터 23.01.14.02:23 7700
517 하나 더 적금 우대금리 image 이니스프리 이니스프리 20.02.27.14:32 147
516 '20 TEPS 일정 image 이니스프리 이니스프리 19.11.23.15:26 149
515 [파이썬] OS에 따라서 경로를 달리하기 이니스프리 이니스프리 20.01.07.22:15 149
514 [펌] 신발 깔창 리뷰 이니스프리 이니스프리 20.01.01.17:26 150
513 [Flutter] 오프라인 강좌 10/20(일) image 이니스프리 이니스프리 19.10.14.11:36 151
512 [Python] MP4 -> JPG thumbnail 生成 1 이니스프리 이니스프리 22.06.04.16:38 151
511 [Python] MP4 50% 進行된 frame을 JPG thumbnail로 生成 이니스프리 이니스프리 22.06.06.15:15 151
510 [Requests] params, data 전달시에 딕셔너리의 구조가 복잡한 경우 해결방법 이니스프리 이니스프리 19.11.17.14:55 152
509 [Ramnode] SSD 용량 추가! 2 image 이니스프리 이니스프리 20.02.17.22:20 152
508 헷갈리는 출생지를 가진 인물들 1 이니스프리 이니스프리 20.06.26.21:09 152
507 [Python] 폴더 내 이미지의 height를 측정하여 height < n 미만인 파일을 삭제하기 이니스프리 이니스프리 20.08.13.20:08 152
506 [Python] print() 문의 문자열 출력 형식 2 이니스프리 이니스프리 20.02.15.22:16 155
505 [Python] 딕셔너리 자료형에서 .get() 메서드 사용시 에러 회피하기 이니스프리 이니스프리 20.02.15.22:48 155
504 [파이썬] 길어진 로그 파일을 100줄로 줄이는 스크립트 이니스프리 이니스프리 19.12.25.11:49 157
503 [Python] 문자열에서 숫자만 뽑아서 정수로 반환하는 함수 이니스프리 이니스프리 20.02.12.00:01 157
502 SSFSHOP에서 모든 사이즈가 조회되는 것은 아니군요 1 이니스프리 이니스프리 20.03.08.17:45 159
501 링크 파싱 모듈을 제작하다가 깨달은 점 ㅠㅠ 이니스프리 이니스프리 19.08.27.22:06 160
500 JavaScript에서 Array로 Multipul Evaluation을 사용하면서 어디에 오류가 발생했는지 확인하기 Seia Seia 18.10.21.14:47 163
499 [Python] 수를 뒤집는 두 가지 방법 3 이니스프리 이니스프리 20.02.11.22:24 163
498 HDMI 단자의 QHD 출력을 정식으로 지원하지 않는 NVIDIA 그래픽 카드로 QHD 60 Hz 해상도 출력하기 2 image 제르엘 제르엘 24.06.09.17:45 163