앞으로 Study For Us HOSTING 카톡 채널에서 장애 소식 안내합니다. (클릭시 카톡 채널 이동)
일주일 동안 열지 않기
단축키 안내 m=메인페이지 / n=공지 / f=자유게시판 / h=호스팅 페이지 / q=FAQ / c=출석체크 / p=패널접속 / s=스포티콘 / w=스포어 위키
일주일 동안 열지 않기

Home

✔ 뷰어로 보기

코드

2019.07.03 20:17

[Python] Selenium을 이용하여 특정 element를 캡처하는 스크립트

이니스프리

조회 수 7671 추천 수 2 댓글 2

단축키

Prev이전 문서

Next다음 문서

가 크게 작게 위로 아래로 댓글로 가기 인쇄 첨부

단축키

Prev이전 문서

Next다음 문서

가 크게 작게 위로 아래로 댓글로 가기 인쇄 첨부

Extra Form
라이선스	MIT

안녕하세요?

Selenium을 이용하여 웹페이지의 특정 element를 캡처하는 스크립트를 작성해보았습니다.

일반적인 윈도우의 캡처 프로그램(픽픽 등)은 element를 선택하여 캡처할 수는 없다고 알고 있네요.

물론 아래 URL에 소개된 것처럼 크롬 개발자도구를 이용하여 element를 캡처하는 방법이 있지만요.

https://umaar.com/dev-tips/156-element-screenshot/

그래서 이 스크립트를 작성하게 되었습니다.

여러모로 부족한 점이 많지만 이 스크립트의 대략적인 구동방법을 말씀드리자면

Selenium으로 웹페이지에 접속한 후에 해당 element의 위치와 크기를 구하고

전체 화면을 캡처한 후에 element의 위치와 크기에 알맞게 crop을 하는 방법을 택했습니다.

Selenium 이외에도 이미지처리와 관련하여 Pillow를 필요로 합니다.

Stackoverflow 등에 관련된 Q&A가 있었지만 제가 직접 구동해보니 약간의 문제가 있었습니다.

https://stackoverflow.com/questions/13832322/how-to-capture-the-screenshot-of-a-specific-element-rather-than-entire-page-usin

제가 구글링 실력이 부족한지 제대로 작동하는 스크립트를 찾지는 못했어요 ㅠㅠ

단순히 get_screenshot_as_png를 이용하면 element가 화면보다 긴 경우에 짤리는 문제가 발생하더군요.

Stackoverflow에 location 대신에 location_once_scrolled_into_view를 이용하면 된다는 리플도 있었지만

element가 아주 길어지면 역시 중간에서 짤리더군요 ㅠㅠ

그래서 주먹구구식이기는 하지만 일단 전체 페이지의 사이즈를 구하고

브라우저의 창 크기를 그에 맞게 확대한 후에 스크린캡처를 하는 방법을 택했습니다.

이것이 최선의 방법은 아닐 것 같지만 일단 제가 테스트한 바로는 잘 작동하네요 ^^

from selenium import webdriver
from PIL import Image
from io import BytesIO
from selenium.webdriver.firefox.options import Options

options = Options()
options.headless = True
driver = webdriver.Firefox(options=options)
driver.get(캡쳐할 웹페이지의 주소)

# 전체 페이지의 사이즈를 구하여 브라우저의 창 크기를 확대하고 스크린캡처를 합니다.
page_width = driver.execute_script('return document.body.parentNode.scrollWidth')
page_height = driver.execute_script('return document.body.parentNode.scrollHeight')
driver.set_window_size(page_width, page_height)
png = driver.get_screenshot_as_png()

# 특정 element의 위치를 구하고 selenium 창을 닫습니다.
element = driver.find_element_by_class_name(캡쳐할 element의 class)
image_location = element.location
image_size = element.size
driver.quit()

# 이미지를 element의 위치에 맞춰서 crop 하고 저장합니다.
im = Image.open(BytesIO(png))
left = image_location['x']
top = image_location['y']
right = image_location['x'] + image_size['width']
bottom = image_location['y'] + image_size['height']
im = im.crop((left, top, right, bottom))
im.save('저장할 파일명.png')

제가 이 스크립트를 작성하면서 느낌 점이 있는데 Selenium이 굉장히 민감한 것 같아요 ㅠㅠ

구글링을 해보니 크롬과 파이어폭스에 따라 캡처된 결과물이 다르다고 하더군요.

(대체로 스크린캡처와 관련해서는 파이어폭스를 조금 더 추천하는 것 같더군요)

그리고 제가 테스트해본 바로는 headless 모드와 일반 모드에 따라 캡처된 결과물이 달라지는 경우도 있었어요.

여러모로 부족한 글 읽어주셔서 감사합니다 ^^

그럼 내일부터 또 더워진다는데 스포어 회원님들께서도 항상 건강하세요!

humit 님의 https://studyforus.com/freeboard/583864 게시물에서 .board-wrapper를 캡처해봤어요 ^-^

Who's 이니스프리

Make StudyForUs Great Again!

추천

비추천

Atachment
첨부 '1'	screenshot.jpg,

Facebook Twitter Google Pinterest

위로 아래로 댓글로 가기 인쇄 첨부

✔댓글 쓰기

에디터 선택하기

✔ 텍스트 모드 ✔ 에디터 모드

Comments '2'

humit 2019.07.10 00:44

Firefox는 잘 모르겠지만 크롬의 경우에는 headless 모드와 일반 모드일 때 윈도우 사이즈가 동일하더라도 화면의 사이즈가 달라지더라고요.
화면 사이즈만 동일하게 맞춰주면 UI 상으로는 크게 차이가 없는 것처럼 보였습니다.

댓글
이니스프리 2019.07.10 00:58

옙 구글링해보니 Stackoverflow 등에서는 humit 님께서 말씀하신 그런 이유도 있고 해서
스크린 캡쳐와 관련해서는 대체로 파폭을 더 추천하는 분위기이더군요.

그런데 이 스크립트가 윈도우에서는 분명히 잘 작동하는데
VPS에서 테스트를 해보니 에러가 나는 경우가 많더군요.
from pyvirtualdisplay import Display로 display를 지정해봐도 마찬가지이구요.
Stackoverlfow를 검색해보니 파폭을 업데이트하거나 아예 낮은 버전을 쓰라고 되어 있어서 둘 다 시도해봤는데 잘 안 되더군요.
항상 안 되는 것은 아니고 시스템을 reboot를 하고 다시 시도해보면 어쩌다가 한 번 캡쳐가 되기도 하던데요.
geckodriver.log를 봐도 실행할 때마다 에러로그가 달라서 정확한 원인을 찾지 못했네요 ㅠㅠ
제 추측으로는 상하로 긴 element를 png 파일로 저장할 때 시스템 리소스가 부족한 것이 아닌가 하는 생각도 드네요.

humit 님께서 해결해주신 PyQt의 GUI 문제와 더불어 우분투에서 Selenium의 문제까지 겹쳐서
요새 며칠 파이썬 대신 C#이나 C++을 공부해야 되는 것이 아닌가 하는 생각마저 들었네요 ㄷㄷ

그럼 humit 님께서도 편안한 밤 되시고 안녕히 주무세요 ^^
늘 진심으로 감사드립니다!

댓글

Category

List of Articles
번호	분류	제목	글쓴이	날짜	조회 수
74	코드	AWSCLI, in a single file (portable, linux) 1	Seia	2021.04.10	2065
73	코드	[Python-Gnuboard] 파이썬으로 구현한 그누보드 자동 글쓰기 함수 1	이니스프리	2021.04.08	3496
72	코드	[Python] 휴일지킴이 약국을 크롤링하여 Folium 지도에 마커로 표시하는 PyQt 윈도우 앱 7	이니스프리	2021.03.13	3097
71	코드	도박 중독자를 위한 광고 차단 규칙	제르엘	2020.08.21	2440
70	코드	[Python] 유튜브 영상을 다운받아 일정 간격으로 캡쳐하여 10장씩 merge하기 3	이니스프리	2020.05.27	3150
69	자료	[Autohotkey] 매분 정각에 전체화면을 캡쳐하는 스크립트 4	이니스프리	2020.05.22	3150
68	코드	[Python/Telegram] Studyforus 알림봇 (댓글, 스티커 파싱) 7	이니스프리	2020.05.15	2712
67	코드	[Python] url 주소로부터 IP 주소 알아내기	humit	2020.02.20	4214
66	코드	[Python] 네이버 실시간 검색어 3	humit	2020.01.23	3149
65	코드	Koa에서 자동으로 라우팅 채워주기	Seia	2020.01.22	2576
64	코드	JavaScript에서 파이썬 문자열 처리 함수 중 하나 (바인딩)를 구현 7	Seia	2020.01.20	2336
63	코드	[Python] Google Image Search 결과를 받아오기	이니스프리	2019.12.09	3156
62	코드	[파이썬] Requests를 사용한 네이버 카페 크롤링 - 일정수 이상의 리플이 달린 게시글만 텔레그램 알림 3	이니스프리	2019.11.17	6274
61	코드	[JS] 클라이언트단 GET Parameter	Hanam09	2019.11.16	2554
60	코드	[Python] 싸이월드 미니홈피 백업 스크립트 1	이니스프리	2019.11.07	4311
59	코드	[Python] PIL을 이용한 Animated GIF의 리사이징	이니스프리	2019.11.03	3403
58	코드	[PyQt] sir.kr에서 스크랩한 게시글을 보여주는 윈도우앱 (검색 및 정렬 가능) 7	이니스프리	2019.08.09	3055
57	코드	[아미나] Dropbox API를 이용한 이미지 호스팅 보드스킨 12	이니스프리	2019.07.13	3526
56	코드	[Python] 네이버 모바일 이미지 검색에서의 이미지 파일을 멀티스레드로 다운받고 1개의 파일로 병합 11	이니스프리	2019.07.12	3361
55	코드	[PHP/Javascript] 아미나에 자동으로 게시글을 생성하고 Ajax로 전송하여 결과를 표시하기 2	이니스프리	2019.07.09	2850

쓰기

[Python] Selenium을 이용하여 특정 element를 캡처하는 스크립트

단축키

단축키

Who's 이니스프리

스터디 최근글 [1/]

로그인