• 목록
  • 아래로
  • 위로

저는 우분투와 파이썬에 대해 잘 모르기 때문에 이 글에 부족한 부분이 많을 것으로 생각됩니다.


부정확한 부분이 있으면 댓글로 말씀해주시면 감사하겠습니다.



PhantomJS가 다른 Headless browser와 비교할 때 설치 및 Webdriver API 사용법이 가장 간단하지만,


현재는 deprecated된 상태이고 실행은 되지만 크롬이나 파폭을 이용하라고 경고가 뜹니다.


또한 크롬이나 파폭에서 보이는 화면과 다르게 보이는 경우가 적지 않게 있어서 


일일이 스크린샷을 찍으며 확인을 해야 되고,


가장 큰 문제점은 자바스크립트와 관련하여 충돌이 발생하는 경우가 있습니다.



한편 Chromedriver는 윈도우에서는 chromedriver.exe만 있으면 잘 돌아가지만


현재 우분투에서 크로미움과 관련하여 여러 에러가 보고되고 있습니다.


제가 아직 이에 대한 확실한 솔루션을 제시한 글을 찾지 못해서 이 글에서는 다루지 않겠습니다.



설치를 시작하기에 앞서 시스템을 최신으로 업데이트하는 것을 권장합니다.


# sudo apt-get update -y
# sudo apt-get upgrade -y
# sudo shutdown -r now




1. PhantomJS


(1) 우선 PhantomJS에서 필요로 하는 패키지를 설치합니다.

# sudo apt-get install build-essential chrpath libssl-dev libxft-dev libfreetype6-dev libfreetype6 libfontconfig1-dev libfontconfig1 -y


(2) 현재 최신버전의 PhantomJS를 다운로드 받습니다.

# sudo wget https://bitbucket.org/ariya/phantomjs/downloads/phantomjs-2.1.1-linux-x86_64.tar.bz2


(3) 압축을 해제합니다.

# sudo tar xvjf phantomjs-2.1.1-linux-x86_64.tar.bz2 -C /usr/local/share/


(4) 심링크를 생성합니다.

# sudo ln -s /usr/local/share/phantomjs-2.1.1-linux-x86_64/bin/phantomjs /usr/local/bin/


(5) 설치된 PhantomJS의 버전을 확인해봅니다.

# phantomjs --version


(6) 파이썬에서는 webdriver API를 다음과 같은 방법으로 사용할 수 있습니다.


driver = webdriver.PhantomJS('/usr/local/bin/phantomjs')





2. Geckodriver (Firefox)


셀레니움 3.0 이전 버전에서는 geckodriver를 따로 설치할 필요가 없었지만 


현재는 설치를 하지 않으면 에러를 발생합니다.



우선 파이어폭스가 설치되어 있다는 전제하에 최신버전의 geckodriver를 다운받습니다.


# wget https://github.com/mozilla/geckodriver/releases/download/v0.18.0/geckodriver-v0.18.0-linux64.tar.gz



geckodriver 파일을 어느 폴더에 압축을 풀어야 하는지에 관하여 버전별로 조금씩 차이가 있고 이에 대한 논쟁이 있는데


현재는 /usr/local/bin/에 설치하고 퍼미션을 777로 주면 작동하는 것을 확인했습니다.

(주의: /usr/bin/이나 /usr/local/bin/geckodriver/가 아닙니다.)



기본적으로는 다음과 같은 방법으로 파이썬에서 Webdriver API를 사용할 수 있습니다.


-headless 등 옵션을 사용하려면 import 해줘야 합니다. (크롬과 차이점)



from selenium.webdriver.firefox.options import Options


options = webdriver.FirefoxOptions()

options.add_argument('-headless')

driver = webdriver.Firefox(executable_path="/usr/local/bin/geckodriver", firefox_options=options)



작성자
이니스프리 119 Lv. (2%) 4160290/115200000EXP

Make StudyForUs Great Again!

 

CSVpuymXAAAVVpd.jpg

댓글 0

권한이 없습니다.
번호 제목 글쓴이 날짜 조회 수
공지 시스템 점검 작업 완료 안내 10 마스터 마스터 24.09.05.16:25 2168
공지 [중요] 호스팅 만료와 관련하여 일부 수칙이 변경됩니다. 4 마스터 마스터 23.01.14.02:23 9009
440 물리학에 대해서 좀더 심층적으로 배워보고 싶다하는 분들 들어와보세요 Adam title: 대한민국 국기Adam 17.10.09.17:32 435
439 (펌) 스포어 에디터 단축키 1 이니스프리 이니스프리 17.11.01.21:45 844
438 웹사이트 개인정보보호 의무조치 개선방법 안내 (방송통신위원회, 한국인터넷진흥원 작성) 1 file 이니스프리 이니스프리 17.11.02.20:22 458
437 PHP 7에서 아미나 구형 위젯 사용시 수정해야 할 부분 2 이니스프리 이니스프리 17.11.07.20:48 540
436 [밤에 하는 사람들을 위한 팁] Windows 10에 내장된 야간모드 image Seia Seia 17.11.09.00:44 390
435 이북 무료 제공 - JavaScript: Novice to Ninja 4 이니스프리 이니스프리 17.11.09.13:35 499
434 Windows 10 에서 Telnet 사용하기.. 1 image 여우나라 title: Fox여우나라 17.11.10.10:49 898
433 아미나빌더 1.7.20 업데이트 5 이니스프리 이니스프리 17.11.10.16:01 428
432 JavaScript에서 문자열 결합 방식의 성능차이 네모 네모 17.11.17.23:01 1696
431 DB 설계하실 때 사용하면 좋을거 같은 사이트 공유합니다. 1 image JAVA JAVA 17.11.21.15:06 7067
430 URL에 ?ckattempt=1이 붙거나 403 에러가 뜨는 경우에 해결 방법 (카페24) 2 이니스프리 이니스프리 17.11.22.20:56 1512
429 SKT 데이터 함께 쓰기, 회선수 제한, 직구폰 개통, 아이폰 직구시 주의사항 등 관련 팁 2 이니스프리 이니스프리 17.11.23.20:58 4049
428 윈도우 10 업그레이드 후 windows.old 삭제 방법 4 이니스프리 이니스프리 17.12.01.20:55 715
427 Windows 배치파일 작성 시 귀차니즘 1% 해결 Seia Seia 17.12.03.11:37 373
426 [멀웨어 정보] KT 홈허브 관련 DHCP 설정 변조 관련 멀웨어 유포 정보 및 대처 방법 6 이니스프리 이니스프리 17.12.05.23:20 844
425 직구나 프로그램 다운로드시 사용 가능한 무료 해외 SMS 수신 사이트 8 이니스프리 이니스프리 17.12.09.14:50 3152
424 For Intel 8th GEN 4 Seia Seia 17.12.15.20:14 405
423 여러분은 Behance를 아시나요? Seia Seia 17.12.15.20:51 355
422 [게임하시는 분들을 위한 팁] 프래임 드랍 해결하기! ProjectSE ProjectSE 18.02.18.16:59 483
421 메일수신이 안된다고...? mail.yandex.com mx 리코드를 이용해보자 2 image djdisodo 18.02.21.17:04 2237