• 목록
  • 아래로
  • 위로

*이 글은 Selenium을 막아놓은 몇몇 사이트에 대한 추론을 통해 작성되었고, 아직 검증이 충분히 되지 않았습니다.



Stackoverflow에 보면 Selenium을 detect하는 방법에 대해 여러 Q&A글이 있습니다.


https://stackoverflow.com/questions/33225947/can-a-website-detect-when-you-are-using-selenium-with-chromedriver


그런데 PhantomJS, Chrome, Firefox 중 어느 것을 사용하느냐에 따라서 방법이 달라지고,


동일한 headless 브라우저라도 버전에 따라 차이가 있기 때문에 효율적인 방법이 존재하지는 않는 것 같습니다.



CMS에 Selenium 봇이 글을 작성하는 것을 차단하려면, 결국 Selenium이 웹사이트에 로그인 하는 것을 막으면 됩니다.


Selenium에서는 send_keys() 메서드를 사용하여 id와 pw를 입력한 후에


다시 send_keys() 메서드로 엔터를 입력하거나, submit 버튼에 대해 click() 메서드를 사용하겠죠.


로그인을 하지 않아도 글을 쓸 수 있는 경우에는 대부분 캡챠를 활성화했을테니


Tensorflow나 Tesseract 없이 Selenium만 단독으로 사용하면 이 부분에서 막힐 것입니다.



따라서 id/pw를 입력하는 element에 실제로 키 입력이 이루어졌는지 여부로 Selenium인지 아닌지 여부를 판단할 수 있습니다.


다만 브라우저 익스텐션 중 자동 로그인과 관련된 것이나, 브라우저 자체의 id/pw 자동 입력 기능까지도 차단할 개연성이 있습니다.


결국 id/pw를 입력하는 element에서 엔터 또는 탭의 입력이 있거나,

(탭을 이용하여 submit 버튼으로 이동하는 경우도 있기 때문입니다.)


submit 버튼에 마우스가 hover 되는지 여부로 판단하면 될 것 같습니다.

(id/pw/submit element에서 엔터 입력이 있거나, submit 버튼에 마우스가 hover 되는지 여부로 판단할 수도 있겠죠.)



물론 pyclipper 등을 이용하여 id/pw를 copy & paste한 후에 엔터를 입력하는 방식으로 위와 같은 방법을 우회할 수 있지만,


이러한 방법은 headless 브라우저를 사용하거나, 브라우저가 백그라운드에서 동작하는 경우에는 사용할 수 없습니다.


따라서 Selenium 봇의 활용도가 크게 떨어진다고 볼 수 있습니다.



제가 지금은 아침이라서 더 이상 길게 적을 수 없고, 조금 더 개념을 정돈하고 내용을 추가하여 다시 글을 올리겠습니다.



+)

Selenium을 이용하지 않고 그누보드나 XE/RXE에 글을 작성할 수 있는지에 대해서 생각해보면 

CMS에서 글을 작성할 때 어떠한 방식으로 데이터를 전송하는지를 파악하면 물론 불가능하지는 않겠지만,

적어도 백링크를 다는 봇은 에디터의 코드입력 모드를 이용할테니 적어도 이런 경우는 막을 수 있을 것으로 생각되네요.

(에디터 대신 textarea를 사용하면서 tag 입력을 허용하는 유형의 사이트는 매우 드물 것 같네요.)

작성자
이니스프리 119 Lv. (1%) 2322130/115200000EXP

Make StudyForUs Great Again!

 

CSVpuymXAAAVVpd.jpg

댓글 2

title: 황금 서버 (30일)humit
profile image
+ 참고로 에디터 모드인 경우에도 해당 부분을 HTML로 저장하는 부분이 있기 때문에 그 부분을 javascript로 직접 입력하게 해서(innerHTML) 우회를 할 수도 있습니다.
comment menu
2019.08.26. 23:38

신고

"humit님의 댓글"

이 댓글을 신고 하시겠습니까?

이니스프리 작성자 → humit
profile image

제가 미처 그 부분까지는 생각을 못하고 글을 작성했네요 ㅠㅠ

다양한 우회 방법이 있군요 ㄷㄷ

역시 보안의 세계는 심오하네요~

말씀해주셔서 감사합니다!

그럼 편안한 밤 되시고 안녕히 주무세요 ^^

comment menu
2019.08.27. 00:22

신고

"이니스프리님의 댓글"

이 댓글을 신고 하시겠습니까?

권한이 없습니다.
번호 제목 글쓴이 날짜 조회 수
공지 [작업 완료] 설 명절 맞이 서버 업데이트 안내 3 마스터 마스터 24.02.11.17:21 1080
공지 [중요] 호스팅 만료와 관련하여 일부 수칙이 변경됩니다. 4 마스터 마스터 23.01.14.02:23 4763
534 개인용 vs 기업용 라이선스에 대해 11 이니스프리 이니스프리 20.05.05.12:18 5435
533 KT 인터넷 오피스 IP 서비스 - 홈 서버용 고정 IP 제공 9 file 이니스프리 이니스프리 18.03.20.22:04 4692
532 대학생이라면 PHPStorm 무료로 이용하세요 2 image Eagles Eagles 17.06.11.14:30 4692
531 [Python] 동영상 파일의 재생시간 길이를 구하기 (OpenCV vs MoviePy) 이니스프리 이니스프리 21.03.12.22:33 4664
530 [Selenium] alert 창을 닫는 방법 및 alert 창이 뜨는 것을 차단하는 방법 1 이니스프리 이니스프리 19.12.26.23:01 4582
529 [파이썬] .isalnum() - 정규표현식을 사용하지 않고 문자열 내 특수문자 사용 여부 확인 이니스프리 이니스프리 19.12.27.22:43 4458
528 Selenium에서 파일을 다운받을 폴더를 지정하기 이니스프리 이니스프리 19.11.18.22:15 4352
527 [끝말잇기] '슘'으로 시작하는 단어 이니스프리 이니스프리 19.08.20.01:10 4324
526 [CMD] 작업 스케줄러에서 Batch 파일을 최소화한 상태로 실행하기 1 이니스프리 이니스프리 20.05.13.23:15 4185
525 [Python] 특정 단어가 들어가는 폴더 또는 파일을 옮기기 이니스프리 이니스프리 20.11.01.14:14 3942
524 SKT 데이터 함께 쓰기, 회선수 제한, 직구폰 개통, 아이폰 직구시 주의사항 등 관련 팁 2 이니스프리 이니스프리 17.11.23.20:58 3915
523 작업 관리자의 CPU 이름 바꾸기 1 image 하루살이 title: 황금 서버 (30일)하루살이 17.09.03.11:33 3836
522 텔레그램 봇의 프로필 이미지를 변경하는 방법 이니스프리 이니스프리 19.11.28.16:33 3745
521 유튜브 단축키를 정리해봤습니다 (+이스터 에그) 2 이니스프리 이니스프리 18.09.26.23:34 3503
520 텔레그램(Telegram)의 보안 및 안전성에 대하여 (기술 내외적 요소를 고려) 이니스프리 이니스프리 18.11.21.21:35 3374
519 특정 파일을 제외한 현재 디렉토리 내의 모든 파일을 삭제하는 배치파일 이니스프리 이니스프리 18.10.12.17:11 3179
518 직구나 프로그램 다운로드시 사용 가능한 무료 해외 SMS 수신 사이트 8 이니스프리 이니스프리 17.12.09.14:50 3067
517 [Python] Naver Login with requests 1 image Hanam09 Hanam09 21.07.17.01:48 2889
516 활성 네트워크 이름 바꾸기 1 image 하루살이 title: 황금 서버 (30일)하루살이 17.09.03.11:36 2887
515 Tesseract에서 숫자만 인식하는 방법 이니스프리 이니스프리 19.11.16.14:48 2886