코드
2020.01.23 17:47

[Python] 네이버 실시간 검색어

조회 수 1321 추천 수 0 댓글 3
?

단축키

Prev이전 문서

Next다음 문서

크게 작게 위로 아래로 댓글로 가기 인쇄
?

단축키

Prev이전 문서

Next다음 문서

크게 작게 위로 아래로 댓글로 가기 인쇄
Extra Form
라이선스 MIT

네이버가 이제 실시간 검색어 부분을 동적으로 불러오도록 정책이 바뀌었네요.

덕분에 불필요한 리소스를 가져올 필요가 없어서 트래픽도 엄청 줄어들고 파싱을 할 때 HTML 파싱이 아닌 json 파싱이 가능해졌습니다.


import requests
import json

url = 'https://www.naver.com/srchrank?frm=main&ag=20s&gr=0&ma=0&si=0&en=0&sp=0'
res = json.loads(requests.get(url).content)
rank = [*map(lambda item: item['keyword'], res['data'])]
print(rank)


여기서 ag부분은 나이를 의미하고, 나머지 파라미터의 경우에도 검색어 설정 부분에서 주어진 값을 -2에서 2까지 값으로 가중치를 주는 방식입니다. 해당 코드는 20대이면서 모든 가중치를 보통으로 준 경우에 사용하는 코드입니다.


해당 방식으로 바뀌면서 검색어의 차이를 나이 대별이나 관심사의 차이에 따라 어떻게 되는지 알아보는 실험을 하는 등의 작업이 가능하겠습니다.

  • profile
    이니스프리 2020.01.23 21:52
    오오~ 좋은 정보 감사드립니다!
    그렇지 않아도 어제 네이버 드라마 검색 결과를 크롤링해보려고 했는데 동적으로 불러오더군요 ^^
    그럼 humit 님께서도 즐겁고 뜻깊은 설 연휴 되세요!
    덕분에 늘 많이 배워서 항상 감사드립니다 :)
  • profile
    Meme 2020.02.06 17:30
    혹시 url의 json 주소는 어떻게 구할수 있는지 알 수 있을까요?
  • profile
    title: 황금 서버 (30일)humit 2020.02.06 21:29
    무슨 의미인지 잘 모르겠네요...

  1. AWSCLI, in a single file (portable, linux)

  2. [Python-Gnuboard] 파이썬으로 구현한 그누보드 자동 글쓰기 함수

  3. [Python] 휴일지킴이 약국을 크롤링하여 Folium 지도에 마커로 표시하는 PyQt 윈도우 앱

  4. 도박 중독자를 위한 광고 차단 규칙

  5. [Python] 유튜브 영상을 다운받아 일정 간격으로 캡쳐하여 10장씩 merge하기

  6. [Autohotkey] 매분 정각에 전체화면을 캡쳐하는 스크립트

  7. [Python/Telegram] Studyforus 알림봇 (댓글, 스티커 파싱)

  8. [Python] url 주소로부터 IP 주소 알아내기

  9. [Python] 네이버 실시간 검색어

  10. Koa에서 자동으로 라우팅 채워주기

  11. JavaScript에서 파이썬 문자열 처리 함수 중 하나 (바인딩)를 구현

  12. [Python] Google Image Search 결과를 받아오기

  13. [파이썬] Requests를 사용한 네이버 카페 크롤링 - 일정수 이상의 리플이 달린 게시글만 텔레그램 알림

  14. [JS] 클라이언트단 GET Parameter

  15. [Python] 싸이월드 미니홈피 백업 스크립트

  16. [Python] PIL을 이용한 Animated GIF의 리사이징

  17. [PyQt] sir.kr에서 스크랩한 게시글을 보여주는 윈도우앱 (검색 및 정렬 가능)

  18. [아미나] Dropbox API를 이용한 이미지 호스팅 보드스킨

  19. [Python] 네이버 모바일 이미지 검색에서의 이미지 파일을 멀티스레드로 다운받고 1개의 파일로 병합

  20. [PHP/Javascript] 아미나에 자동으로 게시글을 생성하고 Ajax로 전송하여 결과를 표시하기

Board Pagination Prev 1 2 3 4 Next
/ 4