• 목록
  • 아래로
  • 위로

안녕하세요??

 

뉴스 기사에서 특정 데이터를 추출하려고 하는데요 :)

 

국내 뉴스 API 중에서 검색기간 설정이 가능한 것이 있을까요??

 

예를 들면 최근 1개월 이내의 기사만 필터링하거나, 기간을 직접 입력할 수 있으면 좋겠는데요~

 

 

검색해보니 네이버는 아쉽게도 지원하지 않는 것 같네요 ㅠㅠ

 

https://developers.naver.com/docs/search/news/

 

NAVER Developers - 검색 API 뉴스 검색 개발가이드

 

아무래도 자사의 수익성을 저해하는 측면이 있을테니 뉴스 API는 다들 부실한 것 같네요 ㅠㅠ

 

 

최신순으로 정렬하여 기사를 받아와서 적절히 기간별로 분류하면 되지 않겠냐고 생각하실 수도 있겠지만...

 

단순히 최신순으로 기사를 받으면 관련성이 너무 낮은 기사까지 여과없이 전달하네요 ㅜㅜ

 

 

그럼 저의 우문에 현답을 부탁드릴게요~

 

항상 감사드려요 :)

 

굿밤 되세요!!

 

작성자
이니스프리 95 Lv. (70%) 732770/737280EXP

ཇོ་མོ་གླང་མ

댓글 5

Hanam09
profile image
개인적인 의견입니다만, API에서 제공을 하지 않는다면, 이런방법들을 사용해보는게 어떨까요?
여기에 몇가지 도움이 될만한 방안들을 생각해보았습니다.

1. 관련성이 너무 떨어지는것이 문제라면 정규표현식 같은 걸로 필터링해보는건 어떨까요?
2. 글을 읽어보니 이미 검색어가 지정된 상태에서 뉴스를 가져오는것 같습니다.
이럴경우 특종을 좋아하는 기자들 특성상 해당 검색 시점 트렌드에 맞는 최신 기사들이 빠르게 올라올 확률이 매우 높습니다.
이 경우는 관련성 문제가 사실상 없을거라 생각합니다만, 검색 API를 사용하시면서 그것만으로 이미 해결되신것 같은데,
어떤 부분에서 관련성 문제가 있는건지 의문입니다.
3. 중복되는 기사같은것이 문제라면 유사도를 구하는 알고리즘(ex. 자카드 유사도)을 참고하거나 사용해보는것도 좋은 방법중 하나입니다.
comment menu
2020.05.14. 01:43

신고

"Hanam09님의 댓글"

이 댓글을 신고 하시겠습니까?

이니스프리 작성자 → Hanam09
profile image

오오~ 좋은 아이디어를 주셔서 감사드립니다 :)

1. 정규식 등 여러 방법을 사용해서 필터링을 해볼게요 :)
2. 최신순으로 정렬을 하는 경우에 상대적으로 관련성에서 문제가 발생한다는 취지로 말씀드린거에요~! ^-^

(받아온 데이터를 처리하는 과정 중에서 시간 순으로 정렬하는 것이 관련성을 판단하는 것보다 차라리 쉽네요)
3. 그나마 중복되는 것은 누락되는 것에 비해 괜찮지만 말씀하신 방법을 사용해볼게요!!

그럼 좋은 하루 되세요!!

comment menu
2020.05.14. 09:57

신고

"이니스프리님의 댓글"

이 댓글을 신고 하시겠습니까?

신고

"이니스프리님의 댓글"

이 댓글을 신고 하시겠습니까?

이니스프리 작성자
profile image

일단 naver API가 아니라 사이트 자체를 크롤링하는 것으로 해결하긴 했네요 ㅠㅠ

설정할 수 있는 옵션에서 차이가 꽤 있어서요 ㄷㄷ

다만 네이버 측에서 파싱을 번거롭게 만들어놓았더군요~!

comment menu
2020.05.14. 18:22

신고

"이니스프리님의 댓글"

이 댓글을 신고 하시겠습니까?

이니스프리 작성자
profile image
저와 비슷한 고민을 하시는 분이 계실까봐 댓글을 남기네요~!
네이버 뉴스를 직접 크롤링하시려면 제가 작성한 글을 참고하시길 바랍니다 ^^
https://studyforus.com/innisfree/693469
comment menu
2020.05.14. 20:27

신고

"이니스프리님의 댓글"

이 댓글을 신고 하시겠습니까?

권한이 없습니다.
번호 제목 글쓴이 날짜 조회 수
공지 [매우 중요 공지] 접속안되는 사태가 발생했습니다. 24 마스터 20.05.24.04:10 1249
공지 알림판 기능과 로또 기능이 추가 되었습니다. 6 마스터 20.05.14.00:09 2321
공지 사이트 디자인 변경 안내 19 마스터 20.05.03.22:16 2577
공지 [필독] 질문하는 방법 17 마스터 18.02.23.03:09 2670
747 게임 용어에 대해 질문 드립니다 (탱커/딜러/힐러) 18 updated 이니스프리 22시간 전20:45 64
746 AWS elastic inference 끄는 법 아세요? 15 imageupdated title: 인스타그램왕뚠뚠돈까스.. 3일 전15:21 118
745 핸드폰 유심이 이상해요. 7 title: 인스타그램슬기 5일 전19:18 66
744 PHP) GetText 사용 관련 1 title: 생일 케이크 (1년권)Estrella3 5일 전17:02 56
743 CSS 이미지 창크기에 맞추는 방법 질문! 2 title: 투명 아이콘마당쇠15 6일 전10:47 37
742 글쓰기 포인트 차감을 우회하여 도배하는 스팸에 대해 질문드려요~! 22 이니스프리 6일 전00:25 129
741 파이썬으로 엑셀 데이터와 이미지를 읽어 아래한글로 만드는 매크로 프로그램을 만들고 싶어요. 5 말카 20.05.28.09:56 68
740 PHP) Sandbox에서 실행한 결과와 실제 서버에서 구동되는게 다릅니다. 6 title: 생일 케이크 (1년권)Estrella3 20.05.28.09:11 66
739 [자바스크립트] 브라우저의 활성화 여부를 서버 측에서 확인할 수 있는가요?? 9 이니스프리 20.05.26.17:16 63
738 AWS Lightsail 관련해서 질문이 있습니다... 24 MYIG 20.05.26.00:18 163
737 셀레니움으로 토르브라우저 조종하고 싶습니다 8 title: 대한민국 국기gimmepoint 20.05.25.22:58 93
736 공유기 구매하려고 하는데 사양이 고민됩니다. 10 image title: Ubuntu LogoApache 20.05.24.21:55 112
735 노트9 케이스 추천을 다시 부탁드립니다 ㅠㅠ 11 이니스프리 20.05.22.21:24 103
734 듀얼 vs 와이드 모니터 질문 드려요~! 17 이니스프리 20.05.21.23:15 158
733 (해결) 4 title: 생일 케이크 (1년권)Estrella3 20.05.18.20:51 107
732 클라우드 플레어 연결 관련 도와주세요 6 image Ruwaku 20.05.18.09:26 154
731 TP-LINK 무선 안테나를 잃어버렸는데 대체제가 있을까요?? 10 이니스프리 20.05.15.23:02 165
730 안드로이드 에뮬레이터 질문 드립니다. 1 Nginx 20.05.14.18:24 175
국내 뉴스 API 중에 검색기간 설정이 가능한 것이 있을까요?? 5 이니스프리 20.05.14.00:19 187
728 유튜브 다운로더에 대해 여쭤봅니다. 31 Nginx 20.05.12.22:05 378