• 목록
  • 아래로
  • 위로

안녕하세요??

 

뉴스 기사에서 특정 데이터를 추출하려고 하는데요 :)

 

국내 뉴스 API 중에서 검색기간 설정이 가능한 것이 있을까요??

 

예를 들면 최근 1개월 이내의 기사만 필터링하거나, 기간을 직접 입력할 수 있으면 좋겠는데요~

 

 

검색해보니 네이버는 아쉽게도 지원하지 않는 것 같네요 ㅠㅠ

 

https://developers.naver.com/docs/search/news/

 

NAVER Developers - 검색 API 뉴스 검색 개발가이드

 

아무래도 자사의 수익성을 저해하는 측면이 있을테니 뉴스 API는 다들 부실한 것 같네요 ㅠㅠ

 

 

최신순으로 정렬하여 기사를 받아와서 적절히 기간별로 분류하면 되지 않겠냐고 생각하실 수도 있겠지만...

 

단순히 최신순으로 기사를 받으면 관련성이 너무 낮은 기사까지 여과없이 전달하네요 ㅜㅜ

 

 

그럼 저의 우문에 현답을 부탁드릴게요~

 

항상 감사드려요 :)

 

굿밤 되세요!!

 

작성자
이니스프리 119 Lv. (2%) 4188230/115200000EXP

Make StudyForUs Great Again!

 

CSVpuymXAAAVVpd.jpg

댓글 6

Hanam09
profile image
+1
개인적인 의견입니다만, API에서 제공을 하지 않는다면, 이런방법들을 사용해보는게 어떨까요?
여기에 몇가지 도움이 될만한 방안들을 생각해보았습니다.

1. 관련성이 너무 떨어지는것이 문제라면 정규표현식 같은 걸로 필터링해보는건 어떨까요?
2. 글을 읽어보니 이미 검색어가 지정된 상태에서 뉴스를 가져오는것 같습니다.
이럴경우 특종을 좋아하는 기자들 특성상 해당 검색 시점 트렌드에 맞는 최신 기사들이 빠르게 올라올 확률이 매우 높습니다.
이 경우는 관련성 문제가 사실상 없을거라 생각합니다만, 검색 API를 사용하시면서 그것만으로 이미 해결되신것 같은데,
어떤 부분에서 관련성 문제가 있는건지 의문입니다.
3. 중복되는 기사같은것이 문제라면 유사도를 구하는 알고리즘(ex. 자카드 유사도)을 참고하거나 사용해보는것도 좋은 방법중 하나입니다.
comment menu
2020.05.14. 01:43

신고

"Hanam09님의 댓글"

이 댓글을 신고 하시겠습니까?

이니스프리 작성자 → Hanam09
profile image

오오~ 좋은 아이디어를 주셔서 감사드립니다 :)

1. 정규식 등 여러 방법을 사용해서 필터링을 해볼게요 :)
2. 최신순으로 정렬을 하는 경우에 상대적으로 관련성에서 문제가 발생한다는 취지로 말씀드린거에요~! ^-^

(받아온 데이터를 처리하는 과정 중에서 시간 순으로 정렬하는 것이 관련성을 판단하는 것보다 차라리 쉽네요)
3. 그나마 중복되는 것은 누락되는 것에 비해 괜찮지만 말씀하신 방법을 사용해볼게요!!

그럼 좋은 하루 되세요!!

comment menu
2020.05.14. 09:57

신고

"이니스프리님의 댓글"

이 댓글을 신고 하시겠습니까?

이니스프리 작성자 → Hanam09
profile image

존재하지 않는 스티커입니다.

comment menu
2020.05.14. 09:57

신고

"이니스프리님의 댓글"

이 댓글을 신고 하시겠습니까?

신고

"이니스프리님의 댓글"

이 댓글을 신고 하시겠습니까?

이니스프리 작성자
profile image

일단 naver API가 아니라 사이트 자체를 크롤링하는 것으로 해결하긴 했네요 ㅠㅠ

설정할 수 있는 옵션에서 차이가 꽤 있어서요 ㄷㄷ

다만 네이버 측에서 파싱을 번거롭게 만들어놓았더군요~!

comment menu
2020.05.14. 18:22

신고

"이니스프리님의 댓글"

이 댓글을 신고 하시겠습니까?

이니스프리 작성자
profile image
저와 비슷한 고민을 하시는 분이 계실까봐 댓글을 남기네요~!
네이버 뉴스를 직접 크롤링하시려면 제가 작성한 글을 참고하시길 바랍니다 ^^
https://studyforus.com/innisfree/693469
comment menu
2020.05.14. 20:27

신고

"이니스프리님의 댓글"

이 댓글을 신고 하시겠습니까?

권한이 없습니다.
번호 제목 글쓴이 날짜 조회 수
공지 시스템 점검 작업 완료 안내 10 마스터 24.09.05.16:25 2612
공지 [중요] 호스팅 만료와 관련하여 일부 수칙이 변경됩니다. 4 마스터 23.01.14.02:23 10064
공지 [필독] 질문하는 방법 17 마스터 18.02.23.03:09 4946
206 스마트폰 케이스 추천 부탁드립니다! 14 이니스프리 20.05.08.20:56 306
205 와! 버그 2 image {Cog} 20.05.09.07:27 372
204 메일 서버 구축과 관련해 질문 있습니다! 13 갱생협스 20.05.10.14:24 526
203 원룸 을 월세로 알아보는대.. 8 핫슈 20.05.11.19:20 433
202 유튜브 다운로더에 대해 여쭤봅니다. 31 Nginx 20.05.12.22:05 685
국내 뉴스 API 중에 검색기간 설정이 가능한 것이 있을까요?? 6 이니스프리 20.05.14.00:19 533
200 안드로이드 에뮬레이터 질문 드립니다. 1 Nginx 20.05.14.18:24 250
199 TP-LINK 무선 안테나를 잃어버렸는데 대체제가 있을까요?? 10 이니스프리 20.05.15.23:02 337
198 클라우드 플레어 연결 관련 도와주세요 6 image Ruwaku 20.05.18.09:26 457
197 (해결) 4 260578 20.05.18.20:51 221
196 듀얼 vs 와이드 모니터 질문 드려요~! 17 이니스프리 20.05.21.23:15 990
195 노트9 케이스 추천을 다시 부탁드립니다 ㅠㅠ 11 이니스프리 20.05.22.21:24 216
194 공유기 구매하려고 하는데 사양이 고민됩니다. 10 image Apache 20.05.24.21:55 343
193 셀레니움으로 토르브라우저 조종하고 싶습니다 8 title: 대한민국 국기gimmepoint 20.05.25.22:58 1203
192 AWS Lightsail 관련해서 질문이 있습니다... 24 MYIG 20.05.26.00:18 627
191 [자바스크립트] 브라우저의 활성화 여부를 서버 측에서 확인할 수 있는가요?? 9 이니스프리 20.05.26.17:16 523
190 PHP) Sandbox에서 실행한 결과와 실제 서버에서 구동되는게 다릅니다. 6 260578 20.05.28.09:11 265
189 파이썬으로 엑셀 데이터와 이미지를 읽어 아래한글로 만드는 매크로 프로그램을 만들고 싶어요. 5 말카 20.05.28.09:56 2360
188 글쓰기 포인트 차감을 우회하여 도배하는 스팸에 대해 질문드려요~! 22 이니스프리 20.05.31.00:25 535
187 CSS 이미지 창크기에 맞추는 방법 질문! 2 마당쇠15 20.05.31.10:47 575