• 목록
  • 아래로
  • 위로

안녕하세요?


그누보드용 링크파싱 애드온을 짬짬이 만들어보고 있는데요 ^^


다른 분들께서는 어떤 방식으로 만드셨는지 이것저것 테스트해보고 있네요.


그런데 어떤 애드온의 경우에는 다음과 같이 대표사진으로 애매한 사진파일이 등록되더군요 ㅠㅠ



개인적으로 아래 사진이 등록되기를 기대했지만 무리였네요~!



new.gif이 어떤 메커니즘으로 수집이 되었는지는 모르겠지만


"Study For Us - 모두의 지식공유 커뮤니티! 그리고 무료호스팅!!" 이 부분은 head의 meta 태그 중 타이틀을 받아온 것 같은데요.


"본문으로 바로가기 Site Notice FAQ 설문조사"라는 내용도 조금 아쉽네요 ㅠㅠ



이런 문제를 피하려면 어떤 방식으로 사진파일과 컨텐츠를 수집해야 될까요?


일정 크기의 이미지를 불러오는 방식으로 하면 좋겠지만 제 경험상 PHP의 getimagesize() 함수는 모든 경우에 잘 작동하지는 않는 것 같더군요.


마땅한 대표이미지가 없다면 해당 사이트의 파비콘을 받아서 사용하는 것도 하나의 방법이 될 수는 있을 것 같긴 하네요 ^^;



그럼 답변해주실 분께 미리 감사드립니다!


하루만 버티면 주말인데 다들 화이팅입니다~! ^-^


작성자
이니스프리 119 Lv. (2%) 4192330/115200000EXP

Make StudyForUs Great Again!

 

CSVpuymXAAAVVpd.jpg

댓글 9

title: 황금 서버 (30일)humit
profile image

보통 og 태그로 설정이 되어 있는 내용을 읽어오는 것을 기본으로 합니다.

만약 없다면 body에 있는 내용을 토대로 파싱을 하는 방법이 있습니다.

네이버 지식인의 경우에는 og태그가 없으면 아무것도 출럭하지 않습니다.

comment menu
2019.01.11. 11:52

신고

"humit님의 댓글"

이 댓글을 신고 하시겠습니까?

이니스프리 작성자 → humit
profile image

답변해주셔서 정말 감사합니다~!

말씀해주신대로 애드온들이 대체로 og 태그 위주로 내용을 읽어오더군요 ^^

그런데 og 태그 이외에 무엇을 추가로 파싱할 것인지에 따라 보여지는 결과가 상당히 다른 것 같아요 ㄷㄷ

네이버 지식인처럼 og 태그에 국한하여 출력하는 것이 어떤 의미에서는 가장 conservative하고 무난할 수 있겠네요.

제 실력이 부족하지만 일단 말씀해주신대로 og 태그 위주로 만들어보겠습니다!

다시 한 번 감사드립니다 ^-^

comment menu
2019.01.11. 12:44

신고

"이니스프리님의 댓글"

이 댓글을 신고 하시겠습니까?

윤삼
profile image

조언이라기보다는 라이믹스나 XE 기준으로 말씀드릴게요. (이미 뜯어보셨을 수 있겠지만요ㅎ)


기존의 애드온이든 모듈이든 메타 태그의 og나 twitter 속성 등에서 이미지가 체크되면 수집이 중단되게 했었어요.
또 메타 태그에 og 등 특별한 속성이 없는 경우에 한해 페이지에 있는 이미지들을 긁어와서 getimagesize로 사이즈 체크 후 대표 이미지로 선택을 했었습니다.
대략 160px 이상 정도로요.


if ($width > 159 || $height > 159)
{
    if (($width > 0 && $height > 0 && (($width / $height) < 3) && (($width / $height) > .2)) && strpos($img, 'logo') === false)
    {
        $images[] = array("img" => $img, 'base64' => 'data:image/' . $ext . ';base64,' . base64_encode($oParserlinkModel->getRemoteResourceImageString($img)));
    }
}


모듈 쪽에는 이렇게 되어 있네요.
 
말씀하신 문제를 피하려면 아마 위 소스의 조건을 og 속성 체크할 때 적용하는 것도 방법이겠지 싶습니다.

다만, 이러려면 getimagesize를 거부하는 서버에 대해서는 접근이 제한적일 수 있고, 파싱 속도에도 지장이 있을 것 같긴 합니다.

comment menu
2019.01.11. 12:06

신고

"윤삼님의 댓글"

이 댓글을 신고 하시겠습니까?

이니스프리 작성자 → 윤삼
profile image

앗 XETOWN에서 '링크 파싱 애드온'을 제작하신 윤삼 님이시군요~!

애드온을 제작하신 윤삼 님께서 저같은 초보에게 직접 답변해주셔서 몸둘 바를 모르겠네요~ 정말 감사합니다 :)

 

말씀해주신대로 우선 og나 twitter 속성에서 이미지를 체크하되 그 사이즈를 확인하고,

그렇지 않다면 페이지의 이미지를 긁어와서 사이즈를 체크하여 대표이미지로 선택하는 방식으로 시도해보겠습니다.

 

다만 말씀하신대로 getimagesize()가 제한되는 경우에 대해 고려해야 할 것 같고,

저같은 초보가 만들면 파싱속도의 측면에서는 상당히 제한이 따르겠네요 ㅠㅠ

유튜브, 인스타, 네이버뉴스 등 링크가 많이 걸리는 사이트는 속도향상을 위해 별도로 처리를 해야겠네요.

 

그럼 늦었지만 윤삼 님께서도 새해 복 많이 받으세요~!

답변해주셔서 다시 한 번 진심으로 감사드립니다 ^-^

comment menu
2019.01.11. 12:55

신고

"이니스프리님의 댓글"

이 댓글을 신고 하시겠습니까?

윤삼 → 이니스프리
profile image

저야말로 초보여서 부끄럽습니다.

사이트마다 og 기록 방식이 다 다르다보니 사이즈에 따라 페이지 내 이미지를 선택해야 하는 경우가 분명 있을 것 같아요.

작업 응원하겠습니다!

곧 설날이어서 아직 좀 이르지만ㅋ 새해 복 많이 받으세요~!

comment menu
2019.01.11. 13:22

신고

"윤삼님의 댓글"

이 댓글을 신고 하시겠습니까?

포인트 폭탄+ → 윤삼
윤삼님 축하합니다.
추가로 200포인트만큼 포인트 폭탄+를 받았습니다.
WOW! 큰 폭탄이 터졌습니다.
당첨된 포인트의 2배인 총 400포인트를 받으셨습니다.
comment menu
2019.01.11. 13:22

신고

"포인트 폭탄+님의 댓글"

이 댓글을 신고 하시겠습니까?

삭제

"포인트 폭탄+님의 댓글"

이 댓글을 삭제하시겠습니까?

이니스프리 작성자 → 윤삼
profile image

옙 정말 감사합니다!!

저는 그누보드용을 만들고 있지만 윤삼 님께서 XETOWN에 올려주신 자료가 정말 큰 도움이 되고 있네요 ^-^

말씀하신대로 사이트마다 og 기록 방식이 상이한 것이 일정한 결과물을 출력하는 데에 가장 큰 장애물인 것 같아요.

SIR에 유튜브 등 몇몇 대형 사이트에 대해서만 링크 파싱을 하는 소스가 있던 것으로 기억하는데요.

그 제작분께서 그렇게 일부 사이트에 한정하여 작동하도록 제작하신 이유를 조금이나마 이해할 것 같네요.

그럼 윤삼 님께서도 좋은 주말 되세요~!

다시 한 번 감사드립니다 :)

comment menu
2019.01.11. 15:56

신고

"이니스프리님의 댓글"

이 댓글을 신고 하시겠습니까?

도토리묵 → 윤삼

오잉? 윤삼님이 여기서 ㅋㅋㅋ

comment menu
2019.01.14. 12:42

신고

"도토리묵님의 댓글"

이 댓글을 신고 하시겠습니까?

윤삼 → 도토리묵
profile image

네~ 저도 스포어 쓰고 있었어요 ^^/

comment menu
2019.01.14. 14:24

신고

"윤삼님의 댓글"

이 댓글을 신고 하시겠습니까?

권한이 없습니다.
번호 제목 글쓴이 날짜 조회 수
공지 시스템 점검 작업 완료 안내 10 마스터 24.09.05.16:25 2666
공지 [중요] 호스팅 만료와 관련하여 일부 수칙이 변경됩니다. 4 마스터 23.01.14.02:23 10175
공지 [필독] 질문하는 방법 17 마스터 18.02.23.03:09 4960
507 미디어플렛폼 vs 커뮤니티 55 title: 에그joyful 19.01.13.15:55 1046
506 판단 대기 시간 6 없음 19.01.11.14:09 295
링크파싱 애드온에서 대표사진 파일 수집과 관련하여 질문 드립니다 ^^ 9 image 이니스프리 19.01.10.20:05 298
504 비밀번호 값이 불러와지지 않습니다. 2 image 260578 19.01.05.17:28 213
503 사이트 정보 등록 1 없음 19.01.05.09:58 269
502 듀얼모니터 설정 질문드립니다 3 image calm 19.01.03.20:55 332
501 그누보드5 최근게시물 추출 수정 관련 문의 핫슈 19.01.01.13:21 199
500 호스팅 신청을 안하고 커뮤니티 활동을 해도 되나요? 5 없음 19.01.01.12:54 233
499 클라우드플레어랑 스포어 SSL이랑 같이 못 쓰나요? 14 image KOT49H 18.12.29.01:27 567
498 데이터 센터 입주와 관련해서 질문 드려요 ^^ 9 이니스프리 18.12.27.17:29 466
497 우분투 서버 최적화 작업의뢰는 언제 요청해야 되는 것인가요? 15 이니스프리 18.12.25.17:03 290
496 도메인 구매처에서 아무리 변경해봐도 안되던 이유가 혹시... 4 260578 18.12.22.18:29 253
495 humit 님의 parseweb 글 관련.... 3 image title: 대한민국 국기gimmepoint 18.12.21.21:44 498
494 출첵 모듈의 쿠키와 관련하여 질문 드려요 ^^ 4 이니스프리 18.12.21.20:51 710
493 CSRF 토큰 로그인 관련 질문 드립니다 11 이니스프리 18.12.20.19:06 1026
492 호스팅신청페이지 및 FTP접속이 안됩니다. 4 image 막시모 18.12.20.10:56 324
491 브라우저와 기본응용프로그램과의 양방향 통신에 대하여 6 Hanam09 18.12.16.17:49 556
490 usb 부팅 질문 드립니다. 1 calm 18.12.14.16:16 565
489 파이썬 멜론차트 크롤링 구현 관련 17 title: 에그joyful 18.12.08.10:08 1886
488 음원스트리밍은 음원 보안을 어떤 방식으로 하나요? 15 title: 에그joyful 18.12.06.22:24 333