도와주세요

링크파싱 애드온에서 대표사진 파일 수집과 관련하여 질문 드립니다 ^^

이니스프리2019.01.10 20:05조회 수 92댓글 9

  • 2
    • 글자 크기

안녕하세요?


그누보드용 링크파싱 애드온을 짬짬이 만들어보고 있는데요 ^^


다른 분들께서는 어떤 방식으로 만드셨는지 이것저것 테스트해보고 있네요.


그런데 어떤 애드온의 경우에는 다음과 같이 대표사진으로 애매한 사진파일이 등록되더군요 ㅠㅠ



개인적으로 아래 사진이 등록되기를 기대했지만 무리였네요~!



new.gif이 어떤 메커니즘으로 수집이 되었는지는 모르겠지만


"Study For Us - 모두의 지식공유 커뮤니티! 그리고 무료호스팅!!" 이 부분은 head의 meta 태그 중 타이틀을 받아온 것 같은데요.


"본문으로 바로가기 Site Notice FAQ 설문조사"라는 내용도 조금 아쉽네요 ㅠㅠ



이런 문제를 피하려면 어떤 방식으로 사진파일과 컨텐츠를 수집해야 될까요?


일정 크기의 이미지를 불러오는 방식으로 하면 좋겠지만 제 경험상 PHP의 getimagesize() 함수는 모든 경우에 잘 작동하지는 않는 것 같더군요.


마땅한 대표이미지가 없다면 해당 사이트의 파비콘을 받아서 사용하는 것도 하나의 방법이 될 수는 있을 것 같긴 하네요 ^^;



그럼 답변해주실 분께 미리 감사드립니다!


하루만 버티면 주말인데 다들 화이팅입니다~! ^-^


어떤 일에 임할 때 굉장히 중요하지만 우리가 종종 망각하는 것은

끝까지 포기하지 않고 최선을 다하는 것이 전부라는 사실입니다.

  • 2
    • 글자 크기
판단 대기 시간 (by 없음) 비밀번호 값이 불러와지지 않습니다. (by Piedots)
  • 2019.1.11 11:52

    보통 og 태그로 설정이 되어 있는 내용을 읽어오는 것을 기본으로 합니다.

    만약 없다면 body에 있는 내용을 토대로 파싱을 하는 방법이 있습니다.

    네이버 지식인의 경우에는 og태그가 없으면 아무것도 출럭하지 않습니다.

  • @humit
    이니스프리글쓴이
    2019.1.11 12:44

    답변해주셔서 정말 감사합니다~!

    말씀해주신대로 애드온들이 대체로 og 태그 위주로 내용을 읽어오더군요 ^^

    그런데 og 태그 이외에 무엇을 추가로 파싱할 것인지에 따라 보여지는 결과가 상당히 다른 것 같아요 ㄷㄷ

    네이버 지식인처럼 og 태그에 국한하여 출력하는 것이 어떤 의미에서는 가장 conservative하고 무난할 수 있겠네요.

    제 실력이 부족하지만 일단 말씀해주신대로 og 태그 위주로 만들어보겠습니다!

    다시 한 번 감사드립니다 ^-^

  • 2019.1.11 12:06

    조언이라기보다는 라이믹스나 XE 기준으로 말씀드릴게요. (이미 뜯어보셨을 수 있겠지만요ㅎ)


    기존의 애드온이든 모듈이든 메타 태그의 og나 twitter 속성 등에서 이미지가 체크되면 수집이 중단되게 했었어요.
    또 메타 태그에 og 등 특별한 속성이 없는 경우에 한해 페이지에 있는 이미지들을 긁어와서 getimagesize로 사이즈 체크 후 대표 이미지로 선택을 했었습니다.
    대략 160px 이상 정도로요.


    if ($width > 159 || $height > 159)
    {
        if (($width > 0 && $height > 0 && (($width / $height) < 3) && (($width / $height) > .2)) && strpos($img, 'logo') === false)
        {
            $images[] = array("img" => $img, 'base64' => 'data:image/' . $ext . ';base64,' . base64_encode($oParserlinkModel->getRemoteResourceImageString($img)));
        }
    }


    모듈 쪽에는 이렇게 되어 있네요.
     
    말씀하신 문제를 피하려면 아마 위 소스의 조건을 og 속성 체크할 때 적용하는 것도 방법이겠지 싶습니다.

    다만, 이러려면 getimagesize를 거부하는 서버에 대해서는 접근이 제한적일 수 있고, 파싱 속도에도 지장이 있을 것 같긴 합니다.

  • @윤삼
    이니스프리글쓴이
    2019.1.11 12:55

    앗 XETOWN에서 '링크 파싱 애드온'을 제작하신 윤삼 님이시군요~!

    애드온을 제작하신 윤삼 님께서 저같은 초보에게 직접 답변해주셔서 몸둘 바를 모르겠네요~ 정말 감사합니다 :)

     

    말씀해주신대로 우선 og나 twitter 속성에서 이미지를 체크하되 그 사이즈를 확인하고,

    그렇지 않다면 페이지의 이미지를 긁어와서 사이즈를 체크하여 대표이미지로 선택하는 방식으로 시도해보겠습니다.

     

    다만 말씀하신대로 getimagesize()가 제한되는 경우에 대해 고려해야 할 것 같고,

    저같은 초보가 만들면 파싱속도의 측면에서는 상당히 제한이 따르겠네요 ㅠㅠ

    유튜브, 인스타, 네이버뉴스 등 링크가 많이 걸리는 사이트는 속도향상을 위해 별도로 처리를 해야겠네요.

     

    그럼 늦었지만 윤삼 님께서도 새해 복 많이 받으세요~!

    답변해주셔서 다시 한 번 진심으로 감사드립니다 ^-^

  • @이니스프리
    2019.1.11 13:22

    저야말로 초보여서 부끄럽습니다.

    사이트마다 og 기록 방식이 다 다르다보니 사이즈에 따라 페이지 내 이미지를 선택해야 하는 경우가 분명 있을 것 같아요.

    작업 응원하겠습니다!

    곧 설날이어서 아직 좀 이르지만ㅋ 새해 복 많이 받으세요~!

  • @윤삼
    포인트 폭탄+ (비회원)
    2019.1.11 13:22
    윤삼님 축하합니다.
    추가로 200포인트만큼 포인트 폭탄+를 받았습니다.
    WOW! 큰 폭탄이 터졌습니다.
    당첨된 포인트의 2배인 총 400포인트를 받으셨습니다.
  • @윤삼
    이니스프리글쓴이
    2019.1.11 15:56

    옙 정말 감사합니다!!

    저는 그누보드용을 만들고 있지만 윤삼 님께서 XETOWN에 올려주신 자료가 정말 큰 도움이 되고 있네요 ^-^

    말씀하신대로 사이트마다 og 기록 방식이 상이한 것이 일정한 결과물을 출력하는 데에 가장 큰 장애물인 것 같아요.

    SIR에 유튜브 등 몇몇 대형 사이트에 대해서만 링크 파싱을 하는 소스가 있던 것으로 기억하는데요.

    그 제작분께서 그렇게 일부 사이트에 한정하여 작동하도록 제작하신 이유를 조금이나마 이해할 것 같네요.

    그럼 윤삼 님께서도 좋은 주말 되세요~!

    다시 한 번 감사드립니다 :)

  • @윤삼
    2019.1.14 12:42

    오잉? 윤삼님이 여기서 ㅋㅋㅋ

  • @도토리묵
    2019.1.14 14:24

    네~ 저도 스포어 쓰고 있었어요 ^^/

댓글 달기

번호 제목 글쓴이 날짜 조회 수
공지 구글 로그인 문제가 있던 부분을 해결하였습니다.7 마스터 2019.03.13 259
공지 당분간 호스팅 신청을 받지 않습니다.20 마스터 2019.02.27 719
공지 회원 전용 페이지가 생겼습니다.15 마스터 2018.03.20 5831
공지 [필독] 질문하는 방법5 마스터 2018.02.23 768
526 PHP 순서 매기기3 title: 에그joyful 2019.01.23 55
525 세션연동부분에 대하여 도움이 필요합니다.2 Hanam09 2019.01.21 59
524 Input submit 버튼2 Piedots 2019.01.20 50
523 x-y넷에서 내 웹사이트에서 트래픽 사용 현황을 볼 수 있는 php소스가 있었습니다2 없음 2019.01.20 60
522 POST 데이터가 보내지지 않습니다5 Piedots 2019.01.20 65
521 도메인 포워딩이 제대로 이루어지지 않습니다.4 title: 애프터 이펙트제르엘 2019.01.20 67
520 게시판 중복확인 만들다가 너무 허탈해서 올려봅니다5 Piedots 2019.01.19 96
519 사이트 정보 등록2 캣치 2019.01.19 58
518 PHP잘하시는분 계신가요...?4 title: 에그joyful 2019.01.17 65
517 XE에서 포인트 부족할시 알림창 띄우기3 도토리묵 2019.01.17 65
516 비번을 변경해야하는데 도와주세요 스포어 비번이요1 더딘 2019.01.16 34
515 giphy, gfycat 등 사이트가 일부 브라우저 또는 기기에서 문제가 있나요?4 이니스프리 2019.01.15 53
514 음 제 블로그가 증발한건가요...?21 협스 2019.01.13 172
513 미디어플렛폼 vs 커뮤니티55 title: 에그joyful 2019.01.13 291
512 판단 대기 시간6 없음 2019.01.11 95
링크파싱 애드온에서 대표사진 파일 수집과 관련하여 질문 드립니다 ^^9 이니스프리 2019.01.10 92
510 비밀번호 값이 불러와지지 않습니다.2 Piedots 2019.01.05 48
509 사이트 정보 등록1 없음 2019.01.05 62
508 듀얼모니터 설정 질문드립니다3 calm 2019.01.03 46
507 그누보드5 최근게시물 추출 수정 관련 문의 핫슈 2019.01.01 36
이전 1 2 3 4 5 6 7 8 9 10... 28다음
첨부 (2)
image 20190110195129.png
6.4KB / Download 10
feacfa756dafafdf509c003c54d97b29.png
27.8KB / Download 9
서버에 요청 중입니다. 잠시만 기다려 주십시오...