• 목록
  • 아래로
  • 위로

안녕하세요?


닷홈 무료 호스팅을 사용하고 있는데요.


PHP로 파싱한 데이터의 인코딩과 관련된 문제가 계속 발생하네요 ㅠㅠ


아마도 다른 분들께서 보시기엔 간단한 문제일 것 것 같은데 제가 도저히 해결을 못해서 질문드려요 ㅜㅜ



닷홈의 PHPMyAdmin에서 확인을 해보면 인코딩이 다음과 같네요.






파싱한 사이트(네이버)의 인코딩은 다음과 같습니다.





네이버에서 파싱한 결과를 바로 출력해도 깨지고


$result = iconv("UTF-8", "EUC-KR", $string); 이런 방식으로 인코딩을 변경하려고 해도 깨져서 나오네요 ㅠㅠ


이미지를 파싱한 것은 문제없이 출력이 되고 있거든요.


이런 상황에서는 어떤 설정을 건드려야 되는 것인지 여쭤봅니다.



HTML의 <meta charset="utf-8"> 또는 


PHP의 header('Content-Type: text/html; charset=utf-8'); 설정과 관련된 문제일 것이라는 생각이 들어서


EUC-KR, CP949, UTF-8을 바꿔가면서 시도해봐도 안 되네요 ㅠㅠ



그럼 스포어 회원님들께서도 굿밤 되세요!


항상 감사드려요 ^^


작성자
이니스프리 119 Lv. (0%) 2172250/115200000EXP

Make StudyForUs Great Again!

 

CSVpuymXAAAVVpd.jpg

댓글 6

title: 황금 서버 (30일)humit
profile image

혹시 데이터베이스 테이블의 컬럼의 캐릭터셋이 어떻게 되어있나요??

comment menu
2019.07.11. 09:48

신고

"humit님의 댓글"

이 댓글을 신고 하시겠습니까?

이니스프리 작성자 → humit
profile image

오오~ 번번이 답변 감사합니다!

제가 DB를 잘 다루지 못해서요 ㅠㅠ

show table status로 확인해보니 utf8_general_ci라고 나오네요 ^^

 

그런데 제가 아직 파싱을 해서 DB에 넣은 단계는 아니구요.

오토셋 대용으로 에디터에서 FTP로 바로 저장해서 PHP 돌려보는 용도로 닷홈 무료호스팅을 사용하고 있는거라서요.

단순히 PHP 파일에서 echo로 바로 출력해보면 문제가 없는데요.

파싱한 결과를 출력하는데 인코딩 문제를 겪고 있네요 ㅠㅠ

VS Code가 UTF-8로 설정되어 있는 것이 문제일까요?

계속 잘 안 되어서 카페24로 옮겨야 하는지 고민하고 있어요!

 

비도 그쳤는데 humit 님께서도 좋은 오후 되시고

바쁘시겠지만 저녁식사 맛있게 드세요! ^^

항상 감사드립니다~

comment menu
2019.07.11. 15:44

신고

"이니스프리님의 댓글"

이 댓글을 신고 하시겠습니까?

title: 황금 서버 (30일)humit
profile image

아 PHPMyAdmin에서 character set에 대해 올려놓으셨길래 DB에 저장하신줄 알았네요.

 

혹시 파싱을 하실 때 특정 라이브러리를 사용해서 작업하고 계신가요??

comment menu
2019.07.13. 23:57

신고

"humit님의 댓글"

이 댓글을 신고 하시겠습니까?

이니스프리 작성자 → humit
profile image

앗 바쁘신데 답변해주셔서 감사합니다!

 

저는 그렇게 PHPMyAdmin을 조회해서 확인해야 호스팅의 인코딩 설정을 알 수 있는 것인지 알았네요 ㅠㅠ

 

Simple HTML DOM Paser 등 어떠한 라이브러리를 사용하지 않고 네이버를 바로 파싱했습니다.

 

curl로 불러오고, DOMXPath와 getAttribute로 접근한 다음에 정규식을 사용했거든요.

 

혹시 개발자도구에서 네이버가 UTF-8처럼 보여도 실제로는 UTF-8이 아닐 수도 있는건가요?

 

그럼 humit 님께서도 저녁식사 맛있게 드세요~

comment menu
2019.07.14. 17:59

신고

"이니스프리님의 댓글"

이 댓글을 신고 하시겠습니까?

title: 황금 서버 (30일)humit → 이니스프리
profile image
+1

UTF-8로 가져오는 것은 맞습니다. 다만 DOMXPath 부분으로 사용하시는 부분에서 해당 문제가 발생한 것으로 보이네요.

 

https://www.php.net/manual/en/domdocument.loadhtml.php#74777

 

해당 내용이 도움이 되실 것 같습니다.

comment menu
2019.07.15. 20:24

신고

"humit님의 댓글"

이 댓글을 신고 하시겠습니까?

이니스프리 작성자 → humit
profile image
+1

앗 감사합니다!!

제가 전혀 예측하지 못했던 부분에서 문제가 있었군요~

어쩐지 인코딩을 계속 바꿔가면서 시도해봐도 안 되더군요 ㅠㅠ

말씀해주신대로 loadHTML()을 하기 전에 mb_convert_encoding() 하도록 하겠습니다.

구체적으로 어떤 점에서 차이가 있는지는 모르겠지만 파이썬과 PHP는 사뭇 다르네요 ㄷㄷ

인코딩 문제 때문에 제목과 본문을 제외한 URL 밖에 가져오지 못했는데

말씀해주신 부분을 참고해서 완성하도록 하겠습니다!

바쁘신데 번번이 감사합니다 ^-^

comment menu
2019.07.15. 21:40

신고

"이니스프리님의 댓글"

이 댓글을 신고 하시겠습니까?

권한이 없습니다.
번호 제목 글쓴이 날짜 조회 수
공지 [작업 완료] 설 명절 맞이 서버 업데이트 안내 3 마스터 24.02.11.17:21 1016
공지 [중요] 호스팅 만료와 관련하여 일부 수칙이 변경됩니다. 4 마스터 23.01.14.02:23 4693
공지 [필독] 질문하는 방법 17 마스터 18.02.23.03:09 4482
386 모니터의 피봇(pivot)과 관련하여 질문 드립니다 8 이니스프리 19.04.10.13:59 241
385 라떼판다 전원 설계가 막막해요 ㅠㅠ 2 나는야초보 19.04.10.22:52 893
384 사파리브라우저 mp3파일 재생관련 문의드립니다. 11 자뻑보이 19.04.15.15:26 589
383 프로세서 간의 성능 비교에 대해 질문 드립니다 ^^ 4 이니스프리 19.04.17.18:31 203
382 디시인사이드 푸쉬알림 앱 추천 부탁드립니다 ^^ 3 이니스프리 19.04.18.23:35 1561
381 특정 키워드의 메일만 푸시알림을 받는 방법이 있을까요? 4 이니스프리 19.04.19.17:28 492
380 system32 폴더 내 파일의 삭제 권한과 관련된 질문을 드립니다 ㅠㅠ 11 이니스프리 19.04.20.13:19 1332
379 호스팅 패널의 webdev는 뭐하는것인가요? 1 샹키 19.04.20.17:07 247
378 인텔 NUC를 이용한 홈 서버 구성에 대해 질문 드립니다 ^^ 9 이니스프리 19.04.21.08:48 1273
377 안드로이드와 맥북을 같이 잘 사용할 방법이 있을까요? 2 네모 19.04.21.21:56 225
376 구글 웹마스터 사이트맵 가져올 수 없음 문제와 스포터 호스팅 Lua 스크립트 관련 질문 드립니다 12 image Gokoro 19.04.23.23:46 1297
375 케이블에도 에이징이 필요한가요..? 12 갱생협스 19.04.26.22:43 648
374 미디어위키 리버티 스킨 상하단 아이콘 지우기관련,, 3 어렵다어려워 19.04.30.16:12 257
373 DB를 연결했는데 왜 데이터를 가져오질 모태... image 국내산라이츄 19.04.30.17:08 235
372 DB를 연결했고 뭔가 가져오는 것 같은데 표시를 못 합니다... 3 image 국내산라이츄 19.05.02.09:37 231
371 SQL에서는 날짜 형식을 못 바꾸나요? 2 image 국내산라이츄 19.05.02.18:07 209
370 아이폰/아이패드 충전기 발열 관련 질문 드립니다 9 image 이니스프리 19.05.02.22:52 11125
369 무선 키보드 마우스 세트 추천 부탁드립니다. 14 갱생협스 19.05.03.18:18 337
368 윈도우 환경에서 PHP 개발환경을 어떻게 구축하는 것이 효율적일까요? 7 네모 19.05.03.20:23 241
367 워드프레스 모바일앱<-->서버간 통신오류? 6 image 갱생협스 19.05.04.20:32 293