- 10
- 마스터
- 조회 수 848
안녕하세요.
어제 하루종일 전기 안전점검 이후에 서버 느려짐 이슈에 대해 조사하였고, 결론에 다다랐습니다.
결론을 얻었지만 아직 완벽한 해결이 되지 못하는 점을 먼저 말씀드립니다.
최초의 원인은 서버의 DB과부하인줄 알았습니다.
하지만 DB뿐 아니라 웹 접속에 대한 pool 도 높은 점유율을 차지 하는 상황이라 이 상황이 이해되지 않아 많이 알아보았습니다.
결론은 쿨러의 고장으로 충분한 쿨링이 되지 않아 쓰로틀링이 걸리게 되는 상황이고, 강력한 쓰로틀링이 걸리게 되니 CPU의 성능이 저하되어 높은 CPU점유율을 갖게 된 상황입니다.
그래서 접속과 DB가 작은 부하에도 성능이 하락하기 때문에 버벅임이 발생하는 이유였습니다.
쿨러의 고장이 왜 정전 이후 불거졌느냐.
그 이유도 쿨러가 멈춘적이 잘 없는데 이번 이슈로 장기간 멈추면서 수명이 거의 다 된 쿨러가 운명을 달리하게 된 것 같습니다.
쿨링 이슈로 웹서버를 끄거나 서버를 끄게 되는 쿨링 상황이 되면 다시 서버를 기동하였을때 잠깐 잘 되는 이유와도 잘 맞아 떨어집니다.
오늘 먼지제거와 써멀 구리스 재 도포를 하였습니다. 써멀은 나름 유명한 곰써멀 (Kryonaut extreme)로 재 도포를 하였습니다만..
안타까운 일은 서멀과 상관없이 쿨러의 펌프 성능이 저하된 것 같다는 생각이 들었습니다.
그럴만도 한게 거의 7년정도 운영되고 있던 서버에 장기간 멈춘적이 없으니 쿨러가 고장날만도 합니다.
일단 쿨러 교체 전에 좋은 써멀 빨인지 온도가 간당간당하게 유지되고 있는 상황입니다.
하필 오늘은 금요일이라 배송을 못 받는 상황이지만 조만간 쿨러를 교체하여 재 장착을 할 예정입니다.
어제 오늘 많은 집중력을 여기에 쏟아서 (원인파악하느라) 힘드니 완벽한 수리는 조만간 하도록 하겠습니다.
하드웨어 고장은 솔직히 예상 못했습니다... 그래서 파악하는데 오래걸렸어요...
죄송합니다.
+추가사항
새로운 쿨러를 장착하기 전까지 일시적으로 CPU의 온도를 낮추기 위해 상시 온도 체크하다가 너무 심하다 싶으면 서버 재가동이 될 예정입니다.
순간 접속이 안되더라도 양해 부탁드립니다.
추천인 8
작성자
댓글 10
본진이 박살난 스타크래프트 멀티라....으흠!? SHOW ME THE MONEY
항상 감사드립니다!! ^-^
자체적 쓰로틀링 머신이 되어버렸어요.
항상 감사한 마음입니다.
엄한곳에서 원인이 발생했네요.
그나저나 아까 글쓸때만해도 쾌적했는데 점점 원상태로 돌아오조짐이 보이네요 (윽)...
글쓰기/수정 등록 딜레이 발생 (비상비상!!!)ㅜㅜ