리눅스 트러블 슈팅(Trouble Shooting).INDEX
리눅스 서버를 공부 할 때 트러블 슈팅(Trouble Shooting)이란 단어를 접하게 되는데 서버 엔지니어와 개발자가 서버를 운영하면서 듣게 되는 단어로 말 그대로 ‘문제 해결’을 뜻 한다.
리눅스에서 Trouble Shooting은 문제가 발생한 시점에서 시스템, 소프트웨어 및 하드웨어, 네트워크 등에서 문제를 진단하고 해결하는 과정이다.
Ⅰ. 트러블 슈팅 시스템 구축
원인과 해결책을 찾는 과정에서 문제 해결이 되었다면 문제점과 해결책을 문서화 하는 것은 매우 중요하다. 동일한 문제가 발생했을 때 빠르게 문제 해결을 할 수 있기 때문이다. 과거에 있었던 해결 방법을 찾을 수 있으며, 서버의 변경 상태(사항)을 파악하고 시스템의 동작 방식을 이해하는 것이 중요하다고 할 수 있다.
Ⅱ. 서버가 느린 경우
네트워크 쪽이 아닌 서버쪽에서 느린 것으로 판단되는 경우 시스템의 리소스가 소비되어 서버가 느린 경우를 생각할 수 있습니다. CPU, 메모리, 디스크 쪽의 문제를 점검할 수 있겠습니다.
1. 시스템 부하: top, uptime 명령어로 문제 진단
리눅스 uptime 명령어로 문제를 빠르게 진단할 수 있습니다.
2. CPU, RAM 문제 파악하기
1분,5분,15분 동안의 평균 로드(load average)의 숫자가 높은 경우
~]# uptime
10:36:12 up 5 days, 17:35, 1 user, load average: 2.03, 20.17, 15.09
실행 중인 프로세스가 CPU를 사용 중이거나 CPU 사용을 위한 대기 상태일 가능성을 볼 수 있습니다.
평균 부하가 높은 원인을 CPU 문제인지 RAM의 문제인지 I/O에 대한 문제인지를 살펴 봐야 합니다.
top 명령어를 이용해서 시스템의 문제를 한 눈에 볼 수 있습니다.