리눅스 트러블 슈팅(Trouble Shooting).INDEX

리눅스 서버를 공부 할 때 트러블 슈팅(Trouble Shooting)이란 단어를 접하게 되는데 서버 엔지니어와 개발자가 서버를 운영하면서 듣게 되는 단어로 말 그대로 ‘문제 해결’을 뜻 한다.

리눅스에서 Trouble Shooting은 문제가 발생한 시점에서 시스템, 소프트웨어 및 하드웨어, 네트워크 등에서 문제를 진단하고 해결하는 과정이다.

Ⅰ. 트러블 슈팅 시스템 구축

원인과 해결책을 찾는 과정에서 문제 해결이 되었다면 문제점과 해결책을 문서화 하는 것은 매우 중요하다. 동일한 문제가 발생했을 때 빠르게 문제 해결을 할 수 있기 때문이다. 과거에 있었던 해결 방법을 찾을 수 있으며, 서버의 변경 상태(사항)을 파악하고 시스템의 동작 방식을 이해하는 것이 중요하다고 할 수 있다.

  • Trouble Shooting을 위한 조건 1
  • 시스템 동작 방식 이해 및 관련 용어의 이해
  • DNS 및 프로세스 등의 이해와 네트워크 용어 및 시스템의 이해가 필요함.
  • 문제점과 해결책 문서화
  • 과거에 해결되었던 내용을 참조할 수 있도록 한다.
  • Trouble Shooting을 위한 조건 2
  • 시스템 동작 방식 이해 및 관련 용어의 이해
  • DNS 및 프로세스 등의 이해와 네트워크 용어 및 시스템의 이해가 필요함.
  • 시스템의 변경 사항 파악하기
트러블슈팅(Troubleshooting)

Ⅱ. 서버가 느린 경우

네트워크 쪽이 아닌 서버쪽에서 느린 것으로 판단되는 경우 시스템의 리소스가 소비되어 서버가 느린 경우를 생각할 수 있습니다. CPU, 메모리, 디스크 쪽의 문제를 점검할 수 있겠습니다.

1. 시스템 부하: top, uptime 명령어로 문제 진단

리눅스 uptime 명령어로 문제를 빠르게 진단할 수 있습니다.

2. CPU, RAM 문제 파악하기

 1분,5분,15분 동안의 평균 로드(load average)의 숫자가 높은 경우

~]# uptime                                                                                                         
 10:36:12 up 5 days, 17:35,  1 user,  load average: 2.03, 20.17, 15.09  

실행 중인 프로세스가 CPU를 사용 중이거나 CPU 사용을 위한 대기 상태일 가능성을 볼 수 있습니다.

평균 부하가 높은 원인을 CPU 문제인지 RAM의 문제인지 I/O에 대한 문제인지를 살펴 봐야 합니다.

리눅스 uptime 명령어 설명

top 명령어를 이용해서 시스템의 문제를 한 눈에 볼 수 있습니다.

  • top 명령어를 통한 진단
  • ⓐ 부팅 후 가동 시간을 확인하여 언제부터 가동되었는지 확인.
  • load average로 평균 부하 시간을 체크.
  • ⓒ 실행 중인 프로세스의 갯수 체크.
  • ⓓ 사용 중인 메모리는와 남아 있는 메모리는 어느 정도 인지 체크할 수 있습니다.
리눅스 TOP 명령어-메모리 및 스왑메모리 영역.png

3. 메모리 고갈 파악하기

4. 디스크 I/O 진단

Ⅲ. 시스템 부팅 문제

Ⅳ. 파티션 디스크가 FULL 상태인 경우

Ⅴ.웹 사이트 다운

Ⅵ. 데이터베이스 오류

Ⅶ. 하드웨어 진단

Ⅷ. 서버 다운 시 네트워크 문제 확인

Ⅸ. 네임서버 및 DNS 문제 해결

Ⅹ. 이메일 오류

Similar Posts