다량서버 통합관제 [ 모니터링 서비스 ]

통합관제모니터링(텔레그램) 디바이스 아이콘을 이용한 모니터링

통합관제모니터링(텔레그램)의 디바이스 아이콘에 대한 설명 문서 입니다.

 

 

1. 디바이스 아이콘 

 

 

  1) 에러 발생시 디바이스 아이콘의 빨간 부분을 클릭하면 해당 부분의 자세한 확인을 하실 수 있습니다.

  2) 디바이스의 IP를 클릭하면 해당 서버의 정보를 변경할 수 있는 창이 뜹니다.

  3) 아이콘은 약 2분 주기로 Reload 됩니다.

 

 

2. Resource 모니터링 

 디바이스 아이콘중 리소스 영역을 클릭하면 자세한 내용을 확인 할 수 있습니다. 

                             

 

 1) 에러 내용 확인  - 리소스 에러가 난 부분은 붉은 색으로 표시됩니다.  

Tele_ico_03

 

  2) 임계값 수정 - 임계값은 [ Now : XX% ] 부분을 클릭하여 수정 할 수 있습니다. 

        *수정한 임계값 적용까지 최대 5분이 소요됩니다.

 

  3) 임계값 수정 후 확인

 

 

  4) 리소스 모니터링 용어 설명  

[1] Traffic & Packet

- 수신 : 서버로 들어오는 트래픽 or 패킷을 나타냅니다.

  -> 갑자기 수신 그래프가 평소와는 다르게 높게 표시되면 DDos 공격등의 트래픽 공격으로 의심할 수 있습니다.

  -> 작업시 파일을 서버로 업로드 하시면 수신 그래프가 상승합니다.

- 송신 : 서버에서 발생하는 트래픽 or 패킷을 나타냅니다.

  -> 갑자기 송신 그래프가 평소와는 다르게 높게 표시되면 해킹에 의한 트래픽 발생으로 의심 할 수 있습니다.

  -> 작업시 파일을 서버에서 다운로드 하시면 송신 그래프가 상승합니다.

- Traffic 단위 : 1M = 100kb = 1000000b

- Packet 단위 : 1K = 1000B(데이터 조각이 1000)

[2] CPU Load (리눅스와 윈도우에 따라 다릅니다)

(1) 리눅스

- 5min : 최근 5분 동안 cpu에서 처리하지 못하고 대기하고 있는 프로세서의 평균수

  -> 그래프가 평소보다 높게 표시되면 서버에서 처리하지 못하는 에러가 발생한 것으로 의심할 수 있습니다.

  -> 5min load가 지나치게 높으면 서버가 다운될 가능성이 있습니다.

- 15min : 최근 15분 동안 cpu에서 처리하지 못하고 대기하고 있는 프로세서의 평균수

  -> 5min load 보다 지나간 대기 프로세서의 평균값으로 서버 부하 모니터링시엔 15min load 보단 5min load를 모니터링 하는게 보다 정확합니다.

- 단위 : 1000B = 1개의 대기 중인 프로세서

 

(2) 윈도우

- Load : 프로세서 사용량

  -> 전체 프로세서 사용량의 평균값을 나타낸다.

[3] Memory (리눅스와 윈도우에 따라 다릅니다)

(1) 리눅스

- Real Memory : 실제 물리적인 메모리 사용량

- Swap Memory : 하드디스크에 할당된 가상 메모리 사용량

(2) 윈도우

- Vir : 하드디스크에 할당된 가상 메모리 사용량

- Phy : 실제 물리적인 메모리 사용량

[4] CPU Used (리눅스에만 해당)

- User : 현재 CPU 사용량

- Idle : 대기중인 CPU

  -> 임계값 100%에서 절대 변경하면 안됩니다.

 

# 추가 사항 

- 그래프를 클릭하면 해당 서버에 대한 일간, 주간, 월간, 연간 그래프를 확인하실 수 있습니다.

- 모니터링 가능한 인터페이스는 3, 하드는 12개까지입니다.

- 두 개의 그래프가 서로 동일한 리소스를 모니터링할 경우엔 반드시 두 임계치를 동일하게 설정해야 합니다

 

 

 

3. Port 모니터링 

  디바이스 아이콘 중 포트 영역을 클릭하면 자세한 내용을 확인할 수 있습니다. 

                       

 

  1) 에러 내용 확인  - 포트 에러가 난 부분은 붉은색으로 표시됩니다. 

Tele_ico_06

 

 

 2) 에러가 발생한 포트 삭제 - 에러가 발생한 포트를 지우고 수정 버튼을 누릅니다. 

Tele_ico_07

 

 

  3) 등록 버튼을 눌러 새로운 포트 등록이 가능합니다.

Tele_ico_08

 

 * 포트 에러는 서버의 통신 상태에 따라 오탐이 발생하기도 합니다. 

 * 등록 가능한 포트는 TCP포트 5개 까지 입니다. 

 

 

 

4. Index 모니터링 

  디바이스 아이콘 중 인덱스 영역을 클릭하면 자세한 내용을 확인할 수 있습니다. 

                                

 

  1) 에러 내용 확인  - Index 에러가 난 부분은 Error 항목에  붉은 색으로 표시됩니다. 

Tele_ico_10

 

 

  2) 에러가 발생한 Url은 기본값을 수정하거나 혹은 임계치를 수정하여 에러 발생을 정지 시킬 수 있습니다.

Tele_ico_11

 

# 추가 사항 # 

 * INDEX 모니터링은 약 10분에 1회씩 체크합니다. 

 * Check 박스에 체크된 Url만 모니터링 합니다.

 

 

 

 

5. SMNP 상태 체크 

  디바이스 아이콘 중 에러 영역을 클릭하면 자세한 내용을 확인 할 수 있습니다. 

                               

 

  1) 에러 메시지1 

Tele_ico_13

 서버에서 SNMP 값을 읽어올 수 없는 경우로 아래의 사항을 확인하시면 됩니다. 

(1) 서버의 방화벽에 UDP 161번 포트가 등록되었는지 확인합니다.

(2) 서버에서 SNMP 서비스가 시작중인지 확인합니다.

(3) 서버에서 SNMP 서비스 셋팅 상태를 확인합니다.

# 3가지 사항을 모두 체크하였는데도 동일한 에러가 발생하면 스마일서브 컨텐츠서비스 팀으로 문의 바랍니다.

 

 

 2) 에러 메시지2 

Tele_ico_14

  서버에서 특정 SNMP 값을 읽어올 수 없는 경우로, 서버의 MIB 값을 초기화 하면 해결됩니다. 

 

서버 관리 -> 에러가 발생한 서버 '수정' -> 'MIB값 초기화' 선택

 Tele_ico_15

# 위와 같이 MIB값을 초기화하였는데도 동일한 에러가 발생하면 스마일서브 컨텐츠서비스 팀으로 문의바랍니다.