오픈소스NMS: Zabbix, OpenNMS

Gi Seong Eom

unread,

Aug 24, 2006, 9:55:53 AM8/24/06

to sysadm...@googlegroups.com

안녕하세요.

엄기성입니다.

Zabbix 1.1.1 테스트를 간단히 마치고, 저희쪽 production 서버에 일부 적용을 해서

사용하고 있습니다. UI, 설치등이 간단해서, 처음 접하는 분들도 쉽게 만족하실

것으로 생각합니다... (생각보다 노가다가 있습니다만..)

Zabbix의 Graph는 좀 부실합니다. 그래서, 개인적으론 openNMS를 통해서 이를

보완할려고 같이 테스트를 하고 있습니다. OpenNMS는 공부가 더 필요하네요 ^^

스크린샷 몇개 보여드리지요.

1. 사용자정의 스크린

http://performance.pe.kr/download/2006.08.24.zabbix.custom.screen.jpg

2. MS-SQL 서버 모니터링

http://performance.pe.kr/download/2006.08.24.zabbix.sql.jpg

System Monitor에서 성능카운터를 가져올 수 있습니다. (Windows agent)

3. Windows Agent의 자원점유

부하가 많은 시스템에서 Agent의 오동작/자원누수 여부는 꽤 중요하죠.

Spotlight on Windows로 측정한 내용입니다.

http://performance.pe.kr/download/2006.08.13.zabbixw32.procinfo2.jpg

http://performance.pe.kr/download/2006.08.13.zabbixw32.procinfo1.jpg

일단은 여기까지^^

"Imagination is more important than knowledge."
-- Albert Einstein

Gi Seong Eom

MSN: jur...@kldp.org / e-mail: k2l...@gmail.com

문태준

unread,

Aug 24, 2006, 10:23:30 PM8/24/06

to sysadm...@googlegroups.com

** 다들 눈으로만 보지 마시고 한마디 할수 있는것 있으면 하세요.
그리고 내부 기밀만 빼고는 서로 공유할 부분은 공유합시다!!
자바서비스넷을 보면 이러한 정보공유가 엔지니어들의 기술수준을 전체적으로
높일 수 있다는 하나의 예라라고 생각합니다.

열심히 테스팅중이군요.
테스팅화면뿐만 아니라 나중에 진행하고나서 정리된 문서도 있으면 좋겠는데
요????

제가 있는 곳도 모니터링이 이슈중의 하나라서 요즘 여러가지 검토예정입니
다. (근데 모니터링뿐만 아니라 전체적인 모든 이슈에 대한 검토라서 고민할
게 많지만)

whatsUp : 기존에 IDC에서 많이 사용하는 모니터링 프로그램
-> 버전이 올라가면서 기능이나 UI가 더 나아졌다고 하는군요. 프리미엄버전
에는 MS-SQL 등과 윈도우즈 wmi 를 이용한 모니터링 가능.

http://www.adventnet.com/products/webnms/index.html A
<http://intranet.sds.co.kr/moniwiki/wiki.php/AdventNet>dventNet Web NMS 4
A <http://intranet.sds.co.kr/moniwiki/wiki.php/AdventNet>dventNet Web
NMS is the industry-leading network management model / framework for
building custom OEM software such as Element, Network and Systems
Management (EMS / NMS) applications. Networking equipment vendors and
other management solution providers can rely on A
<http://intranet.sds.co.kr/moniwiki/wiki.php/AdventNet>dventNet Web NMS
for building OEM software for network management such as EMS and NMS.

* EMS, NMS 용도의 OEM 소프트웨어로 개발하기 위한 네트워크 관리 모델,
프레임워크 제공
* http://www.tmn.co.kr/ 국내판매, 개발업체

공개프로그램 : zabbix 등

상용솔루션

상용솔루션은 기존 시스템구성과의 연계가 문제가 되는 듯 합니다. 솔루션에
따라서 커스터마이징이 제한이 될 수 있지요.
물론 회사에서 계속 유지보수 비용을 지출하면 상관없겠지만 쉬운것은 아니지
요. 그렇다고 하더라도 또 내부시스템관의 연동을 위해서는 모든것을 맡길수
없는 부분도 있을 것입니다. ITSM 도 하나의 용어로서 이야기는 많이 되지만
기존 업무프로세스 개선과 연관이 되어있기때문에 프로그램만으로 처리하는것
이 아니라 기본적으로는 업무프로세스개선 및 함께 일하는 사람들에 대한 정
책강제(?)가 있어야 하는 부분입니다. 일부 포탈도 상용솔루션을 구매하였다
가 커스터마이징부분때문에 고생하고 있는곳도 있더군요.

성능관리, 상태관리(모니터링)으로 끝나는 것이 아니라 장비입고부터 모니터
링, 문제시 알람, 이력관리, IP/HW 자산관리, 고객서비스관리(서비스데스크)
까지 모두 연관이 되어야 하는데 이건 전담기획자, 개발자가 있어야 가능할
것이고 이렇게 운영하고 있는 사이트도 있습니다.

제가 모든것을 다 테스팅해볼 수 있는 것은 아니기에 이후 어떻게 할지 고민
중입니다. 아는 사람도 zabbix를 가지고 테스팅을 하고 있다고 하는데(실제
도입했나??) 기능은 좋은데 여러가지 노가다 작업이 심하다고 합니다. 여긴
자체 에이전트가 있죠. 윈도우 포함. 그래프 기능은 막강하다고 하는데 엄기
성님 이야기와는 좀 다르군요. DBMS 설계 도 좋고 에이전트 안정성도 좋다고
합니다. 그렇지만 대량으로 작업할 경우에는 GUI가 불편해서 직접 SQL 문으로
작업하는 경우가 있다고 하는군요.

아래는 솔루션 검토하면서 썼던 글 일부입니다.

오늘은 여기까지.

-----------------------------------------
1. 모니터링 시스템(알람을 포함)을 빠르게 도입한다. 현재 WhatsUP을 테스팅
하고 있고 테스팅한 것을 가지고 데모를 보고 판단
-> 장점 : 빠른 시간내에 도입이 가능하며 WhatUP은 기존에 익숙한 툴(시간이
많이 지나서 UI, 기능등은 많이 바뀌었을 것으로 예상)
-> 단점 : 모니터링 용도로만 사용가능하며 기존 시스템과의 연동부분은 확인
해보아야함(기존 고객정보, SMS 발송정보)
-> 필요기간 : 기능테스팅 1-2주, 시스템연동 1-2주. 한달정도의 기간에 처리가능

2. AdventNet Web NMS 4 도입. 이는 EMS, NMS 용도의 OEM 소프트웨어로 개발
하기 위한 네트워크 관리 모델, 프레임워크 제공을 합니다. Java 기반인 듯
하네요.
-> 장점 : 처음부터 모든 것을 재구성하는 것보다는 개발속도가 빠를 것임.
위의 제품은 EMS, NMS 개발용도로 많이 사용하고 있으며 국내개발, 판매회사
도 있음.
-> 단점 : 작업을 할 수 있는 개발자 필요하고 개발자가 있다고 하더라도 요
구사항을 분석하고 개발작업을 진행하는것은 최소 2-3개월 이상 걸릴 것으로
판단함. 이는 모니터링부분만 말하는 것임. 여기에 구성관리 및 기존 업무와
의 연계는 더 많은 시간이 들어갈 것으로 판단이 됨
-> 필요기간 : 요구분석 , 프로그램설계, 구현, 테스팅, 실제적용

3. 상용 EMS 솔루션 도입
-> 장점 : 모니터링에만 그치는 것이 아니라 전체적인 통합관리시스템구축 가
능하며 업무 프로세스 개선, 고객 서비스 향상에 기여할 수 있음. 통합관리시
스템구축 차원에서는 가장 빠르게 진행할 수 있음.
-> 단점 : 당장 들어가는 비용은 가장 클 것임. 기존 시스템과의 연동 부분은
확인이 필요함.
-> 필요기간 : 업체확인이 필요하나 업무분석, 설치, 초기 1-2주 초기 데이터
분석, 관리 후 관리정책 수립 및 적용은 1-2개월에 가능할 것으로 판단함
** 해당 업체와 협의후 ASP 형태로 도입하여 호스팅고객에게 부가서비스로 제
공하고 서로 이익을 나누는 방식이 있을 수 있음

4. 모든 것 자체 개발, 다른 공개소스 활용
-> 장점 : 자체 개발을 통하여 경험과 노하우를 쌓을 수 있음. 공개소스로 시
스템, 네트워크 모니터링, 성능관리 프로그램은 많이 있는 편임
-> 단점 : 언제 끝날지 모름. 통합관리시스템개발경험이 부족한 상태에서 프
로젝트가 장기간 미궁으로 빠질수도 있음

또 한가지 판단을 할 부분은 상용솔루션을 구매하든, Web NMS를 가져오든 구
성관리가 정확히 되지 않고 있기에 초기 분석 및 연동작업에 생각보다 많은
시간이 걸릴 수 있습니다.

Gi Seong Eom 쓴 글:

> 안녕하세요.
> 엄기성입니다.
> Zabbix 1.1.1 테스트를 간단히 마치고, 저희쪽 production 서버에 일부 적
> 용을 해서
> 사용하고 있습니다. UI, 설치등이 간단해서, 처음 접하는 분들도 쉽게 만족하실
> 것으로 생각합니다... (생각보다 노가다가 있습니다만..)
> Zabbix의 Graph는 좀 부실합니다. 그래서, 개인적으론 openNMS를 통해서 이를
> 보완할려고 같이 테스트를 하고 있습니다. OpenNMS는 공부가 더 필요하네요 ^^
> 스크린샷 몇개 보여드리지요.
> 1. 사용자정의 스크린

> http://performance.pe.kr/download/_2006.08.24.zabbix.custom.screen.jpg_

> <http://performance.pe.kr/download/2006.08.24.zabbix.custom.screen.jpg>
> 2. MS-SQL 서버 모니터링
> http://performance.pe.kr/download/

> <http://performance.pe.kr/download/2006.08.24.zabbix.sql.jpg>2006.08.24.zabbix.sql.jpg

> <http://performance.pe.kr/download/2006.08.24.zabbix.sql.jpg>
> System Monitor에서 성능카운터를 가져올 수 있습니다. (Windows agent)
> 3. Windows Agent의 자원점유

> 부하가 많은 시스템에서 Agent 의 오동작/자원누수 여부는 꽤 중요하죠.

> Spotlight on Windows로 측정한 내용입니다.
>
> http://performance.pe.kr/download/

> <http://performance.pe.kr/download/2006.08.13.zabbixw32.procinfo2.jpg>2006.08.13.zabbixw32.procinfo2.jpg
> <http://performance.pe.kr/download/2006.08.13.zabbixw32.procinfo2.jpg>
> http://performance.pe.kr/download/
> <http://performance.pe.kr/download/2006.08.13.zabbixw32.procinfo1.jpg>2006.08.13.zabbixw32.procinfo1.jpg
> <http://performance.pe.kr/download/2006.08.13.zabbixw32.procinfo1.jpg>
> 일단은 여기까지^^
> *
>
> *"Imagination is more important than knowledge."*
> -- *Albert Einstein*
> *Gi Seong Eom*
> MSN: jur...@kldp.org <mailto:jur...@kldp.org> / e-mail:
> k2l...@gmail.com <mailto:k2l...@gmail.com>
> *
>
> >

--

--------------------------------------------------------
문태준
연락처 : 016-761-1160
이메일 : j...@tunelinux.pe.kr
http://tunelinux.pe.kr
http://database.sarang.net

넷지기

unread,

Aug 24, 2006, 10:55:52 PM8/24/06

to sysadm...@googlegroups.com

눈으로만 보다가 뜨끔했네요. ㅎㅎ
그래서 한자 적어봅니다.
별 내용은 아니고 그냥 저희는 어떻게 쓰고 있는지에 대해 적어보면
일단 구성은 cacti + nagios + logwatch + α 정도입니다.
서버성능 모니터링이나 하드디스크 사용량 등은 cacti 에서 확인하고 그래프로
한눈에 쭉 훑어봅니다.
그리고 nagios 는 서버가 잘 돌아가고 있는지 확인할때 쓰고
혹시 문제라도 생겨서 서버가 다운되면 자동으로 제 휴대폰에 문자가 발송되도록
설정해 두었습니다.
그외에 각종 로그확인은 하루에 한번 새벽에 logwatch 를 돌려서 전날 로그에
특이사항이 있는지 확인하구요.
logwatch 는 메일 발송량 같은 것도 간단하게 나마 종합해서 작성해 주기 때문에
편리합니다.
논외지만 저희는 Qmail을 사용하는데 multilog 를 이용해서 남기는 로그도
완벽하게 정리해줍니다.
개인적으로 qmailanalog도 쓰긴 하지만 logwatch의 분석기능이 더 낫다고
생각합니다.
물론 텍스트 형식이라 인터페이스는 허접합니다. (별로 모양을 따지는 편이
아니라..^^;)
그 외에 자체 작성한 쉘스크립트를 이용해서 로드체크나 그 외 서버 성능이
이상이 생기면 메일로 통보하고
간단하게 처리할 수 있도록 설정되어 있습니다.
이 쉘스크립트나 logwatch 실행은 cron이 아니라 Cfengine 으로 하도록 되어
있습니다.
처음에 이렇게까지 설정하는데 한달가량 걸렸는데 할때는 귀찮았지만 막상
이렇게 다 해놓고 나니
지금은 별로 할 일이 없네요. 우리 회사에서는 저는 맨날 놀고 있는 것으로
생각합니다.
그러다가 문자 오면 바빠지죠. 서버 다운 ㅡㅡ;
하긴 매일 하는 일이라곤 메일 확인하고 계정추가하고 그래프만 보고 있으니
한가해보일지도...

대충 이정도가 저희 서버의 모니터링 환경이라고 할 수 있습니다.

Gi Seong Eom

unread,

Aug 25, 2006, 1:42:05 AM8/25/06

to sysadm...@googlegroups.com

엄기성입니다.

1. 정리된 문서
나중을 위해서 문서정리도 필요합니다만, 아직은 시행착오 과정이라고
생각해서
미루고 있습니다. OpenNMS쪽도 공부할 게 많아서요. (특히 이넘은 제가
문외한인
postgreSQL만 지원해서...)

2. Zabbix의 단점
2.1 Graph
쉽게 말해서 MRTG 레벨입니다. rrdtool과 같이 복수의 데이터를 단일화면에
구현할
수 없어서, 사용자 정의 Screen 화면을 만들어야 합니다.
(Roadmap 참고: 차기 버전에서 개선된다고 합니다)

2.2 노가다(?)
template 기능을 이용하면, bulk insert를 조합해서 수백대의 host도
한방에 등록할 수
있습니다. 다만, template을 복수로 등록할 수 없어서, 요게 삽질의
근원입니다.
(이런 노가다를 조금 편하게 할 수 있도록 수정한 PHP frontend 패치도
있습니다. 1.1.1 전용)

그나마, Host group을 복수로 생성할 수 있어서 좀 유연합니다.
Zabbix forum에 보면 많이 언급되는 부분이고, 앞으로 고쳐질 것이라
예상합니다만.....

3. JFFNMS
원래는 Jffnms를 좀 생각해봤습니다. Windows 환경에서도 설치가능하다는
장점때문에.
Autodiscovery도 지원되고, rrdtool 기반이라 graph도 괜찮습니다.
Windows/Linux 환경에서 각각 설치해봤는데, 충분한 시간이 없어서 일단
skip 했습니다.

4. VM이미지들
제 모든 작업들이 vm에서 1차적으로 진행되는데, 요 vm 활용하는 것도
재미있을 거 같습니다.
최신버전의 VMWARE 서버를 운영하고 있으시면, 제가 가진 VM 이미지
가져가서
guest로 올려서 바로 써먹을 수도 있습니다. ^^ 가상화의 장점중의
하나인데, 제가 다니는
회사서는 ESX 서버 테스트가 끝나서 실제로 해보지는 못했습니다.

Happy Administration!!~~

-----원본 메시지-----
보낸 사람: sysadm...@googlegroups.com
[mailto:sysadm...@googlegroups.com] 이(가) 다음 사람 대신 보냄: 문태준
보낸 날짜: 2006년 8월 25일 금요일 오전 11:24
받는 사람: sysadm...@googlegroups.com
제목: [sysadminstudy:290] Re: 오픈소스NMS: Zabbix, OpenNMS

Gi Seong Eom

unread,

Aug 25, 2006, 3:36:37 AM8/25/06

to sysadm...@googlegroups.com

엄기성입니다.

앞서 제가 보내드린 메일의 내용이 틀렸습니다.
2개 이상의 Item을 단일한 Graph로 표현할 수 있습니다. ^^
제가 내용을 잘 못 이해하고 있었네요.

updated 스크린샷입니다.
http://performance.pe.kr/download/2006.08.25.zabbix.screenshot1.jpg
http://performance.pe.kr/download/2006.08.25.zabbix.screenshot2.jpg

좋군요~~

-----원본 메시지-----
보낸 사람: sysadm...@googlegroups.com
[mailto:sysadm...@googlegroups.com] 이(가) 다음 사람 대신 보냄: 문태준
보낸 날짜: 2006년 8월 25일 금요일 오전 11:24
받는 사람: sysadm...@googlegroups.com
제목: [sysadminstudy:290] Re: 오픈소스NMS: Zabbix, OpenNMS

유재현

unread,

Aug 26, 2006, 9:23:44 AM8/26/06

to sysadminstudy

안녕하세요.

저희는 한동안 AdventNet 의 Opmanager 를 사용했습니다.
가격도 저렴하고, 서버 IP 주소만 적어주면 Auto Discovery
해줘서 편하게 썼는데,
관리하는 서버가 늘어나면서 check interval 이 문제가
되어 포기했습니다.

요즘에는 Cacti 를 사용하는데 생각보다 꽤
편리하더군요.
CPU, Memory, Disk, Process, Connection, HTTP, Load 등의
간단한 정보를 RRD 그래프로 그려주고있고요,

사실 Cacti가 관리에 불편함이 많은데,
인터넷에서 구한 벌크 등록 스크립트 (add_device.php) 를
수정해서 사용하고 있습니다.
필요한 분 있으면 공개하도록 하겠습니다.

일주일마다 cron 스크립트로 RRD data 를 뽑아서 Weekley
Report 내주고 있고
이를 엑셀에서 불러와서 System Mertics Report 쓰고
있습니다.
(CACTI 에 plugin 으로 report 구현할 수도 있습니다)

Cacti 에 등록된 호스트들의 디스크 사용량을 점검하는
PHP 스크립트를 몇 시간마다 실행해서
메일로 보내주게 했습니다.

리눅스용으로 Munin 도 꽤나 괜찮습니다.
전에 다니던 회사에서는 Munin 을 썼는데, 윈도우 쓰는
회사로 옮겨서 이제 쓰기 힘드네요.

Dr.Mirr

unread,

Aug 27, 2006, 9:32:12 PM8/27/06

to sysadminstudy

안녕하세요 이미르 입니다.
다들 모니터링 시스템에 대한 갖은 테스트를
해보시고 계시는군요..
저도 경험은 비록 얼마 안되지만 적어보겠습니다.
저의 경우는 처음 모니터링 툴에 대한 선택으로 많은
고민을 해야 했습니다.
기왕이면 여러번의 삽질 없이도, 간단하게 모든걸 다
보고 싶었던 거죠..(욕심이 컸습니다..^^)
그래서 처음엔 cacti를 설치해 보았는데, 이것이 기타
설정들 및 관리가 생각보다 까다롭드라구요..

그리곤 Nagios를 사용해 봤습니다.웹에서도 쉽게 볼 수
있어서 좋았습니다만,
100여대정도의 서버 셋팅이, 너무 세분화 되고
복잡해서 저로선 매우 힘들었습니다.
결국 기본적인 서버상태만 볼 수 있도록 설정하고,
사장님께 보여드리는 용도로만 사용하고 있습니다.

제가 지금까지 매우 유용하게 사용하고 있는건 What's
UP 입니다.
이녀석은 서버 등록 및 설정도 매우 쉽고, 자체 설치
및 설정 또한 간결했습니다.
처음엔 2006 트라이얼 버젼을 사용해 봤는데 너무
좋아서 기간이 만료되는게 아쉽더라구요..
그래서 2005버젼을 어두운 하수구를 뚫고 구해왔죠..

현재로는 여기에 전부 의존하고 있는 편입니다.
기본적으로 What'sup에서 지원하지 않는 프로토콜들은
TCP 프로토콜을 사용하여
직접 서비스 포트로 핑을 때리는 식으로 체크했고,
문자역시 따로 문자발송용 서버 프로그램을 만들어서
적당한 서버에 올려두었습니다.
What'sup에서 시스템문제를 발견 할 경우 직접 제작한
클라이언트 프로그램을 실행하여
실행 인자로 문자열을 넣어주게 되어있고, 그
문자열은 서버프로그램에 날아가서,
서버에선 저희 회사에서 서비스하고 있는 무료 문자
디비서버로 쿼리를 날리게 되는거죠..(SMS
터널링이라고하나요 혹시..잘몰라서..)

지금 이 상태로 6개월이 넘게 아주 마음놓고 잘
지내고 있습니다.
물론 로그관리는 Logwatch 를 이용하고 있구요..
Logwatch로 하드디스크용량, 크론로그, 접속관련,
부팅관련로그들을 받아보고 있습니다.
이것도 역시 100여대정도 되는 서버의 로그를
한꺼번에 받아봐야 하기때문에 혼자로썬 꽤나 무리가
있는 편이긴 하지만,
그래도 어쩌겠습니까 .... 주어진 환경이 그러한걸..^^

어쨋든 그동안 전 What'up + Logwatch를 사용하고 있었고,
요즘들어 What'sup의 한개가 느껴지던 참인데
이 기회에 각 모니터링 시스템들좀 비교해보면서
삽질해 봐야겠습니다..

Dr.Mirr

unread,

Aug 27, 2006, 9:39:41 PM8/27/06

to sysadminstudy

아참...한가지 빠뜨린게 있어서 다시 포스팅합니다..
혹시 그룹포스팅 매너에 어긋나나요? 메일링리스트에
참여해본 경험이 없어서요..^^
What'up으로 좀 더 쉽게(하지만 문자로받기엔
불편하게ㅡ,.ㅡ::) 하는 방법도 있습니다.
Nate에 보면 메일알림 서비스라는게 있습니다.
이게 메일을 Nate로 보내면 메일제목을 문자로
보내주는 기능인데,
한때는 이걸 이용해서 (회사에서 SMS 서비스를 하고
있었다는걸 몰랐을때...)
시스템에 문제가 있을때 What'up 메일발송 액션을
이용해서 직접 메일을 이쪽으로
보내게 한적이 있었죠.....

근데 문제는 이게 글자가 제한되서 짤라서 보내는
간단한 프로그램을 짜야했다는거죠..ㅎ

트래픽보기는 사실 전체적인 트래픽만 그냥 IDC에서
제공해 주는 것을 보고 있습니다.
회사에서 하는 서비스중에는 대용량
파일서비스(FTP)도 있는데, 이 서비스에
관련된 서버만 따로 mrtg로 묶어서 접속상태나,
전송속도등의 문제가 들어왔을 경우만
확인합니다.

Jerad J.H. SHIN

unread,

Aug 27, 2006, 10:15:52 PM8/27/06

to sysadm...@googlegroups.com, jerad...@gmail.com

많은 업체들에서 정품으로 구입한 S/W이든 어둠의 경로를 통해서 얻은 S/W든..

What's up을 기본적인 모니터링 툴로 사용하고 있는 것이 보통인것 같습니다.

저희 회사 역시, 수년간 What's up을 사용해 오고 있고, 단순한 TCP Port체크부터 시작해서

스크립트를 따로 날려서, Contents Health Check까지 가능합니다.

저희 사는 기본적으로, 대형 LCD에 What's up MAP을 띄워서 모니터링 하고 있고

그 외에 네트워크 장비는, Cacti를 이용해서 모니터링하고 있습니다.

그 외의 서버들은, 중요한 서버들은 SNMP을 올려서 Cacit로 보고 있고

Logwatch + 자체 제작 모니터링 프로그램을 통해서 모니터링을 하고 있습니다.

만약 시스템에 장애가 발생한다면, 첫번 째로 문자가 오게 되고 두 번 째로, NOC Team으로 메일, 그리고 What's에 있는 화면을 통해서

장애 감지를 하고 있습니다. 지금까지 사용하면서, 장애가 발생했는데 캣치를 못 한 적은 없는 것 같네요. 기억에.

KT-IDC도 What's 화면을 빔프로젝터로 쏴서 대형 화면에서 모니터링을 하면서 일을 하더라구요.

몇달전에 해외 출장시에도 보면 중국, 미국 IDC도 What's up을 통해서 시스템 모니터링을 하고 있었습니다.

06. 8. 28일에 Dr.Mirr <mir...@gmail.com>이(가) 작성:

문태준

unread,

Aug 28, 2006, 12:34:23 AM8/28/06

to sysadm...@googlegroups.com

네, 지금처럼 이렇게 토론할 거 있으면 자연스럽게 말하시면 됩니다.
이렇게 서로간에 직접 사용하고 있는 사용기들, 경험달을 공유하자는게 이 모
임(?)의 취지이지요.
모니터링관련해 이렇게 토론이 오가면 서로 많은 도움이 될 듯 합니다.

opmanager는 전에는 잘 몰랐었는데 이것도 국내는 모르지만 해외에서는 많이
쓰는 듯 합니다.
http://www.adventnet.com/
opmanager는 완제품이고 webnms라는것은 자체적으로 개발해 사용할 수 있도록
제공하는 프레임웍입니다.
기본적인 모니터링하는것이야 왓츠업이든 뭐든 완제품쓰면 되겠지만 좀더 기
존 시스템과의 연동이나 여러가지 것을 처리하려면 부가적인 기능이 있어야
할 것 같습니다.
상용 nms 제작시 위 회사의 webnms 모듈을 많이 쓰는 듯 합니다.
이외에도 여러가지 시스템, 네트워크 관련 프로그램들이 많은데 한번 사이트
를 보면서 저런 제품도 있구나 참고하면 도움될 듯 하네요.

왓츠업은 예전에 비해 최근에 나온것이 기능과 UI가 많이 보강되었다고 알고
있습니다.
저는 전에 이걸 써보지 않아서 이름만 알고 있고 옆의 다른 사람들이 그러더군요.

opmanager 나 webnms 를 이용해본 경험 가진 분들 더 없나요?
재현님은 "서버가 늘어나면서 check interval 이 문제가되어 포기했습니다"
라고 했는데 이게 어떤것을 말하는지??
그리고 cacti 쓰면서 말흔 벌크스크립트 그런건 당근 공개해도 되지요.
수많은 사람들이 항상 비슷한 잘못이나 실수를 반복!

Dr.Mirr 쓴 글:
> 아참...한가지 빠뜨린게 있어서 다시 포스팅합니다..혹시 그룹포스팅 매너에 어긋나나요? 메일링리스트에참여해본 경험이 없어서요..^^What'up으로 좀 더 쉽게(하지만 문자로받기엔불편하게ㅡ,.ㅡ::) 하는 방법도 있습니다.Nate에 보면 메일알림 서비스라는게 있습니다.이게 메일을 Nate로 보내면 메일제목을 문자로보내주는 기능인데,한때는 이걸 이용해서 (회사에서 SMS 서비스를 하고있었다는걸 몰랐을때...)시스템에 문제가 있을때 What'up 메일발송 액션을이용해서 직접 메일을 이쪽으로보내게 한적이 있었죠.....
> 근데 문제는 이게 글자가 제한되서 짤라서 보내는간단한 프로그램을 짜야했다는거죠..ㅎ

> 트래픽보기는 사실 전체적인 트래픽만 그냥 IDC에서제공해 주는 것을 보고 있습니다.회사에서 하는 서비스중에는 대용량파일서비스(FTP)도 있는데, 이 서비스에관련된 서버만 따로 mrtg로 묶어서 접속상태나,전송속도등의 문제가 들어왔을 경우만확인합니다.
> >
>

유재현

unread,

Aug 28, 2006, 2:28:38 AM8/28/06

to sysadminstudy

OpManager는 완제품으로 쓰기에 상당히 편리합니다.
서버에서 SNMP enable 만 해주고 OpManager 웹페이지에서
서버의 IP 주소만 넣어주면
서버의 OS, H/W 정보를 가져오고,
CPU, DISK, Memory, Network, TCP 등의 퍼포먼스 그래프를
생성해줍니다.
Top20 리포트 등의 꼭 필요한 리포트를 구현해 줍니다.

가격은 Professional 버전이 $795 이고, Premium 버전이 $1995
입니다.
User 단위로 증가하기 때문에 대부분 Single user 로
구입하시면 될겁니다.
(http://manageengine.adventnet.com/products/opmanager/pricing.html)

What's up gold 보다 더 저렴합니다.
(http://www.ipswitch.com/purchase/products/whatsup_professional.asp)

check interval 문제는..
퍼포먼스 체크하는 시간 간격이 5분인데,
전체 서버를 체크하는 소요 시간이 5분을 초과하는
경우에 문제가 됩니다.

예를 들어 0,5,10,15,20,25,30,35,40,45,50,55 분에 체크를
하도록 스케줄되어 있는데,
0분에 시작한 체크가 5분이 넘어도 끝나지 않으면,
5분에 새로 시작하는 스케줄과 충돌해서 시스템이
느려지거나 체크를 못하게 됩니다.
OpManager 에서 interval 을 10분 정도까지 늘려봤는데도
어렵더군요.
check interval 을 더 늘리면 performance logging 의 의미가
퇴색할거 같아 그냥 포기했습니다.
(이 때가 500 device 정도 였습니다)

결국 단순한 Cacti 로 바꾸게 되었고요.
Cacti 는 1회 측정시에 3분 정도에 완료되도록 서버를
분배하고 있습니다.
2 cpu 서버에 현재 3~400 device 를 측정하고 있습니다.

문태준

unread,

Aug 28, 2006, 11:56:59 PM8/28/06

to sysadm...@googlegroups.com

요즘들어 What'sup의 한개가 느껴지던 참인데 -> 이게 뭘 말하는건가요?

Dr.Mirr 쓴 글:
> 안녕하세요 이미르 입니다.다들 모니터링 시스템에 대한 갖은 테스트를해보시고 계시는군요..저도 경험은 비록 얼마 안되지만 적어보겠습니다.저의 경우는 처음 모니터링 툴에 대한 선택으로 많은고민을 해야 했습니다.기왕이면 여러번의 삽질 없이도, 간단하게 모든걸 다보고 싶었던 거죠..(욕심이 컸습니다..^^)그래서 처음엔 cacti를 설치해 보았는데, 이것이 기타설정들 및 관리가 생각보다 까다롭드라구요..
> 그리곤 Nagios를 사용해 봤습니다.웹에서도 쉽게 볼 수있어서 좋았습니다만,100여대정도의 서버 셋팅이, 너무 세분화 되고복잡해서 저로선 매우 힘들었습니다.결국 기본적인 서버상태만 볼 수 있도록 설정하고,사장님께 보여드리는 용도로만 사용하고 있습니다.
> 제가 지금까지 매우 유용하게 사용하고 있는건 What'sUP 입니다.이녀석은 서버 등록 및 설정도 매우 쉽고, 자체 설치및 설정 또한 간결했습니다.처음엔 2006 트라이얼 버젼을 사용해 봤는데 너무좋아서 기간이 만료되는게 아쉽더라구요..그래서 2005버젼을 어두운 하수구를 뚫고 구해왔죠..
> 현재로는 여기에 전부 의존하고 있는 편입니다.기본적으로 What'sup에서 지원하지 않는 프로토콜들은TCP 프로토콜을 사용하여직접 서비스 포트로 핑을 때리는 식으로 체크했고,문자역시 따로 문자발송용 서버 프로그램을 만들어서적당한 서버에 올려두었습니다.What'sup에서 시스템문제를 발견 할 경우 직접 제작한클라이언트 프로그램을 실행하여실행 인자로 문자열을 넣어주게 되어있고, 그문자열은 서버프로그램에 날아가서,서버에선 저희 회사에서 서비스하고 있는 무료 문자디비서버로 쿼리를 날리게 되는거죠..(SMS터널링이라고하나요 혹시..잘몰라서..)
> 지금 이 상태로 6개월이 넘게 아주 마음놓고 잘지내고 있습니다.물론 로그관리는 Logwatch 를 이용하고 있구요..Logwatch로 하드디스크용량, 크론로그, 접속관련,부팅관련로그들을 받아보고 있습니다.이것도 역시 100여대정도 되는 서버의 로그를한꺼번에 받아봐야 하기때문에 혼자로썬 꽤나 무리가있는 편이긴 하지만,그래도 어쩌겠습니까 .... 주어진 환경이 그러한걸..^^

문태준

unread,

Aug 28, 2006, 11:58:12 PM8/28/06

to sysadm...@googlegroups.com

cfengine 사용하고계시군요. 사용기 하나 부탁해요.
올해초에 사용해보고나서 괜찮은 툴이라고 생각하고 있어 현업에 있으면 도입
을 하겠다는 생각을 하고 있었지요.

넷지기 쓴 글:

넷지기

unread,

Aug 29, 2006, 1:25:40 AM8/29/06

to sysadm...@googlegroups.com

그렇게 거창한 건 아닙니다. 아직 자동업데이트 같은 건 설정을 못했구요.
현재는 cron 대신으로 cfengine을 사용하고 있습니다.
단지 cron보다 설정하는 게 직관적이라 첨에 설정해놓고 나중에 설정파일을
열어봐도 이해하기가 쉬워서요.
그리고 오래된 파일정리나 로그로테이트 같은 부가적인 기능이 있어서 잘 쓰고
있어요.
아.. 서비스용 프로세스가 살아있는지 아닌지도 체크합니다. 프로세스가
죽어서 ps에 안 뜨면 관리자에게 통보하고 재시작하구요.
cfengine 쓰면서 cron이나 logrotate, tripwire 는 안 돌도록 설정했습니다.
cron 은 단지 cfexecd 가 살아있는지 죽었는지 확인하는 용도로 사용합니다.
(얘기하고 보니 쓰긴 쓰는군요 ^^;;)
참고로 cfexecd는 crond 같은 데몬으로 주기적으로 cfagent를 실행해서
설정파일에 지정된 시간에 해당하는 작업을 수행합니다.
cfexecd와 crond가 동시에 죽을 일은 별로 없다고 보기 때문이며, 동시에
죽는다면 아마도 서버다운이 아닐까 합니다.
서버 다운일 경우에는 nagios에서 체크하겠죠.
위에서 얘기한 기능 외에도 여러가지 기능이 많이 있습니다.
가장 사용해보고 싶은 기능이 cfservd 를 이용한 기능들입니다.
바로 자동업데이트죠... 각 서버에 일일이 접속하지 않고 한대의 중앙
서버에서 모든 서버들의 설정파일을 변경하거나
어떤 작업을 수행하도록 만드는...
그리고 서버군을 묶어서 어떤 서버들은 이런 작업을 시키고, 또 어떤 서버들인
다른 작업을 시키는...
이런 작업들이 cfengine을 이용하면 가능한 것으로 알고 있습니다.
물론 서버들간의 연결은 SSL 인증키를 이용하기 때문에 암호화되어 안전합니다.
지금은 서버가 잘 돌아가고 있고 서버수가 그리 많지 않아 별로 필요성을 못
느끼지만
서버수가 늘어나고 지금보다 작업이 더 귀찮아지면 cfservd까지 사용하게 될지도
모르겠네요.
현재는 그냥 일일이 서버 접속해서 작업합니다. ㅡㅡ^
이상 cfengine의 간단한 사용기입니다.
기회가 되면 제대로 정리해서 설치부터 설정까지 한번 적어볼까 합니다.
(언제가 될지 ^^;;)

Dr.Mirr

unread,

Aug 29, 2006, 9:00:55 PM8/29/06

to sysadminstudy

뭐...사실 한계라기보다는 왓츠업 하나로 모든걸 다
할 수는 없다는 아쉬움이랄까요?

각 모니터링 라이브러리가 풍부하지 못한점, 가끔
discovery를 실행하면 이상한 결과가
나오기도 하는점(나만그런가 ㅡ,.ㅡ::)
또, 리스트데이터나 설정파일들을 추출해서 다른
컴퓨터의 왓츠업으로 옮기는 방법도 아직까지
못찾아냈거든요..
What'sup Gold 버젼의 데이타를 마이그레이션
시켜주는메뉴는 있는데,
2005나 2006의 데이타를 익스포트시켜주는걸
못찾겠어요..
뭐 대략 이정도랄까요...그런점만 빼면 끝내주는
툴이지요..

문태준

unread,

Mar 28, 2007, 1:10:13 AM3/28/07

to sysadm...@googlegroups.com

질문이 있습니다.

기존에 내부적으로 왓츠업을 사용하고 있는데 이를 다른 것으로 대체할지 아
니면 계속 쓸지 고민중이랍니다.
왓츠업의 경우 모니터링할 댓수가 늘어나는 경우 (천대이상?) 성능에 문제가
없나요??
큰 IDC에서도 사용을 한다면 괜찮을 듯도 한데요.
모니터링할 규모가 커지면 그만큼 자주 모니터링할 명령을 내려야하고 받아서
처리해야 할 것도 많을텐데요.
nagios의 경우는 분산 모니터링이라고 하여 일정한 범위에서 모니터링하는 서
버를 분산하고 모니터링한 결과만 중앙의 관리서버로 보내는 방식을 이용합니
다. 실제 알람은 중앙의 관리서버에서 하는 방식이지요.

이보다 더 중요한 것은 기존 시스템과의 연동입니다.
모니터링할 호스트를 일일이 한대한대 세팅하는 것이 아니라 자동화하려고 한
다면 기존 시스템과 연동을 해야 합니다.
이경우 다른 프로그램과 연동을 하여 신규 호스트를 자동으로 등록, 수정, 삭
제하고 모니터링 항목도 변경가능할지요.
DB를 MS-SQL을 사용할 수가 있으므로 직접 DB를 컨트롤할수가 있는지요.

--

--------------------------------------------------------
문태준
연락처 : 공일육 칠육일 일일육공
이메일 : jun(at)tunelinux.pe.kr
http://tunelinux.pe.kr
http://database.sarang.net

엄기성

unread,

Mar 28, 2007, 3:42:27 AM3/28/07

to sysadm...@googlegroups.com

엄기성입니다.

1. 일단 Zabbix에서 Distrubuted Monitoring은 향후 버전에서 제공될 예정입니다. (현재 안정버전에서는 안됨)
참고로 현재 사용중인 장비는 270여대 서버를 모니터링 중인데, 무난하게 사용하고 있습니다.
Host 머신 스펙은 다음과 같습니다. (IBM x330 / 1.2Ghz 2way / RAM 1G)

2. 굳이 분산 모니터링 구조가 아니더라도, 현재 쓰는 모니터링 솔루션이 운영중인 서버의 상태, Backend DB(mysql) 설정에 따라
확장성은 굉장히 달라집니다 예를 들어 established TCP connection 체크 간격을 30초, 1분, 5분으로 변경해보면
응답속도가 굉장히 차이납니다. 현재 사용하는 솔루션에서도 튜닝의 여지가 꽤 있다고 봅니다.

3. 오픈소스 DBMS든, MS-SQL이든, 백엔드DB를 사용하는 솔루션이면 뭐가 되든 직접 제어가 가능할 것입니다.
이 부분은 관리자의 역량인데, 저는 (실력이 미진하여) 따로 손대지는 않고 있습니다. ^^

참고하세요~~

-----원본 메시지-----
보낸 사람: sysadm...@googlegroups.com [mailto:sysadm...@googlegroups.com] 이(가) 다음 사람 대신 보냄: 문태준

보낸 날짜: 2007년 3월 28일 수요일 오후 2:10
받는 사람: sysadm...@googlegroups.com
제목: [sysadminstudy:414] Re: 오픈소스NMS: Zabbix, OpenNMS

yongbin

unread,

Apr 2, 2007, 12:00:49 AM4/2/07

to sysadm...@googlegroups.com

저희는 QUESTSOFT에서 판매하는 Bigbrother ( http://bb4.com ) 의 오픈소스 버전 버전을 적당히 커스텀해서 사용하고 있습니다.

BB의 경우는 별도의 backend db를 사용안하고 파일캐쉬방식으로 컨탠츠를 만들어내는 방식이라 호스트가 적을때는 별다른 문제가 없지만

호스트 숫자가 증가하면 처리속도가 기하급수적으로 늦어지는 문제가 있습니다 @_@ 아울러 아무래도 시간대별 모니터링 결과를

DB에 저장하고 가공하는 방식이 아니라 결과에 대한 부분만 누적시키다보니 나중에 데이터를 임의대로 뽑아보거나 분석하기도 좀

어려운 단점이 있습니다. 기타 서버쪽 컨트롤이나 그런기능들이 거의 없기 때문에 NMS나 SMS라고 보기는 무게감이 많이 떨어지지만

내부언어가 전부 쉘스크립트로 되어있어서 서버쪽에서 커스텀하기 용이한 장점때문에 아직은 잘 쓰고 있습니다

하지만 관리하는 네트웍 대역이 늘어가고 노드숫자도 1000대정도에 근접하니까 태준님께서 말씀하시는 분산모니터링같은게

필요하다고 느끼고 있는중입니다 ( 최근에는 5분 모니터링 인데 노드수 전체 체크가 20분넘어가는 상황이라 ... )

zabbix나 What'sup 같은경우는 훨씬 규모가 큰 시스템인것 같은데 한번 테스트를 해봐야겠습니다.

07. 3. 28, 엄기성 <jur...@ncsoft.net>이(가) 작성:

Reply all

Reply to author

Forward