从通断说起

1 view
Skip to first unread message

sky

unread,
Aug 25, 2009, 2:42:38 AM8/25/09
to EMS网管开发
EMS管理网元,那么首先就是要从NE的通断开始管理起。通断必需迅速的反映的网管的界面上,还必需生成对应的告警记录。如果NE故障,告警非常
频繁就必需把记录合并成一条一段时间内告警多次发生的记录。
处理的关键就在于探测NE联通的机制,好的网管机制设计的很合理,管理大数量的网元也可以在一秒内监测到。而不好的机制,就会越来越慢。
当然,如果系统本身有漏洞,EMS运行个十几天本来也会各种各样的毛病全部冒出来。
通断是NE管理的基础,其他的定时任务和监控任务以及管理任务都建立在NE通的情况下的。

各位可以先就这个话题讨论讨论,讨论完通断,才能讨论后面的告警,日志,性能这些任务。

techabc

unread,
Aug 25, 2009, 3:25:15 AM8/25/09
to ems...@googlegroups.com
关于通断监测,确实比较容易遇到问题。接入网的设备,在网设备数量大,设备成本则尽量压缩,甚至很多都没有嵌入式的OS,更甚至连以太网都不支持而只有串口(这种情况现在已经很少见了,但历史遗留设备还是有的),这样就全凭EMS主动监测,当设备数量破百后,这真的是个问题,多线程、线程池等上阵,却也常遇到头疼的情况。

sky

unread,
Aug 25, 2009, 3:58:27 AM8/25/09
to EMS网管开发
这里有个策略问题。
采取什么技术去监测通断?
对于长期不通的NE应该采取什么策略?
任务调度的设计?


On Aug 25, 3:25 pm, techabc <tech...@gmail.com> wrote:
> 关于通断监测,确实比较容易遇到问题。接入网的设备,在网设备数量大,设备成本则尽量压缩,甚至很多都没有嵌入式的OS,更甚至连以太网都不支持而只有串口(这-种情况现在已经很少见了,但历史遗留设备还是有的),这样就全凭EMS主动监测,当设备数量破百后,这真的是个问题,多线程、线程池等上阵,却也常遇到头疼的情-况。

techabc

unread,
Aug 26, 2009, 4:44:13 AM8/26/09
to ems...@googlegroups.com
因为一些简单的设备无trap等机制,所以主要采用EMS发起轮询的方式;
对于长期不通的设备,采用如退避窗口等类似gmail、msn、qq等重新连接的算法,如:假如多次不通,则每次退避1,2,5,8,……个时间单位后再试,这样还是会错过设备恢复的时刻的。并且,有时不得已采用对设备同步进行轮询的机制,就是必须等设备超时后才继续进行下一步的操作,这样的话,就更麻烦了;
任务调度,就像进程调度一样,只有某种情况下合理的算法,但设备种类多样,很难大面积适合

2009/8/25 sky <shuha...@gmail.com>

sky

unread,
Aug 26, 2009, 5:18:48 AM8/26/09
to EMS网管开发
Trap是告警机制,而且这种告警机制因为先天是不可靠的。所以只能是一种备用机制。
已后会在ALARM中讨论TRAP,居然还有厂商告警全部通过TRAP来收集,真是玩笑。所以瞬间产生大量告警总是会丢就是因为先天机制不可靠。

Trap和通断没有关系。

On Aug 26, 4:44 pm, techabc <tech...@gmail.com> wrote:
> 因为一些简单的设备无trap等机制,所以主要采用EMS发起轮询的方式;

> 对于长期不通的设备,采用如退避窗口等类似gmail、msn、qq等重新连接的算法,如:假如多次不通,则每次退避1,2,5,8,......个时间单位后再试,这-样还是会错过设备恢复的时刻的。并且,有时不得已采用对设备同步进行轮询的机制,就是必须等设备超时后才继续进行下一步的操作,这样的话,就更麻烦了;


> 任务调度,就像进程调度一样,只有某种情况下合理的算法,但设备种类多样,很难大面积适合
>

> 2009/8/25 sky <shuhail...@gmail.com>


>
>
>
> > 这里有个策略问题。
> > 采取什么技术去监测通断?
> > 对于长期不通的NE应该采取什么策略?
> > 任务调度的设计?
>
> > On Aug 25, 3:25 pm, techabc <tech...@gmail.com> wrote:
>

> > 关于通断监测,确实比较容易遇到问题。接入网的设备,在网设备数量大,设备成本则尽量压缩,甚至很多都没有嵌入式的OS,更甚至连以太网都不支持而只有串口(这--种情况现在已经很少见了,但历史遗留设备还是有的),这样就全凭EMS主动监测,当设备数量破百后,这真的是个问题,多线程、线程池等上阵,却也常遇到头疼的-情-况。- Hide quoted text -
>
> - Show quoted text -

techabc

unread,
Aug 26, 2009, 5:25:20 AM8/26/09
to ems...@googlegroups.com
老大在这个领域经验丰富,既然想跟大伙分享,不妨先列个提纲性的东西,这样也便于大家就自己感兴趣的内容进行更多的思考。
当然,更期待能尽快将您的多年心得变成文字~

2009/8/26 sky <shuha...@gmail.com>

Hailong Shu

unread,
Aug 26, 2009, 5:28:26 AM8/26/09
to ems...@googlegroups.com
呵呵,客气客气,也就是随便说个话题大家讨论讨论罢了。一个人写没有意思,大家一起写才好玩。


 
2009/8/26 techabc <tec...@gmail.com>

Hailong Shu

unread,
Aug 26, 2009, 5:29:55 AM8/26/09
to ems...@googlegroups.com
之前有篇文章,是我关于网管开发的几个难点,基本可以当一个大致的提纲。
每个难点里面其实又有若干小问题,合起来就比较完整了,不过这个需要不忙的时候慢慢整理。
也需要更多的高手同好加入近来。

2009/8/26 techabc <tec...@gmail.com>
Reply all
Reply to author
Forward
0 new messages