devops的细分---报警通告领域实践分享

25 views
Skip to first unread message

Henry Yu

unread,
Oct 27, 2014, 1:54:32 AM10/27/14
to agile...@googlegroups.com
群里大部分人都是我的前辈,邮件里如果有不合适的地方请大家为我指出:)

现在大家有多少人在关注devops?我很早之前在公司做敏捷相关的工作,后来做运维平台研发,再后来直接做了运维团队的leader,所以对这个领域有些实践。

我们这段时间在监控报警通告领域做了一个平台,主要的目的有两点:
1. 防止报警遗漏,以及报警处理不及时和处理超时通告等问题
2. 减少报警对项目组的普遍影响

这个平台包含两个策略:
1. 逐级通告策略,通过逐级规避遗漏
2. 更多源的通告渠道,目前我们引入了电话和app的渠道发送报警

实际效果:
1. 几乎避免的报警的遗漏:不使用平台,报警遗漏率在10%左右
2. 非值班项目成员,处理报警的时间仅为原来的7%

通告平台针对监控报警,但也同样适用于CI的失败通告、证券公司的股票曲线变化通告等场景。

国外的有类似的公司pagerduty,估值据说已经10亿刀。

想问问大家如何看待devops中这些细分领域的产品,这些小产品在国内的项目组是否适用?

有兴趣的同学,欢迎一起交流!

为了看起来不像广告,这个帖子就不粘贴平台的地址了,但粘一篇项目新人写的一个博客:http://blog.csdn.net/sylcc_/article/details/40475097 

张裕

unread,
Oct 27, 2014, 4:53:15 AM10/27/14
to agile...@googlegroups.com
工作在非互联网公司, 我觉得这一类的应用需要融入生态圈才有价值, 如travis-ci和github, overalls.io和travis-ci这样子. 作为创业者和小企业运维的良好助手, 实时有效的告警非常必要.

--
--
敏捷中国 http://www.agilechina.net 邮件列表
如果想发起讨论,请发送邮件到 agile...@googlegroups.com
如欲退订请发送邮件到 agilechina-...@googlegroups.com
更多选项,请访问 http://groups.google.com/group/agilechina
---
您收到此邮件是因为您订阅了Google网上论坛中的“敏捷中国”论坛。
要退订此论坛并停止接收此论坛的电子邮件,请发送电子邮件到agilechina+...@googlegroups.com
要查看更多选项,请访问https://groups.google.com/d/optout



--
Gentoo, DIY your desktop
Reply all
Reply to author
Forward
0 new messages