谈谈如何做好运维
2012-05-16 00:13:35 来源:互联网 评论:0 点击:
其实运维这工作,只要把握几点:0)懂点硬件网络和pxe;1)自动化部署puppet用好;2)监控系统nagios+ganglia/munin/monit等;3)自动化发布ca...
其实运维这工作,只要把握几点:
0)懂点硬件网络和pxe;
1)自动化部署puppet用好;
2)监控系统nagios+ganglia/munin/monit等;
3)自动化发布capistrano/hudson;
4)有意义的主机名以及把DNS用好;
5)hold住3层以下的交换机;
6)再多花点功夫去折腾一下常用的工具.
再有就是觉悟层面的了,也是几点:
第一个觉悟:开发的看到错误,第一反应是看code,运维人员当然就是看log;
第二个觉悟就是,运维人员做任何一个简单的操作,都要做好几步检查去验证这个操作是否完成,以及提前验证这个操作是否可以执行。
第三个觉悟,在修改或者删除时,必须先做个备份,以免悲剧发生。
第四个觉悟,时时刻刻认识到自己对production环境负责,出错的唯一责任就是自己。因此要勇于跟开发人员PK.
0)懂点硬件网络和pxe;
1)自动化部署puppet用好;
2)监控系统nagios+ganglia/munin/monit等;
3)自动化发布capistrano/hudson;
4)有意义的主机名以及把DNS用好;
5)hold住3层以下的交换机;
6)再多花点功夫去折腾一下常用的工具.
再有就是觉悟层面的了,也是几点:
第一个觉悟:开发的看到错误,第一反应是看code,运维人员当然就是看log;
第二个觉悟就是,运维人员做任何一个简单的操作,都要做好几步检查去验证这个操作是否完成,以及提前验证这个操作是否可以执行。
第三个觉悟,在修改或者删除时,必须先做个备份,以免悲剧发生。
第四个觉悟,时时刻刻认识到自己对production环境负责,出错的唯一责任就是自己。因此要勇于跟开发人员PK.
上一篇:我在Facebook的十点经验分享
下一篇:微信一亿用户增长背后的架构秘密
分享到:
收藏
评论排行
- ·Windows(Win7)下用Xming...(92)
- ·使用jmx client监控activemq(20)
- ·Hive查询OOM分析(14)
- ·复杂网络架构导致的诡异...(8)
- ·使用 OpenStack 实现云...(7)
- ·影响Java EE性能的十大问题(6)
- ·云计算平台管理的三大利...(6)
- ·Mysql数据库复制延时分析(5)
- ·OpenStack Nova开发与测...(4)
- ·LTPP一键安装包1.2 发布(4)
- ·Linux下系统或服务排障的...(4)
- ·PHP发布5.4.4 和 5.3.1...(4)
- ·RSYSLOG搭建集中日志管理服务(4)
- ·转换程序源码的编码格式[...(3)
- ·Linux 的木马程式 Wirenet 出现(3)
- ·Nginx 发布1.2.1稳定版...(3)
- ·zend framework文件读取漏洞分析(3)
- ·Percona Playback 0.3 development release(3)
- ·运维业务与CMDB集成关系一例(3)
- ·应该知道的Linux技巧(3)