当前位置:首页 > 计算机 > 正文内容

高级运维的一天

DYX5年前 (2020-04-14)计算机1047

很多刚学linux运维的朋友,总是搞不懂,运维工程师工作中干些啥?学的这些东西有什么用?还有很多人会以为运维嘛,不就是一个修电脑修网线的。

有句话说得好:运维做到极致,不是出现问题时能轻松解决,而是知道怎么提前预防问题的出现,能将故障扼杀在萌芽里。

今日我特来总结总结一个高级运维干什么,希望能帮助即将跨入该行的人形成一个整体的思路。


你以为运维就是修电脑?大错特错!盘点一个高级运维的一天

运维工程师干些什么?

总结两句话

1、 保障业务长期稳定运行(如网站服务器、游戏服务器等等)。

2、 保障数据安全可靠(如用户名密码、游戏数据、博客文章、交易数据等等)。

你以为运维就是修电脑?大错特错!盘点一个高级运维的一天

由这两句话推演运维工程师要学些什么?

一、保障业务长期稳定运行

出一点点差错,用户就要投诉了。

1、业务跑在什么上面?

网站服务器一般是apache,nginx,tomcat等。但是真正跑通流程还需要Mysql数据库来存储用户密码及其它。很多程序都要php的解析,所以LNMP、LAMP(即nginx、apache、mysql、php)环境部署是必须掌握的技能。

2、业务出了问题怎么及时知道?

这就需要监控软件来邮件或短信来通知你,常用的有zabbix,nagios等。报警发邮件,也得一个邮件程序呀,sendmail或postfix。

3、在家里收到报警,但服务器是内网IP,怎么也得解决问题吧?

在公司搭建openvpn或pptp或openswan,在家里通过VPN拨入内网,24小时解决问题…唉,半夜爬起来解决问题也没工资。


你以为运维就是修电脑?大错特错!盘点一个高级运维的一天

二、保障数据安全可靠

出一点点差错,领导要找你喝茶了。

1、有时需要手动改数据库内容?

所以要会基本的Mysql数据库增删查改命令。

2、万一数据库服务器硬件坏了怎么办?

需要有个备库以备不时之需,所以需要Mysql主从复制。

3、 数据库要还原怎么办?

所以需要在crond中定期全备Mysql数据,以便还原使用。如果要还原到指定时间点,还要学会Mysql增量备份与恢复。

4、 如果是用户上传的图片或文件服务器坏了怎么办?

定时备份可能还不够,需要使用rsync加inotify来实时备份。以便任一时刻主服务器坏掉,也能保障所有图片有备份可以用来恢复。

5、小心黑客,要增加服务器安全性?

ssh轻易不能让外人访问,那么就设置只允许公司的IP或跳板机IP访问,这些都通过iptables来控制。

三、大性能

小公司总有一天会牛逼起来的,实在牛不起来咱也可以跳到大公司。

1、越来越多的用户来访问我们的网站,一台web服务器抗不住了怎么办?

那就需要多台web服务器来负担,但多台服务器之间怎么进行负载均衡呢,这就需要用到nginx反向代理或LVS+keepalived或haproxy+heartbeat了。

2、用户注册发表的文章与评论太多,一台数据库抗不住了怎么办?

数据库压力分为读和写,如果写抗不住,需要进行分表分库到多个服务器上。如果是读压力不够了,可以使用mysql-proxy读写分离,来分担读的压力。更简单方便的方法,把数据库里的内容放到内存上,这就用上memcache或redis了。

3、N多用户上传下载文件,磁盘抗不住了怎么办?

把多块磁盘做成raid,或者使用分布式存储文件系统如MFS,GlusterFS来提高磁盘的读写能力。

4、网站上好多图片,总有用户反应网站加载太慢,怎么办?

这时可以把网站上的图片通过squid或varnish缓存到网站前端,尽可能的增加访问速度,当然,最好是购买商业的CDN加速。

5、运营商是个大难题,他们之间的带宽好像很小,联通IP访问我电信网站怎么就这么慢呢?

这时可以使用bind自建一个DNS服务器,把网站的DNS记录指向自建DNS服务器上,配置好解析规则,以后联通IP解析到联通网站上,电信IP解析到电信网站上,体验就会好很多啦。


你以为运维就是修电脑?大错特错!盘点一个高级运维的一天

大数据运维架构

四、自动化

终极目标:跑死机器,闲死人。

1、 公司新买100台服务器,公司竟然就1个移动光驱,这装系统得到什么时候?

使用kickstart或cobbler来网络远程自动安装系统吧。

2、 每次装完机要优化很多内容,什么文件描述符、端口、软件安装啊,手动操作不累死去?

赶紧学会shell,将解放非常多的工作量。

3、系统装完后登陆要输入密码,这么多台啊?

使用expect吧,自动读取提示来输入密码,并执行命令。

4、要批量把新代码发布到线上服务器,怎么办?

使用saltstack或puppet或ansible吧,绝对爽歪歪。

五、其他

1、搭整套测试环境需要5台服务器,但公司穷的只有一台空闲服务器?

学会xen或kvm或docker吧,虚拟出多台服务器,就能解决资源问题了。特别是docker,强烈推荐,以后某个研发人员让你部署一套新环境,分分钟帮他解决。

2、研发人员的代码控制,权限控制,总要运维人员管呀?

svn或git,这个是肯定要有的。

结尾:

现在我们在回过头来思考,运维工程师平时干些啥呢?

1、 随时解决报警故障。

2、 业务程序更新。

3、 编写一些脚本,监控或完成其他可自动完成功能。

4、 运维架构完善,部署一些用起来更方便更可靠或性能更好的开源工具以及制定运维流程规范。

5、 打杂,如调交换机,装系统,部署新环境等。


“高级运维的一天” 的相关文章

CentOS 开启 NSCD 缓存服务以加快 DNS 解析速度

CentOS 开启 NSCD 缓存服务以加快 DNS 解析速度

1.安装NSCDyum install nscd2.修改配置文件。使用vi编辑器修改配置:vi /etc/nscd.conf另起一行添加:enable-cache hosts yes如图:3.启动NSCD服务service nscd start...

CCboot无盘安装Windows10笔记

CCboot无盘安装Windows10笔记

最近突发奇想,研究了一下无盘系统,也算是给自己提高了一下,研究时间历时一星期左右,学习过程中碰到了很多问题,在这里记录一下,以免忘记。本次研究的无盘系统为CCBOOT,是国外的一款无盘系统,之所以选择CCBOOT而不是常见的锐起、网维等系统。主要原因是太多的无盘系统只适合网吧使用,而CCBOOT自带...

C#读写日志文本文件

C#读写日志文本文件

日志为文本文件每列以制表符隔开 行以换行符隔开本次示例简单实现如下相关功能:1.正写日志文本 最新的日志放后面2.倒写日志文本 最新的日志放前面3.读日志文本内容显示在Label4.读日志文本内容到DataTable 及 筛选后显示在GridView--------------------(以下操作...

隐藏用户没有权限的数据库,让他只能看到自己拥有权限的数据库

隐藏用户没有权限的数据库,让他只能看到自己拥有权限的数据库

隐藏用户没有权限的数据库,让他只能看到自己拥有权限的数据库这个很多人都问的问题,可能很多都有没有得到答案希望可以帮到你:隐藏用户没有权限的数据库,让他只能看到自己拥有权限的数据库这个很多人都问的问题,可能很多都有没有得到答案首先你阅读以下ms关于VIEW ANY DATABASE...

windows自带的照片查看器打不开出错解决办法

windows自带的照片查看器打不开出错解决办法

出现windows 照片查看器无法显示此图片,因为计算机上可用内存可能不足。请关闭一些目前没有使用的程序或者释放部分硬盘空间(如果硬盘空间几乎已满),然后重试。尤其是打开从微信保存的PNG图片后,最容易出现上述情况。解决办法:打开控制面板-》颜色管理 -》高级-》设备配置文件,改为 Agf...

山东省电子税务局WIN10无法检测金税盘(税控盘)的解决办法

山东省电子税务局WIN10无法检测金税盘(税控盘)的解决办法

  部分使用WINDOWS10的朋友,访问山东省电子税务局报税(青岛除外),即使按页面要求正常安装金税盘(税控盘)的驱动,在使用证书登录时,也会提示:“打开设备--未插USBKEY(0xA7)”,配置检测页面提示:未安装或设备未插入 。无论如何重复安装驱动、调整IE配置都无法解决。  其实解决起来很...