保障业务系统长期稳定运行
毕竟业务系统要是出现一点差错,用户就要投诉,所以运维工程师最核心的工作就是保证业务系统能够稳定运行。
首先要知道业务跑在什么上,一般来说网站服务器都是nginx、apache等,依赖mysql数据库进行数据储存,依靠PHP进行解析,所以运维工程师必须掌握LNMP、LAMP等环境部署的知识。
保障数据安全可靠
数据安全是公司领导最看重的部分,运维工程师也要保证数据的安全性和可靠性,要是出了一点点错误,领导就要找运维喝茶了。
有时候需要手动改数据库的内容,就要学会掌握mysql数据库的增删查改知识;
有时候需要应对数据库的服务器硬件坏了,就需要Mysql主从复制以备不时之需;
有时候需要还原数据库,就需要学会mysql增量备份和恢复,以还原到指定的时间点;
有时候定时备份还不够,就需要使用rsync+inotify来实时备份;
有时候为了增加服务器安全性,就要通过iptables来控制公司的IP或者跳板机IP访问权限;
构建监控报警体系
运维工程师常用的是zabbix、nagios来进行报警监控,如果没有监控运维就是瞎子,所以要先构建报警监控体系,此后就要解决系统故障。
一般来说,常见的故障有应用故障、数据库故障、网线故障等等,有的是软件故障,有时候是硬件故障,而一个有经验的运维工程师能在第一时间定位故障原因。
技术与业务问题处理
这里有两个核心的问题,分别是技术问题和业务问题,技术问题主要需要网络抓包分析、tcpdump抓包分析和代理机制等等内容;
而业务问题就比技术要复杂一些了,比如业务层面的数据分析,不光要统计出业务的各种指标数据,还要对数据进行分析解剖,找出业务问题的所在。
版本测试与上线
这也是运维工程师的常见工作内容,负责版本的测试与上线,开发人员发布版本之前,运维工程师需要进行性能和功能测试;此外在版本上线的时候,最好也在晚间业务量较小的时候上线,可以避免上线压力过大。
蜂巢工厂国内首个行业级工业iPaaS集成平台装备制造行业一站式数字化工厂集成解决方案针对装备制造行业的工业实践与特征,应用工业数据采集技术、云端互联应用、微服务平台化技术,帮助行业内制造企业实现全业务系统、全生产要素、全价值链的一站式数字化工厂解决方案。蜂巢工厂致力于打造一个装备制造行业数据实现、数据汇聚、数据分析、数据应用、数据赋能的数字化工厂集成应用平台,从企业的销售订单、研发设计、计划统筹、生产制造、设备智能化、供应链协同、售后服务等全业务场景的微服务应用,用户可以按需订购、快速集成。发现更多精彩