专栏名称: Linux就该这么学
专注于Linux运维技术培训,让您学习的每节课都有所收获,订阅本号后可每天获得最新Linux运维行业资讯、最实用的Linux免费教程以及独家Linux考证资料,三十多万技术小伙伴的选择,Linux就该这么学!
目录
相关文章推荐
Linux爱好者  ·  AI 正在培养一代 “文盲程序员” ·  2 天前  
Linux就该这么学  ·  告别繁琐操作!Linux ... ·  2 天前  
Linux就该这么学  ·  Win11 学院:如何在 Linux ... ·  2 天前  
Linux就该这么学  ·  六年诈骗6000万美元!知名AI初创公司前C ... ·  2 天前  
Linux爱好者  ·  微信 + DeepSeek = 王炸组合 ·  3 天前  
51好读  ›  专栏  ›  Linux就该这么学

成为运维人后,也没人告诉我这些奇葩故障不按教科书来啊?

Linux就该这么学  · 公众号  · linux  · 2025-02-17 08:02

正文

来源:www.zhihu.com/question/349719609/

作为一名运维,难免会遇到各种意想不到的事件。每一次故障都可能对用户体验、公司声誉甚至收入产生重大影响。因此,运维人员不仅需要具备快速定位和解决问题的能力,还需要在日常工作中注重预防性维护和系统优化。

以下内容来自网络搜集,仅供参考。

1、 知乎好友:yages

17年在某大厂做某省电信的项目,晚上升级的时候需要删一张临时表,删错了把操作人员的信息表删了,然后 MySQL 没有回滚操作,数据库也没做备份处理。连夜跟经理讨论方案,建一个最高权限账号,让所有地市操作员重新申请账号。

还好删除的不是大表,如果是设备或客户表啥的,估计整个省所有光猫路由器需要重新注册连到系统,造成的影响不可估量 。此事过后,所有省份做了数据库每天备份的操作。

2、 知乎好友:唐唐超人

刚毕业的时候,写删除的 SQL 语句忘记写 WHERE了,当用户运行这个功能的时候,相关的所有数据都会被删除。

当时是个小公司,没测试人员,程序全靠程序猿自己测,这个功能虽然操作的是关键业务数据,但功能本身属于不太常用的,所以开发时期我也没有太注意。

去客户那上线试运行,客户是县城的电力公司,这个功能对电力公司的抄表数据进行清理,当时还是人工挨家挨户抄表,一个县城几万户电表,这个功能运行后,几万户正常的抄表数据全被删除掉了。。。

不可能叫客户重新去抄表,也不敢给公司老板说,我的部门经理连夜赶过来,逐个分析 SQL Sever 的 log 记录,花了两天一夜终于把数据全恢复了。

客户还不知道这个事,看我们这么辛苦,还给公司表扬了我们。

3、 知乎好友:Amireux

19年某省界站项目上线演示给省top2看的时候,我部署错了包导致大屏数据不一致,公司领导脸直接绿了,好在最后圆回来了,状态一直持续到演示结束都没回滚 hhh

4、 知乎好友:翊毛毛

在我的职业生涯中,曾遇到过一些令人震惊的事情,在此仅做吐槽,还望各位见谅。

案例一 、发生在某前厂的一个做某类大数据的部门。当时我担任后端开发工作,顺便负责编写统计 SQL。有一次,我意外发现负责 Hadoop 的同事在擅自修改数据(原因是某服务导致t-1数据没有被采集回来),这让我大为震惊。我私下与他沟通,强调不能这么做,必须找出问题的根源所在。虽然采集数据的服务不归我管,但经过排查,确定是由 Kafka 造成的问题。然而,这位同事就是不改,依旧我行我素。后来,我又多次发现他偷改数据。在我离职后,该服务终于挂掉,宕机长达一个月之久。主架构师都被请来了,却也没能修复好这个问题。至于后续具体是如何处理的,我也没有去打听。

案例二 、则是在涉及金钱的系统中听到的小道消息。据说某前厂的某部门,有一个程序员把金钱的尾数搞错了。这个看似小小的失误,却导致了几百万的损失。在涉及金钱的系统中,任何一个小错误都可能引发巨大的后果。程序员本应保持高度的严谨和专业精神,对每一行代码都要仔细审查,确保系统的准确性和稳定性。但这个错误的发生,让人不禁反思在开发过程中的质量控制和审核机制是否足够严格。希望大家都能从这些案例中吸取教训,在工作中保持严谨的态度,避免类似的问题再次发生。

5、知乎好友:fancyrabbit

交换机的可以强答么?不过不算奇葩,只能算惨烈。

1、CPU 占用率莫名其妙巨高,重启后能好一点,后和厂家折腾许久是奇偶校验故障,原因可能是,宇宙射线……呃……换一台

2、交换机双电,坏了一个,过保了,赶上过年。年后第一时间采购了一个新的,拿着新的站到交换机前准备开始更换的时候,另一个挂了。

6、知乎好友:小石头

游戏公司,让所有用户回档一天,幸好是个小公司。

6、知乎好友:adofei

两个服务器的网卡物理地址一样。。。





在此为大家推荐能让简历锦上添花,工作中升职加薪的的Linux课程。

Linux考证班培训价格为4999元(已含考试费)请有意参加培训的学员抓紧报名qq:5604215

RHEL 9 课程


我们的培训目标是让您学会

私塾式小班精讲!

适合对象

想要学习一般Linux使用操作技巧的IT人员

Linux系统爱好者,需要RHCSA/RHCE认证



上课方式

网络培训最大的优势即不受地点的限制,您无需再为了赶课程而坐车奔波。培训采用录播+辅导教材的形式,无需等待,今天报名后可立即开始预习。


课程大纲

( podman 容器知识会跟随课程内容讲到 )
第1课 介绍开源历史、Linux系统的种类及优势特性、Linux运维工程师的职责与前景。
了解红帽公司、红帽系统及红帽阶梯认证,安装部署VMware虚拟机、搭建RHEL9实验环境系统。
简单熟悉常用的Linux系统命令及内核原理,讲解RPM、Yum及守护进程机制理论。
第2课 学习Linux系统内核与BASH解释器的关系与作用,了解Linux系统中命令的执行及排错方法。
学习用于日常工作、系统管理、工作目录切换、文本文件管理、用户与组管理、打包压缩及文件搜索等数十个常用命令,并通过实战演练将这些命令与参数灵活搭配,让任务完成更加准确,日常的工作更加的自动化。
【Linux系统中命令是必 掌握的,内容量非常多,第2、3天请不要迟到。】
第3课 复习学习过的Linux系统命令,掌握Shell脚本原理及作用,搞清环境变量的作用。
学习如管道符、输入输出重定向、命令通配符等Shell语法规则并学习Vim编辑器。
了解Linux系统执行命令后的原理机制,学习Linux系统中各种重要的环境变量,尤其是PATH变量。
第4课 继续学习Vim编辑器中的常见命令、快捷键及三种模式的原理和切换方式并要求能够熟练使用Vim来编写文档、配置主机名、网卡信息及Yum仓库信息。复习所学的Linux系统命令,并学习SHELL脚本的编写规则与经验,学习文件测试、逻辑测试、整数值比较、字符串比较的条件测试语句,从而能够接收并处理用户的参数。
学习Linux系统中编写SHELL脚本的if(单分支、双分支、多分支)/for/while/case条件语句,学习能够实现计划任务的at命令与crond任务,从最终能够结合所学命令编写出实现自动化工作的Shell脚本。
第5课 详细的为读者讲述了用户、用户组和其余人在系统中的不同身份与能力,以及文件的读(r)写(w)执行(x)权限的作用。
为了让系统更加的安全还需要学习SUID、SGID和SBIT的文件特殊权限,文件隐藏权限以及ACL访问控制列表。
学会su命令和sudo服务后一定能够满足您以非超级用户操作实验或日常工作的需求,同时也保证了系统的安全性。
第6课 从Linux系统的存储结构引入,讲述硬盘存储结构、硬件命名规则以及内核Udev设备管理器服务,掌握系统中文件权限、学习对文件的限制操作,了解各个文件系统的特性。
让您理解文件系统的作用,能够区分ext3,ext4,xfs有何不同并学习将硬盘设备分区、格式化以及挂载等常用硬盘管理操作,完整配置SWAP交换分区、quota服务限制磁盘配额。
第7课 深入学习ln命令创建软/硬链接、管理Raid磁盘冗余阵列(0、1、5和10模式)、LVM逻辑卷管理器并能够熟练掌握创建软/硬链接的方法,学习了解VFS原理。
第8课 红帽RHEL9系统已经用firewalld服务替代了iptables服务,了解Firewalld防火墙的新特性及Zone区域概念,课程基于数十个防火墙需求学习新的防火墙管理命令firewall-cmd与图形化工具firewall-config。
了解掌握防火墙的原理、学习规则策略的配置方法、基于条件的数据包过滤规则、学习SNAT源地址转换技术及DNAT目的地址转换技术,防火墙的端口转发及负载均衡等实验,还新增了Tcp_wrappers防火墙服务,即可通过简单配置来保证系统与服务的安全。
第9课 红帽RHEL9系统将原先熟悉的守护进程替换为了systemd,用sytemctl命令替换掉了很多管理命令,课程会先了解Systemd初始化进程的作用,要求能够查看网卡状态并熟练的管理网卡参数。
学习使用nmtui命令配置网卡参数、手工将多块网卡做绑定、使用nmcli命令查看网卡信息和使用ss命令查看网络及端口状态,完整演示sshd服务配置方法并详细讲述每个参数的作用,实战基于密钥远程登陆实验以及用screen服务让远程会话不再终断。
第10课 通过对比目前热门的网站服务程序来说明Apache服务程序的优势,并新增主机空间选购技巧小节,了解SELinux服务的3种工作模式,小心谨慎的使用semanage命令和setsebool命令配置SELinux安全上下文和服务监管策略,学习Apache网站服务程序的部署方法、个人用户主页功能以及基于IP地址、主机名(域名)、端口号的虚拟主机功能。
第11课 先通过介绍文件传输协议来帮助读者理解FTP协议的用处,安装vsftpd服务程序并逐条分析服务文件的配置参数。
完整演示vsftpd服务匿名访问模式、本地用户模式及虚拟用户模式的配置方法,介绍PAM可插拔式认证模块的原理与认证流程,通过配置vsftpd服务程序,进一步的锻炼了读者SELinux服务策略、安全上下文以及防火墙的配置与排错能力。
为您讲述文件共享系统的作用,了解Samba与NFS服务程序的开发背景以及用法,详细逐条讲解Samba服务配置参数,演示安全共享文件的配置方法,并使用autofs服务程序自动挂载设备,学会后即可实现Linux系统之间或与Windows系统之间的文件共享,以及在共享文件时如何配置防火墙与SELinux策略规则,最终要求能够熟练使用Samba及NFS安全的共享文件,并学习Autofs自动挂载服务。
@本节课内容比较多,如果有 里没有听懂请一定一定要告诉我!!!
第12课 学习DNS服务程序的原理,学习正向解析与反向解析实验,掌握DNS主服务器、从服务器、缓存服务器的部署方法。
能够熟练配置区域信息文件与区域数据文件,以及通过使用分离解析技术让不同来源的用户得到更合适的解析结果。
DNS服务作为互联网的基础设施,我们还可以配置BIND服务程序支持TSIG安全加密传输机制,从而保障解析数据不被嗅探监听。
第13课 DHCP协议服务能够自动化的管理局域网内的主机IP地址,有效的提升IP地址使用率,提高配置效率,减少管理与维护成本。
学习dhcpd服务程序的使用方法并逐条讲解配置参数,完整演示自动化分配IP地址、绑定IP地址与mac地址等实验。
DHCP中继代理技术是多个物理网段共同一台DHCP服务器的最佳解决方案,运维人员必学的实用技术之一。
第14课 学习电子邮局系统的组成角色原理,了解MUA、MTA与MDA的作用理论,熟悉熟悉SMTP、POP3与IMAP4邮局协议。






请到「今天看啥」查看全文