如果给你三百台服务器,你会怎么管理它们?
回答·298
最热
最新
- 看薪水多少 3K/月 上架装机 10K/月 问问需求怎么分,继续上架装机 30K/月 问:设备清单呢?什么项目?对接人是谁?应用需求,监控需求是什么?交付时间是啥时候? 50K/月 问:活给你们了,需求清楚了没?有什么资源需要我解决的?啥时候可以完工? 再高薪水不太会有服务器的 OS 访问权限
- Jumpserver堡垒机,统一管理登陆账户,以及安全,账户权限等一些操作 然后使用ansiable可以进行批量系统配置、批量软件部署、批量文件拷贝、批量运行命令 Zabbix监控服务器状态,加报警机制 ELK统计日志,分析日志
- 对物理服务器一般要先做好硬件虚拟化,构建资源池,在上层构建业务平台。这里不谈这个,只说如何运维管理 1.建立cmdb,对资产进行全生命周期管理 2.引入堡垒机,构建运维操作审计体系 3.构建针对基础设施的监控告警平台,完善问题库知识库,逐步完善基于业务的故障告警响应恢复流 4.引入自动化管理工具或开发针对业务的运维平台,提高工作效率 5.构建业务级ha和服务限流降级机制,按服务优先级配置资源,保障服务可靠可达。
- 依实际需求按需分类管理: 1.如果有用到虚拟化,可用编排工具分类进行统一管理 2.物理层面使用自动化管理工具统一标准化管理及分类管理 3.监控预警系统及日志收集系统 4.二次开发相关应用的监测及相关需求,达统一平台管理 5.依生产需求,引入CI/CD 6.自动化运维及考虑AI运维方向
- 这个问题太笼统了,排除设备选型(确认300台的硬件指标例如是否支持xxx技术-->10多年前多核和dma等不是很普及,CPU和内存,网卡的规格型号性能参数是否满足我业务需求等),采购流程和业务部门分发登账,根据我的习惯: 对300台做固定资产登记,确认好型号序列号(非常重要)以及相关的维保条款(三年?五年?厂商提供保修范围?保修内保修外?报废年限?) 300台设备是否硬件参数一致?不一致需要分别记录不同的mod号对应的CPU,内存,网卡,辅存等资源类型(xCxG? DDRx?1000/10000Mbps? 光/电口网卡? 机械/SSD/Flash? GPU?);服务器的满载电力损耗峰值是多少?有无不满足服务器工作条件的可能性(外部环境,深水/高海拔/空气温湿度等)? 对所有服务器的可利用网口进行位置编号(后续打签, link aggregation都需要),并记录mac地址(一般企业会单独购买高速网卡,我们一般很少用主板集成的网卡,因为如果网卡损坏需要更换整个主板,这就涉及到停机变更流程,特别麻烦),这点非常重要,这个是使用kickstart或者cobbler自动化安装操作系统的核心,这个整理是提供必要参数以及机房的生产,带外管理的流程网口规划(我习惯对同类型服务器同一位置的网口做同功能分配) 从后续技术方向确认如下几个情况: 这300台的所对应的环境:开测生? 这300台服务器所对应的业务是什么?业务部门之间如何分配资源?地理位置如何分配?同城/异地?灾备/双活?机房的机柜是否满足满载电力供应? 使用baremetal还是需要virtualization,还是构建类k8s的paas容器云平台?是否需要构建Devops理论的CICD流水线? 根据第3条判定应该使用何种类型的监控工具? 根据开测生环境,后续如何管理?是否需要引入堡垒机?服务器/虚拟化平台的安全加固、审计、变更管理流程等如何制定? 针对服务器分发,和业务部门之间确定不同业务的SLA等级,提供相应的服务目录。 临时想到的就这些,一个从0开始的企业构建整个IT架构的时候,都是先有一个大框架指导思想,然后不断充实内容后续再向着最好的方向去演进。
- 个人认为至少有 2 个方案,即自动化运维和不是自动化两个方向,问题太宽泛,没办法针对回答。按理想情况考虑如 300 台都是 Linux 或 300 台都是 Win 服务器情况好了。 专业方案一:K8s 容器虚拟化集群高可用管理方案,可应用于实际生产环境的方案。 管理思路 1.设定跳板机使用统一账号登录,目的便于安全和登录管理 2.使用 Puppet 或者 Ansiable 进行系统的统一调度,配置,管理。 3.应用 CMDB 管理,便于管理维护每台服务器的各种信息记录 实际部署步骤 a.基础环境搭建 系统初始化->制作 CA 证书->HA 节点部署->ETCD 集群部署->master 节点部署->node 节点部署->flannel 网络部署->插件部署 b.高可用能力验证 测试 master 自恢复和高可用->master 全宕机 不影响现存 pod->node 自恢复->node 宕机 pod 自动转移->BGP 测试 常用方案二 使用远程桌面控制,如 iis7 远程桌面管理,VNC,teamviewer,宝塔 步骤这里就不说了,说下我常用的 iis7 远程桌面管理工具的功能特点: 批量 vps 服务器管理,可以一键批量打开 n 个服务器 自定义窗口分辨率大小和几屏,分组,定时检测 可备份和恢复数据,不用手动输入历史账号密码 一键导入导出 支持免登录
- 新的挂淘宝 旧的挂咸鱼
- 我上家在公司做项目运维的 解决问题的经验能力,是被问题喂出来的 招实习生,他们对产品,技术不熟悉。然后慢慢等着敌对公司掌握你公司的,常见问题搜集。尤其是业务越来越大,终端设备近千台。 公司内部发现上层不想听问题,底层解决不了瞒着问题。就这公司还想上市敢上市,就等死吧。
- 1.这300台服务器是实体机还是虚拟机。 1.1实体机,可以通过IT综合运维平台等相关系统来监控服务器的各种cpu、内存、硬盘的使用情况,产生的警告信息可以通过邮件通知管理员。 1.2虚拟机,就方便很多了,vm为例,可以将所有的虚拟机加入数据中心,然后集群,DRS、HA都能做,这样就能实时监控虚拟机状态,运维起来也很方便。 2业务系统,要根据实际的业务需要是否做多web服务(比如niginx负载均衡) 等。 当然日常的巡检都是少不了啦。 总之,想要管理好300台服务器,并且要管理好里面运行的业务系统,要根据实际情况而定。实体机相对虚拟机难度更大。
- ansible 统一管理配置;zabbix,prometheus 进行包括底层资源上层应用的环境;堡垒机用于登陆审计;编排工具比如 docker swarm、k8s 等用于应用层的动态资源分配;有条件硬件 A10,F5 负载均衡;es 日志收集;ldap 看情况
相似问题
推荐关注
正在加载中...