| 岗位职责 | 1.负责超算中心集群、服务器、存储及机房基础设施的日常运维和定期巡检,包括故障定位与处理、性能分析和优化等,保障平台7×24小时稳定运行。2.熟悉高性能集群环境,熟悉linux环境,能够独立编译、安装、配置常用的应用程序。3.能够解决用户在HPC集群使用过程中遇到的各种问题,进行相关系统和程序的调试。4.参与平台架构升级、资源调度优化及性能调优,协助开发自动化运维工具。5.制定并完善运维文档(操作手册、故障处理指南等)。6.协助销售给客户进行技术交流和培训。7.撰写文档和演示文稿,提供技术资料支持。8.参与制定并执行机房相关规章制度。 | 任职资格 | 1.计算机、电子信息、自动化等相关专业优先。2.精通Linux系统管理运维,熟练使用linux常用命令,熟悉linux系统各项指标的监控和系统异常处理,具备高性能计算平台的使用与运行维护经验。3.具有较强的Shell编程、系统安装及部署能力,熟悉slurm/LSF等作业调度系统。4.持有RHCE.CCNP、HCIE等证书者优先。5.学习能力和求知欲强,工作责任感强,具备良好的服务意识以及团队沟通协作能力。具备良好的口头与书面表达能力。6.仅限高校毕业生,需符合招聘条件第三条第8点。 |