作为一名系统工程师,你需要为我们的生产服务的发布和部署流程负责,确保产品发布尽可能流畅及高效。这意味着协调发布流程并在第一时间发现故障,并始终保证发布过程的可重复性和可扩展性。保障产品的在线时间及可用性是你的首要职能。
你将会与产品团队紧密合作并提供专业的基础设施支持。同时为维护我们团队的内部服务提供支持,如Github,ELK,和代理服务器(Nginx,Openresty)等,包括日常的运维工作和基于云平台(AWS,Aliyun)的生产维护工作。
- 至少四年以上在软件工程,发布工程或者配置管理相关工作经验
- 扎实的脚本语言开发能力(Shell,Python, Ruby)
- 扎实的Linux系统经验
- 熟练使用git进行版本管理
- 熟练掌握和运用监控及日志系统(Nagios,ELK,Datadog)
- 对计算机网络及常用网络协议有一定了解(TCP/IP, DHCP, TLS, DNS, HTTP)
- 熟练的英语阅读和一定的书写能力
- 公有云平台的运维经验 (AWS, Aliyun, Azure)
- 持续集成和持续部署的开发经验 (CI/CD)
- 熟练使用配置管理和自动化工具 (ansible, terraform)
- 熟练使用和掌握容器技术 (docker, kubernetes)
- 熟悉常见的Web服务器 (Nginx, Openresty, HAproxy)
- 熟悉常见的Web框架,构建工具
- 流利的英语沟通能力