搜索職位:
-
職位描述
-
1、負責線上環境的配置,維護,監控,調優,和故障排除。
2、保障業務7*24小時的持續運作能力,優化站點性能與可用性。
3、負責Kubernetes和大數據集群的日常運維,部署升級,和性能優化等。
4、推動云原生容器化,再離線業務混部在大數據和AI訓練推理環境的落地。
任職資格
1、計算機相關專業本科以上學歷,5年以上大規模系統運營管理經驗。
2、熟悉Linux系統原理、了解內核機制和性能優化,熟悉TCP/IP、HTTP協議原理。
3、熟悉Golang、Python等至少一門編程語言。
4、熟悉虛擬化和容器技術,有Kubernetes生產系統的開發和維護經驗。
5、有Operator研發部署經驗,熟悉容器調度,有大數據/GPU訓練推理集群運營經驗優先。
6、熟悉公有云,KVM,分布式存儲,SDN網絡等虛擬化相關技術。
7、有較強的系統問題分析經驗和能力,能夠解決復雜的系統問題。
-
企業介紹
-
工作地址
-
上海