搜索職位:
-
職位描述
-
崗位職責:
1. 負責大規模語言模型(LLM)及其他深度學習模型的在線服務部署和優化;
2. 優化模型在線推理性能,提高系統吞吐量和響應速度;
3. 參與設計和實現 python 后端部署架構,結合業務需求制定后臺高性能部署方案,提升系統的整體性能和響應速度;
4. 深入研究 python 異步編程和高并發方案,如協程、多進程和多線程等技術,運用相關知識優化算法在不同場景下的執行效率,解決并發和資源利用問題;
5. 協助開發和維護算法部署相關的工具和平臺,提高算法部署的自動化程度和效率;
6. 持續關注和評估大模型在線服務技術的最新進展,并將其應用到實際項目中;
任職要求:
1. 計算機科學、軟件工程、數學、統計學等相關專業本科及以上學歷;
2. 精通Python編程,熟練掌握Python后端開發框架(如Flask, FastAPI, Django等);
3. 深入理解Python的協程、異步編程、多進程等并發技術;
4. 熟悉高并發、分布式系統架構,熟悉Linux操作系統和容器技術(如Docker, Kubernetes);
5. 具有深度學習模型在線部署的實際經驗,熟悉TensorFlow Serving, ONNX Runtime, TorchServe等服務框架;
6. 對大模型技術有一定了解,關注行業最新進展,有大模型算法應用或部署經驗者優先考慮。
7. 有較強的學習能力和自我驅動力,能夠不斷學習和掌握新的算法和技術,適應快速變化的業務需求。
-
企業介紹
-
工作地址
-
上海