搜索職位:
-
職位描述
-
崗位職責:
一、模型預訓練:
負責大語言模型的預訓練工作,包括數據準備、模型架構設計和優化。
設計和實施大規模數據集的預處理和清洗流程,確保訓練數據的質量和多樣性。
優化和調整模型超參數,提高預訓練模型的效率和效果。
二、技術研發:
研究并應用最新的預訓練技術和方法,提升模型的性能。
開發和測試新的模型架構,探索創新的預訓練技術。
結合業務需求,提出解決方案并落地實施。
三、團隊合作:
與數據科學家、機器學習工程師和產品團隊緊密合作,確保模型的實用性和可應用性。
支持和指導團隊成員,分享技術經驗和最佳實踐。
四、性能評估與優化:
設計和執行模型評估實驗,分析實驗結果,改進模型表現。
持續跟蹤和優化模型性能,解決在應用過程中遇到的問題。
任職要求:
一、教育背景:
計算機科學、人工智能、數據科學或相關領域的博士學位。
二、工作經驗:
3年以上大型語言模型預訓練經驗,熟悉主流預訓練技術和工具。
具備大規模分布式計算的實際操作經驗,能夠處理大數據集。
三、技能要求:
精通Python,熟悉TensorFlow、PyTorch等深度學習框架。
具備優秀的算法設計和編程能力,能夠編寫高效、可靠的代碼。
熟悉NLP(自然語言處理)領域的前沿研究和應用,包括BERT、GPT、Transformer等模型。
四、綜合能力:
具備良好的團隊合作精神和溝通能力,能夠與跨職能團隊有效協作。
具有創新精神,能夠獨立思考和解決復雜問題。
關注細節,具備優秀的分析能力和數據敏感度。
-
企業介紹
-
工作地址
-
上海