搜索職位:
-
職位描述
-
1、負責通用認知大模型和多模態大模型(包括十億、百億、千億等參數量)的設計、開發和優化,包括但不限于預訓練、SFT、指令微調、RLHF、Prompt工程、模型評估、模型推理等。
2、緊跟業界多模態大模型等方向的進展,探索前沿技術,探索前沿技術,形成系統算法/大模型解決方案,指導算法團隊研發落地工作,參與核心認知/多模態大模型的產品開發(包含但不限于智能客服、智慧營銷等),推動認知/多模態大模型效果達到行業前沿,包括智能問答、圖文內容生成等。
3、積極探索大語言模型技術在落地場景中的應用,包括但不限于大模型RAG、大模型BI、Multi-Agent智能體應用等內容。
1、認知/多模態大模型理解/生成、機器學習/深度學習等計算機相關專業獲得碩士學位,博士優先,發表過大模型相關研究AI定會論文優先;
2、對大模型和生成式AI有濃厚興趣,對主流模型的原理與應用具有深入了解;
3、精通CNN,RNN,Transformer,Bert,ViT等深度學習理論算法和優化;
4、對認知/多模態大模型訓練等有深入理解和實踐,有多機多卡大模型訓練、大模型微調、從0到1構建多模態大模型(百億參數以上)等經驗者優先;
5、精通一種或多種編程語言,如Python,C語言等,熟練掌握主流深度學習框架、Python,Tensorflow等;
6、具備較強的團隊寫作能力和溝通能力,有較強的學習能力和業務分析及問題解決能力。
-
企業介紹
-
工作地址
-
北京