岗位描述
1、负责客服、销售、收派、运营、办公职能等业务板块大语言模型的应用落地,支持业务目标提升;
2、负责垂域大语言模型的继续预训练、SFT、RLHF等工作,积极跟进AIGC业内应用趋势,包括但不限于MoE、Long Context、RAG、Agent、O1等方向;
3、面向集团各类业务场景,沉淀共性能力,实现大模型技术的标准化与产品化;
任职要求
1、硕士以上学历,5年以上工作经验;
2、熟练使用C++/Java/Python,熟悉Pytorch框架;
3、熟悉自然语言处理相关理论,熟悉Transformer/BERT/GPT等基础模型结构,熟悉大模型的微调和评估方法;
4、具有大模型训练及应用开发经验,如语料清洗、预训练、指令微调、强化学习、内容安全等;熟悉megatron,deepspeed,vllm等训练或推理加速框架;
5、具备优秀的沟通能力,学习能力,有强烈的上进心和主动性;
6、在NLP顶级会议上有论文发表者优先,参与过有影响力的开源项目开发者优先。