面了美团大模型算法岗，被疯狂拷打。。。_算法岗面试项目拷打-CSDN博客

本文链接：https://blog.csdn.net/m0_59596990/article/details/145739824

最近这一两周不少公司已开启春招。

不同以往的是，当前职场环境已不再是那个双向奔赴时代了。求职者在变多，HC 在变少，岗位要求还更高了。

最近，我们又陆续整理了很多大厂的面试题，帮助一些球友解惑答疑，分享技术面试中的那些弯弯绕绕。

总结如下：

《大模型面试宝典》(2025版) 发布！

喜欢本文记得收藏、关注、点赞

大家好，最近面了美团大模型算法岗(日常实习)，bg一般，之前有一段还可以的实习。

面试官挺好的，让人觉得体验感非常好。面试题都能说一点，但是感觉语言表达能力稀烂，感觉凉了。

面试题分享，欢迎交流学习

面试题

请阐述您的研究方向（简历中未提及），如果研究方向为 AI4science，能否介绍一下如何通过对比学习实现多模态对齐，以及涉及的数据形式。
详细介绍您第一个项目的流程。
在项目中运用 RAG 时，遇到了哪些难题？
相较于微调，选择 RAG 的原因是什么？RAG 具有哪些优势，例如在应对灾难性遗忘、知识更新以及幻觉问题方面（此处可结合自身理解详细说明幻觉相关内容）？
项目中涉及 query 改写的模型训练，请问进行 query 改写的目的是什么？query 改写数据集的具体构成是怎样的？多轮对话的数据集流程是怎样的，如何判断是否需要通过多轮对话引导用户进一步描述问题？
对于 sft 数据集，您有哪些避免灾难性遗忘的处理方法？
我们的业务场景并不需要对 embedding 模型进行微调，而您的项目进行了微调，请问原因是什么？
请介绍 DPO，先介绍一下 PPO，然后探讨 reference 模型和 actor 模型是否可以为同一个模型。
reference 模型在相关任务中起到什么作用？
deepseek r1 采用 GRPO 的原因是什么？
请详细介绍 deepseek r1 的 GRPO。
为什么 GRPO 不需要 critic？
deepseek r1 进行冷启动的目的和原因是什么？
GRPO 去除了 critic，那么其奖励是如何计算的？
PRM 和 ORM 各自的优势是什么？分别适用于哪些场景？在 kimi k1.5、deepseek r1 和 rstar math 等相关场景下，PRM 是否真的不适用？
PRM 落地的核心要点是什么？
您对本次面试有什么疑问？