面试

  • 得物一:
    • 线上线下不一致(指的是指标不一致,离线涨线下不涨):
      • 训练时候:指标根本没有对齐线上,例如离线指标看的auc,实际上GAUC涨了才有收益;训练目标也和线上不一致,线上评估一个月的,线下转化标签只有24h的。长期转化看不到;训练标签就有问题,关联上或者标签是有问题的等的。
      • ab阶段:流量分配不均匀,aa就有问题;其他ab实验叠加导致有问题。
      • 推理阶段:
        1. 评估样本不一样,例如离线只评估曝光样本,线上可能会评估其他样本,导致其他样本曝光,以及数据采样策略的问题 离线训练样本的分布和线上不一样,线上可能新用户占比比较高
        2. 特征不一样:训练时候能拿到线上拿不到的标签和特征;工程漏填错填特征了
        3. 模型不一样:线上加载的模型有问题,Embedding没有加载上;dropout等设置有问题;batchnorm没有加载上
        4. 下游问题:q打分分布不一样了,导致后续重排逻辑出问题了
        5. 其他线上问题:耗时涨了很多,导致收益没了。
    • dead relu的原因并且如何恢复?如何避免?
      • 成因:
        • 学习率太高,一次更新就将b/w推的太负了
        • 初始化有问题:
          • relu会将方差减半,导致到后面方差越来越小,会被b主导
          • 方差过大:会导致输出过大,后续梯度很大,直接使b一下更新到很负的负数
          • 解决:初始化需要将var乘以2
        • 不小心对b也进行了权重衰减。以及b为0初始化
          • 解决:初始化大一点
        • 输入偏移了,导致在负半区
        • 深网络导致最后能是上游更新的通路很少了,每次有一半都没法更新的;并且会使层间的输出偏移,之后变得更快负。
          • resnet并且batchnorm
        • 并且类别不均衡
      • 拯救:
        • 立马降低学习率
        • 立马换损失函数
        • 重新初始化
        • 输入分布换一下
  • 连尚
    • 多语言特征在特征空间如何对齐:
  • shein:
    • 延迟转化建模
      • 首先是预估分布
    • 最新的推荐系统的方向:
      • 长序列建模
      • 大模型如何融合
    • 召回如何做样本
    • 召回如何debias
    • 重排模型
    • 有什么多模态的模型
  • shopee
    • 大模型/多模态如何输入到模型当中
    • 长序列怎么做/介绍一下sim其他长序列的方法
    • simhash怎么做
  • 召回怎么做样本:
    • 召回的中部和尾部可以做负样本
    • 同类目下可以随机采样 作为hard负样本
    • 聚类后,同一类目下做负采样
  • 多场景建模:
    • star 和大模型微调一样的,但是star是乘一个新的矩阵
  • 多目标怎么做
  • transformer结构
  • self attention 改进
    • 多头注意力
  • 怎么从零搭建推荐系统
  • 加了点赞目标后留存掉了如何分析
  • 各种结构都加过之后如何继续提升精排效果。
  • debias 如何做。
    • 最好的debias的方式
Written on September 15, 2025