来源:投稿 作者:LSC
编辑:学姐
wxg部门,根据简历发问,问的比较泛。
unset
unset
一面:2小时
unset
unset
1.讲述原理和手写python代码: 多头注意力机制
2.c++代码: 考察树的前序遍历、层次序遍历
3.tranaformer注意力的计算为什么要除以sqrt(k)?
4.cv的transformer和nlp的有什么区别?
5.什么是abtest?
6.介绍假设检验。原假设什么情况下成立?
7.小目标检测的方法有哪些?
8.介绍maskrcnn 的 roi
9.大模型的微调方法
10.给大模型输入超长文本怎么办?
11.介绍rag
12.介绍虚函数和纯虚函数
unset
unset
二面:1小时
unset
unset
1.大模型词表大小是v,初始化训练的大模型loss期望值是多少?
2.介绍 fp16 和 fp32
3.fp16 产生梯度爆炸怎么🧍解决?
4.QLoRA 是什么原理?
5.大模型的perplexity是什么?如何降低这个指标?
6.用代码实现 perplexity 的计算
7.假设检验
8.显著性水平的含义
9.python 字典的重建方式
10.python的全局锁
11.python 的装饰器
12.推荐的向量召回有哪些方法?
13.u2i的样本数据怎么采集?
关注“
学姐带你玩AI
”公众号,
回复“
简历
”
领取算法工程师万能简历公式+模板