应聘岗位:百度大模型算法工程师
面试轮数:第二轮
整体面试感觉:偏简单
1. 自我介绍
在自我介绍环节,我清晰地阐述了个人基本信息、教育背景、工作经历和技能特长,展示了自信和沟通能力。
2. Leetcode 题
具体题意记不清了,但是类似 【208. 实现 Trie (前缀树)】
- 题目内容
Trie(发音类似 “try”)或者说 前缀树 是一种树形数据结构,用于高效地存储和检索字符串数据集中的键。这一数据结构有相当多的应用情景,例如自动补完和拼写检查。
-
请你实现 Trie 类:
-
- Trie() 初始化前缀树对象。
- void insert(String word) 向前缀树中插入字符串 word 。
- boolean search(String word) 如果字符串 word 在前缀树中,返回 true(即,在检索之前已经插入);否则,返回 false 。
- boolean startsWith(String prefix) 如果之前已经插入的字符串 word 的前缀之一为 prefix ,返回 true ;否则,返回 false 。
-
示例:
-
提示:
-
- 1 <= word.length, prefix.length <= 2000
- word 和 prefix 仅由小写英文字母组成
- insert、search 和 startsWith 调用次数 总计 不超过 3 * 104 次
-
题目解答
3. 技术问题回答
3.1 结合 GNN 科研项目进行提问
- 样本构建的流程是怎样的,并且为什么 GCN 相较于其他方法在效果上更胜一筹?
- 节点特征指的是什么?
3.2 结合 基于 RAG 的医学问答项目进行提问
- 查询流程?
- 使用什么向量数据库?
- 介绍一下 RAG 原理?
- RAG 如何解决多实体提问问题?
3.3 结合多模态科研项目进行提问
- Prompt是如何生成的,优化目标是什么,任务是什么?
- OCR 抽取效果不好,需要怎么排查问题?
3.4 技术问题
- 您是否使用过Pytorch提供的预训练模型,例如torchvision、transformers以及OpenAI开源的ClIP?对分布式训练有经验么?
回答:学过但是没用过
- RNN与GNN之间有哪些区别,以及它们各自适用于哪些场景?
回答:
- GPT和BERT在文本表征方面有哪些结构和工作原理上的差异?
回答:BERT是Transformer Encoder,属于自监督训练方式,然后两大预训练任务,主要用于下游任务抽特征,GPT是Decoder,自回归训练,主要是预测下一个词的分布,依赖大语料库,GPT-3可以表现出Few-shot/zero-shot learning
- 因为说了BERT好训练一些,问了为什么?
回答:说了GPT任务对简单、比较依赖语料库的大小,BERT的MLM比较直觉且个人能训练,GPT只有openai等公司有成品
- 说一说你对 Zero-shot和Few-shot的理解
回答:Few-shot先给定任务范式描述,Zero-shot就是直接做
- 怎么看待计算机网络和操作系统在DL中的作用
回答:谈了DL研究一些计算机网路的问题,比如网络拓扑、交换机拓扑等,分布式训练时会有通信,也会用到进程相关知识
- 你来调优一个BERT模型适应一个数据集或任务会怎么做
回答:固定BERT,训练分类头或者使用Adapter
- 训练完模型后准确率很低,怎么优化
回答:首先检查代码结构和分类器的网络结构和BERT量级是否匹配,学习率+余弦退火调整,改为Adapter,检查数据集质量,验证阶段代码是否有误
- 有一批文本数据,来源和质量不太一样,使用时如何处理
回答:反问文本来源不同是否混合或完全分开,结合多模态融合的技术,增加一个学习任务,对不同来源的文本表示进行线性变换投影到相同的特征空间中
百度的面试篇项目面一点,整体效果还行,面试官给人感觉比较温和。
现在社会上大模型越来越普及了,已经有很多人都想往这里面扎,但是却找不到适合的方法去学习。
作为一名资深码农,初入大模型时也吃了很多亏,踩了无数坑。现在我想把我的经验和知识分享给你们,帮助你们学习AI大模型,能够解决你们学习中的困难。
一、AGI大模型系统学习路线
很多人学习大模型的时候没有方向,东学一点西学一点,像只无头苍蝇乱撞,我下面分享的这个学习路线希望能够帮助到你们学习AI大模型。
二、AI大模型视频教程
三、AI大模型各大学习书籍
四、AI大模型各大场景实战案例
五、结束语
学习AI大模型是当前科技发展的趋势,它不仅能够为我们提供更多的机会和挑战,还能够让我们更好地理解和应用人工智能技术。通过学习AI大模型,我们可以深入了解深度学习、神经网络等核心概念,并将其应用于自然语言处理、计算机视觉、语音识别等领域。同时,掌握AI大模型还能够为我们的职业发展增添竞争力,成为未来技术领域的领导者。
再者,学习AI大模型也能为我们自己创造更多的价值,提供更多的岗位以及副业创收,让自己的生活更上一层楼。