分享好友 资讯首页 资讯分类 切换频道
百度大模型算法工程师二面:我的亲身经历分享!
2024-12-25 08:34  浏览:75

应聘岗位:百度大模型算法工程师

面试轮数:第二轮

整体面试感觉:偏简单

1. 自我介绍

在自我介绍环节,我清晰地阐述了个人基本信息、教育背景、工作经历和技能特长,展示了自信和沟通能力。

2. Leetcode 题

具体题意记不清了,但是类似 【208. 实现 Trie (前缀树)】

  • 题目内容

Trie(发音类似 “try”)或者说 前缀树 是一种树形数据结构,用于高效地存储和检索字符串数据集中的键。这一数据结构有相当多的应用情景,例如自动补完和拼写检查。

  • 请你实现 Trie 类

    • Trie() 初始化前缀树对象。
    • void insert(String word) 向前缀树中插入字符串 word 。
    • boolean search(String word) 如果字符串 word 在前缀树中,返回 true(即,在检索之前已经插入;否则,返回 false 。
    • boolean startsWith(String prefix) 如果之前已经插入的字符串 word 的前缀之一为 prefix ,返回 true ;否则,返回 false 。
  • 示例

 
  • 提示

    • 1 <= word.length, prefix.length <= 2000
    • word 和 prefix 仅由小写英文字母组成
    • insert、search 和 startsWith 调用次数 总计 不超过 3 * 104 次
  • 题目解答

 

3. 技术问题回答

3.1 结合 GNN 科研项目进行提问
  1. 样本构建的流程是怎样的,并且为什么 GCN 相较于其他方法在效果上更胜一筹
  2. 节点特征指的是什么
3.2 结合 基于 RAG 的医学问答项目进行提问
  1. 查询流程
  2. 使用什么向量数据库
  3. 介绍一下 RAG 原理
  4. RAG 如何解决多实体提问问题
 
3.3 结合多模态科研项目进行提问
  1. Prompt是如何生成的,优化目标是什么,任务是什么
  2. OCR 抽取效果不好,需要怎么排查问题
3.4 技术问题
  1. 您是否使用过Pytorch提供的预训练模型,例如torchvision、transformers以及OpenAI开源的ClIP?对分布式训练有经验么

回答:学过但是没用过

  1. RNN与GNN之间有哪些区别,以及它们各自适用于哪些场景

回答

 
  1. GPT和BERT在文本表征方面有哪些结构和工作原理上的差异

回答:BERT是Transformer Encoder,属于自监督训练方式,然后两大预训练任务,主要用于下游任务抽特征,GPT是Decoder,自回归训练,主要是预测下一个词的分布,依赖大语料库,GPT-3可以表现出Few-shot/zero-shot learning

  1. 因为说了BERT好训练一些,问了为什么?

回答:说了GPT任务对简单、比较依赖语料库的大小,BERT的MLM比较直觉且个人能训练,GPT只有openai等公司有成品

  1. 说一说你对 Zero-shot和Few-shot的理解

回答:Few-shot先给定任务范式描述,Zero-shot就是直接做

  1. 怎么看待计算机网络和操作系统在DL中的作用

回答:谈了DL研究一些计算机网路的问题,比如网络拓扑、交换机拓扑等,分布式训练时会有通信,也会用到进程相关知识

  1. 你来调优一个BERT模型适应一个数据集或任务会怎么做

回答:固定BERT,训练分类头或者使用Adapter

百度大模型算法工程师二面:我的亲身经历分享!

  1. 训练完模型后准确率很低,怎么优化

回答:首先检查代码结构和分类器的网络结构和BERT量级是否匹配,学习率+余弦退火调整,改为Adapter,检查数据集质量,验证阶段代码是否有误

  1. 有一批文本数据,来源和质量不太一样,使用时如何处理

回答:反问文本来源不同是否混合或完全分开,结合多模态融合的技术,增加一个学习任务,对不同来源的文本表示进行线性变换投影到相同的特征空间中

百度的面试篇项目面一点,整体效果还行,面试官给人感觉比较温和。

现在社会上大模型越来越普及了,已经有很多人都想往这里面扎,但是却找不到适合的方法去学习。

作为一名资深码农,初入大模型时也吃了很多亏,踩了无数坑。现在我想把我的经验和知识分享给你们,帮助你们学习AI大模型,能够解决你们学习中的困难。

一、AGI大模型系统学习路线

很多人学习大模型的时候没有方向,东学一点西学一点,像只无头苍蝇乱撞,我下面分享的这个学习路线希望能够帮助到你们学习AI大模型。

二、AI大模型视频教程

三、AI大模型各大学习书籍

四、AI大模型各大场景实战案例

五、结束语

学习AI大模型是当前科技发展的趋势,它不仅能够为我们提供更多的机会和挑战,还能够让我们更好地理解和应用人工智能技术。通过学习AI大模型,我们可以深入了解深度学习、神经网络等核心概念,并将其应用于自然语言处理、计算机视觉、语音识别等领域。同时,掌握AI大模型还能够为我们的职业发展增添竞争力,成为未来技术领域的领导者。

再者,学习AI大模型也能为我们自己创造更多的价值,提供更多的岗位以及副业创收,让自己的生活更上一层楼。

    以上就是本篇文章【百度大模型算法工程师二面:我的亲身经历分享!】的全部内容了,欢迎阅览 ! 文章地址:http://w.yusign.com/news/3851.html 
     资讯      企业新闻      行情      企业黄页      同类资讯      首页      网站地图      返回首页 述古往 http://w.yusign.com/mobile/ , 查看更多   
最新新闻
阳光分期全国客服电话-助力客户高效解决问题
阳光分期全国客服电话;(00861-38960-86246)—解决客户问题:{00861-57307-87089}—用户至上,用心服务。热线容易占线;请您多拨几
好借优品全国客服电话-助力客户高效解决问题
好借优品全国客服电话;(00861-38960-86246)—解决客户问题:{00861-57307-87089}—用户至上,用心服务。热线容易占线;请您多拨几
小白易购全国客服电话-助力客户高效解决问题
小白易购全国客服电话;(00861-38960-86246)—解决客户问题:{00861-57307-87089}—用户至上,用心服务。热线容易占线;请您多拨几
美兴小额贷款全国客服电话-助力客户高效解决问题
美兴小额贷款全国客服电话;(00861-38960-86246)—解决客户问题:{00861-57307-87089}—用户至上,用心服务。热线容易占线;请您多
爱施德网络小额贷款全国客服电话-助力客户高效解决问题
爱施德网络小额贷款全国客服电话;(00861-38960-86246)—解决客户问题:{00861-57307-87089}—用户至上,用心服务。热线容易占线;
拍拍分期全国客服电话-助力客户高效解决问题
拍拍分期全国客服电话;(00861-38960-86246)—解决客户问题:{00861-57307-87089}—用户至上,用心服务。热线容易占线;请您多拨几
天天分期全国客服电话-助力客户高效解决问题
天天分期全国客服电话;(00861-38960-86246)—解决客户问题:{00861-57307-87089}—用户至上,用心服务。热线容易占线;请您多拨几
中邮消费金融全国客服电话-助力客户高效解决问题
中邮消费金融全国客服电话;(00861-38960-86246)—解决客户问题:{00861-57307-87089}—用户至上,用心服务。热线容易占线;请您多
招联消费金融全国客服电话-助力客户高效解决问题
招联消费金融全国客服电话;(00861-38960-86246)—解决客户问题:{00861-57307-87089}—用户至上,用心服务。热线容易占线;请您多
铁路12306全国人工客服电话-助力客户高效解决问题
铁路12306全国人工客服电话;(00861-38960-86246)—解决客户问题:{00861-57307-87089}—用户至上,用心服务。热线容易占线;请您