招银面经问题准备

本文深入探讨了机器学习中的关键算法,如XGBoost、随机森林、GBDT等,对比了它们的优缺点,并讲解了防止过拟合的方法。同时,文章还介绍了Linux系统指令、数据结构如二叉平衡树,以及排序算法如快速排序和堆排序的实现与优化,为读者提供了全面的技术视角。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

  • l1 l2正则化和区别

  • XGBoost和提升树

  • 二叉平衡树是什么样的

  • linux指令 & && | || 重定向 > >>

  • 写快排和堆排,然后比较

  • 怎么防止过拟合

  • L1和L2正则

  • ID3树用什么指标选择特征

  • Bagging和boosting的区别

  • Top k用什么排序算法?数据量很大怎么优化?堆排序,分而治之再加上堆排序在合并求top k

  • lr和svm,比较优缺点

  • 讲讲随机森林的原理?主要是随机属性引入加集成。

  • Linux 复制命令是什么?查询帮助用什么命令?cp --help

  • 给你两个有序数组,合并排序一下?我说用Python直接合并排序下就是。。他就问你不会底层语言写对吧,我说不会。。其实后来我想了下我会写。。直接头部一个个判断添加到新的数组就行。。

  • xgboost和gbdt区别?一个利用牛顿法二阶导数信息,正则项加上了树的复杂度,缺失值样本不同权重处理?一个一阶导啥的。

  • 随机森林和gbdt谁主要降低偏差和方差?gbdt,随机森林。

  • 问二分查找的实现原理

  • 用两个栈模拟队列的出对入队

  • 问梯度下降算法与牛顿算法的优缺点

  • 问BP的过程,然后链式求导怎么做

  • 问SVM与贝叶斯的优缺点

  • 问KNN如何解决数据维度问题(不会)

  • SVM如何防止过拟合

  • rf和xgboost,比较优缺点

  • TCP3次握手

首先是知识图谱构建,我的简历里写了命名实体识别和关系抽取
面试官没细问,问我知识三元组是如何标注的,我就解释了一下,然后问我搭建什么模型,我就说已经有很多成熟的模型可以用了,当我提到LSTM和CRF
我说命名实体识别的模型是我老大建的,我负责使用及改进,基于远程监督的关系抽取模型是我建的,就问了我原理,

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值