算法
- 排序相关
- 堆排序的过程
- 如何对 10 亿个词语进行排序,找出其中使用频率最高的100 个
- 快排 *5
- 一千万个整数,每个数的范围在[-1000,1000],怎样对他们排序最快:计数排序
- 选择排序和插入排序的算法
- 冒泡排序 *2
- 单链表的冒泡排序
- 链表相关
- 两排序链表合并
- 链表的构建,增删改查的各种情况分析,倒置链表操作
- 判断两个链表是否有交点/判断单链表是否是循环链表 *4
- 单向链表,把它后半部分反转。
- 删除链表中第n个节点*2
- 链表,原址变换为:奇数在前,偶数在后,相对顺序不变。
- 链表求和(反过来的)
- 树相关
- 翻转二叉树
- trim二叉搜索树
- 中序遍历
- 层次打印二叉树:用两个队列
- 二叉树之字形层次遍历,(正反正反。。。)
- 给一棵边权树树找到最大路径,要找到两个端点怎么办
- 给N个数字,返回这N个数字能组成的所有二叉搜索树
- 树的完全遍历(null也要输出)
- 二叉树前序遍历
- 非递归形式求树的深度
- 搜索二叉树求两个节点的公共子节点
- 寻找二叉树两个节点的最近祖先节点
- 判断镜像树
- 二叉搜索树删除某个节点
- 二叉树深度
- 判断平衡二叉树
- 平衡二叉树是什么
- 打印二叉树每层最右边结点值
- 由于b树引导了b+树和索引的问题,他不问我的长项b+和索引的原理,他问我怎么用
- 二叉树的广度优先遍历和深度优先遍历。
- 根据前序,中序创建二叉树。
- 字符串相关
- 浮点数转字符串
- 计算字符串形式的算式的值,例如1+2*3-4这种。
- 字符串反转
- 给一个字符串和单词列表,判断字符串能不能由这些单词组成
- 有一些字符串,定义前后字符差值形成的序列一致的两个字符串为相同字符串,问如何将给定的这些字符串分成若干集合,每个集合中字符串都满足相同字符串的定义。
- kmp * 3
- 覆盖字符串所有字符的最小子串
- 模拟大数相加
- 找出所有的回文子串
- 字符串出现第k多的字符
- 实现memcpy
- 大数原地相乘,32位位宽乘两个32位的大数
- 给你个字符串,字符串是个数字,怎么转换为int型,不用库函数的话
- 写一个 strcpy 函数
- DP:
- 0-25表示A-Z,给一个数字字符串,求有多少种解码方式
- 找出0-1矩阵里,全1组成的最大矩形面积
- 最大连续子数组的长度
- 编辑距离
- 最长公共子序列
- 求最大子串和 *5
- 求最大公共子串
- 给一个数组表示每天的股价,某人又一次买入,一次出手的机会,问这个人的最大收益是多少 *3
- 0-1背包问题的动态规划递归式怎么写?
- 有一个n乘n的棋盘,上面有m个糖果,最开始有一个人在棋盘左上角,他可以向左向右或者向下移动,但不能向上移动,问他最少需要多少步吃完所有糖果。
- 跳台阶问题,每次只能跳1个台阶或者2个台阶,n个台阶共有多少种方式*3
- 三种砖块,分别是1 * 1,1 * 2,1 * 3,拼成1 * N,有多少种拼法?
- 三角数堆,只能往左下或者右下走,从堆顶到堆底和最小是多少。
- 有三种砖块,长度分别为1,2,3,砖块高度都为1,现在要你砌一面M*N的墙,不考虑把砖块竖着放的情况,问有多少种砌法。(DP可解) 然后接着问:如果要求这面墙除了两边外,中间任何一个位置砖的边缘都不能构成一条从墙顶到地面的直线,那么有多少种砌法?(DP+容斥原理)
- 就是给一个字符串,得到它字典序最大的子序列。(他的表述方式是,删除一些字符,使得剩下的字符构成的字符串字典序是最大的)
- 完全平方数,给一个数x,求最小的a能使x和a的乘积是完全平方数
- 图论相关:
- 手写dijstra *2
- 最短路(bfs)
- 给定二维矩阵,求联通域
- 最小生成树
- Prim
- Kruskal
- 数组相关
- 2个无序数组各取一个数加和为N,求数对个数
- 将两个数组合并为一个无重复数字的数组
- 只有0和1的数组,每次可以删相同并且相邻的, 删除两次最多可以删除多少个
- 两个有序数组的合并
- 有一个从大到小排序的数组,改成一个按照绝对值的大小从大到小排序的数组。
- 将一串从小到大的数字,任意轮转,如1,3,4,5,7,8,23,轮转为5,7,8,23,1,3,4,
- 旋转数组
- 翻转列表前k个
- 找出数组中只出现1次的数,其余数均出现2次,扩展,其余数出现2次以上
- 实现给定一个列表,把列表所有0移到列表最后面,其余相对顺序不变,要求时间o(n),空间o(1)
- 把数组元素更新为除该元素外其他所有元素的乘积,返回新数组,不能用除法,不要用O(n^2)的方法
- 一个无序的无重复的正数数组,给一个target ,找出数组中和为target的序列,每个数可以选择多次
- two sum: 有一个无序数组,找出所有加和为sum的数值对
- 查找相关
- binary search 一个排序数组,切开重新拼接,如 [6, 7, 8, 1, 2,3],查找元素
- 将一串从小到大的数字,给定一个数字,查找是否在该列表中,给定位置or输出错误。
- 一个数组中找前k个大的数 *4
- 有一个数组,找出有一个数字是不是在这个数组中(对数组大小进行讨论,分析时间和空间复杂度)
- 哈希相关
- 要实现一个哈希表,应该怎么做(根据要哈希的内容选择合适的哈希函数和冲突解决方案,比如balabala…)
- hash表怎么解决冲突 *2
- 哈希冲突是什么
- Hashmap怎么实现的?HashTable怎么做到同步的?缺点?怎么解决?
- 有一次旅程用一个二维list存着,【(北京,上海)(上海,广州)(广州,东京)…】,这个旅程是一个没有环路的,然后现在打乱这个list的顺序,最后输出一个【北京,上海,广州,东京,…】这样的一个list
- 一堆二维点,求在一条直线上的最大数目。(leetcode)
- 一个0~1e18范围内的整数,可以交换k(0<=k<=100)次,每次只能交换相邻位置的数字。问能得到的最大数字是多少?
- 中缀表达式变后缀
- 大顶堆怎么插入删除
- 一维数轴上有N个数散布在数轴,给一个长度为L的绳子,问绳子放在轴上最多能覆盖多少个点
- 一个二维矩阵,0是路,1是墙,问矩阵中有没有被墙围起来的路
- 有一些单词对表示同义词,单词对之间不考虑传递性,判断两个句子是否表示完全相同的意思?map套map解决,写了第一个解法。
- 两个300G的大文件,求两个文件的交集
- 图解哈夫曼编码
- 给出m个会议的开始时间和结束时间,求最少需要多少间会议室
- 全排列*4
- 有10个排好序的数据库,那么我要找整个的中位数,怎么找
- 实现sqrt函数,不能使用二分法/可以使用二分法 *4
- 给定一个圆形区域(已知圆心、半径),要求在里面均匀采样。
- 若干个长度不同的数组,求最小的区间,让每个数组都有数字在这个区间内
- 一个01矩阵,每一排都是0在前1在后,问哪一排的1最多?(二分法)问有没有更简单的方法(每一排记录当前的最左边的1的位置,下一排的时候直接忽略右边的)问时间复杂度,猜测是O(m+n)
- fibonacci数列的通项公式 *2
- 描述dfs和bfs,分别怎么实现?(栈和队列)
- 最短描述数,10的最短描述数是32+12所以是2,求一个数的最短描述数。
- 不存储数据流的前提下,从输入流中获得这 n 个等概率的随机数据 :http://blog.sina.com.cn/s/blog_a9dd6f4a0102v3dp.html
- 给一个概率分布均匀的随机数发生器,给一串float型的数,希望通过这个随机数发生器实现对这串数进行随机采样,要求是如果其中的某个数值越大,那么它被采样到的概率也越大
- 给一串数和一个目标值,使用四则运算和括号使得这串数最后计算结果为目标值,打印出所有的方案,要求是这些数每个最多被使用一次,可以不被用到。
- 并查集
语言
- 函数式编程和面向对象区别?
- python
- python list和tuple的区别
- 说一下python里啥叫生成器
- python is ==的区别
- map的底层实现
- python方法解析顺序
- 如何判断两个dict是否一样
- 深浅拷贝 *5
- python锁机制
- 如何在list头上删元素
- 一个python的dict,按照key-value存储,如何按照value排序
- 字符串拼接(join)
- 对一个列表删除所有为0的数字
- 交换数字a,b
- 怎么定义一个类的成员变量
- list dict有什么区别
- 手写对dict排序
- key-value的数据结构
- list 底层怎么实现
- dict底层如何实现
- python中数组去重怎么做?具体代码?
- java
- 说一下java里接口和抽象类:
- 接口是抽象类的变体,接口中所有的方法都是抽象的。而抽象类是声明方法的存在而不去实现它的类。
- 接口可以多继承,抽象类不行
- 接口定义方法,不能实现,而抽象类可以实现部分方法
- 接口中基本数据类型为static 而抽类象不是的。 当你关注一个事物的本质的时候,用抽象类;当你关注一个操作的时候,用接口。
- String用过吗,StringBuilder和StringBuffer有什么区别
- 用过集合吗,简单说一下
- 用过哪些数据结构,Map、Set用过吗
- JAVA的垃圾回收机制
- java都做过什么?面向对象三大特性说一下?Hashmap?死锁?
- 说一下java里接口和抽象类:
数学/智力
- a,b~U[0,1],互相独立 求Max(a,b) 期望 *3
- 一副扑克牌54张,随意洗牌,分为两份,每份有两个2的概率
- 一排n个硬币,一次可以拿1or2个,最后拿完的人获胜,问可能的情况,归纳规律。
- 在一个圆上有任意三个点,组成锐角三角形概率。答案说对了,1/4,从极限角点推出来的,让我用积分公式算,gg….
- 很多很多球,不一样大,A先拿10个,B再拿20个,问A的最大的球比B的最大的球大的概率.
- 有80个球,有一颗轻一点,给你一个天平,至少几步找到,我说用二分法,他说如何把树缩短,最后用b树解决的。过程中面试官不断提醒我,还教育我。
- X是一个以p的概率产生1,1-p的概率产生0的随机变量,利用X等概率生成1-n的数
- 有三个连续的大于6的整数,其中有两个是质数,求证另外一个数能被6整除
- 扔色子,最多仍两次,第一次扔完可以自行决定要不要扔第二次,去最后一次扔色子的结果为准,求:尽可能得到最大点数的数学期望
- 一个圆饼,切成n块,进行着色,相邻不能同色,颜色好像有m种,一共有多少种方案?
- 俩人轮流扔硬币,扔出正面获胜,求:先扔者获胜的概率
- 8个球,1个比较重,天平,几步找到重的?
- 左边m个小球,右边n个小球,在同一条光滑直线上相向而行,碰撞后原速相反方向返回,直到没有碰撞,一共碰撞了多少次。(这题还挺有难度的,当时推了十分钟没推出来,其实就差一点,回去又想了想,应该是m*n)
- 0~1均匀分布的随机器如何变化成均值为0,方差为1的随机器
- 每次抽球概率是1/4,前三次抽中则第四次必中,求抽一百次的期望
- 4个海盗,100个金币,每个人轮流提方案,如果你的方案有半数以上通过,那么久可以,否则就会被杀掉,如果你是第一个人,那么你怎么提方案比较好
- 一根绳子,随机选两点截断,三条线段能组成三角形的概率
- 一个路口,一个小时通过一个车的概率是0.9,那么20分钟内通过车的概率是多少
- 连续投硬币,当第一次出现正面时,一共投了奇数次则A赢,偶数次则B赢。求A, B赢的概率
- 一枚不均匀的硬币,我抛了100次,有70次朝上,那么第101次朝上的概率是多少
- 一个袋子里有100个黑球和100个白球,每次随机拿出两个球丢掉,如果丢掉的是不同颜色的球,则从其他地方补充一个黑球到袋子里,如果颜色相同,则补充一个白球到袋子里。问:最后一个球是黑球和白球的概率分别为多大?
-
A容器中有4L沙子,B容器中有4L米,假设米和沙子密度一样。有一个C容器是300ml, 第一步,用C从A中舀300ml到B中,混合均匀,第二步,用C从B冲舀300ml到A中混合均匀。再重复第一步和第二步,问这四步之后,A中的米和B中的沙子谁多?
- 怎么求四阶矩阵的逆
- 信息熵、条件熵、互信息、信息增益 等等的计算
- 概率分布的相关计算 假设检验
- t检验
- 卡方检验
- 相关性分析
- 概率和似然概率的异同
- 极大后验与最大似然*3
- 共轭先验
- 狄利克雷分布能具体说说么
- 贝叶斯公式
- 独立性和相关性的意义和区别?
- 频率学派和贝叶斯学派什么区别?频率学派是上帝视角,认为频率是固定的,比如硬币均匀投掷之后正面概率为0.5,但贝叶斯学派是观察者的身份,会随着观察结果更新认知。
- 抽蓝球红球,蓝结束红放回继续,平均结束游戏抽取次数
机器学习
- 线性回归:
- 损失函数 *2
- 解析解的推导(三种方式)
- 表达式
-
lr:
- 推导*48
- LR和线性回归的区别*4
- LR如何解决共线性,为什么深度学习不强调
- LR如何分布式训练?
- LR梯度下降的时候某一轮迭代参数特别大是怎么回事
- 如何实现多分类:参考李航《统计学习方法》P80 *4
- hinge损失函数里面的z是什么?
- 为什么要用sigmoid?*3
- 核技巧
- 能处理浮点数吗?
- LR+L1作用
- 优势?
- 参数规一化是否对结果有影响
- svm:
- SVM基本型推导*38
- 核函数相关
- 核函数选择及其应用场景*12
- 好处?*4
- 如何处理线性不可分数据,有哪几种方式
- SVM核函数成立的条件
- 为什么高斯核能够拟合无穷维度,因为他可以无穷泰勒展开。
- 多项式核和RBF核的关系
- 什么时候用线性核和高斯核:
- 当样本数很多时,应该用线性核,计算量比高斯核要小很多
- 当线性可分时(可以理解为当数据特征的维度很高时),线性核和高斯核效果差不多
- 线性不可分时,高斯核效果更好
- svm里样本多的时候用什么核
- 希尔伯特空间
- 对偶相关
- 手推SVM拉格朗日乘子法及对偶运算推导 * 3
- SVM转换为对偶目的是什么*2
- 为什么对偶问题就好求解,原始问题不能求解么 *2
- kkt条件具体是什么
- 比较svm和lr区别,哪个是参数模型:损失函数不同*11
- SVM和全部数据有关还是局部
- 正则项
- 如何拓展到多分类问题
- SVM的硬间隔,软间隔表达式
- 在SVM的训练中有没有遇到hard example。答,SVM对hard example的应用非常重要,先用一部分训练集训练一个模型,然后用剩下的一部分训练集的一部分测试,把出错的再送进去训练,重复两到三次,效果会比较好。然后解释了为什么。
- 优缺点 *2
- 支持向量机的物理意义?
- 应用场景
- 有哪些降低模型复杂度的方法
- 手推SMO
- knn复杂度高,怎么解决?
- 决策树
- 模型原理*14
- 为啥树模型不适合onehot数据
- 分类树怎么选择划分/分裂属性 *12
- 信息增益方法id3
- 信息增益比 c4.5
- 基尼不纯度
- 有了信息增益为什么还提出了增益比?
- 回归树做回归时候划分点怎么选择 *5
- 回归树和分类树有啥区别?
- 剪枝的过程 *3
- 在什么场景下使用
- 决策树是线性的么
- 树的损失函数
- 树模型如何处理缺失值和连续值
- id3 c4.5的区别
- id3为什么比c4.5更会过拟合
- 决策树不适合用onehot的原因:
- 优缺点是啥 *3
- 随机森林
- 原理 * 18
- 怎么筛选重要特征的?
- 随机森林和Adaboost区别 *3
- 随机森林和gbdt的区别*4
- 随机森林和xgb区别*3
- 怎么用于回归
- 随机森林建立新的树要考虑什么
- 随机森林的随机体现在哪里
- adaboost
- 原理*8
- 会过拟合吗?加深树的深度会过拟合吗?为什么?
- gbdt
- rf和gbdt对数据方差和偏差上的区别 *3
- 原理 、推导*27
- GBDT做回归的整个流程是怎么样的(怎么建树?怎么分裂?怎么防止过拟合?怎么剪枝? )*2
- GBDT做分类的整个流程是怎么样的(怎么建树?怎么分裂?怎么防止过拟合?怎么剪枝?)
- gbdt为什么用梯度,用梯度什么好处
- 梯度是几阶的?一阶的
- GBDT第二棵树的输入是什么?
- gbdt+lr模型更新的先后顺序?频率呢?
- 调参会调整哪些参数?某些参数(叶节点权重阈值,树深度等)调大或调小对模型有什么影响?
- GBDT里的G代表什么,体现在哪里,XGboost在梯度上改进的地方
- GBDT除了平方损失,还有什么损失函数
- GBDT每轮拟合的是什么东西,GBDT做分类问题时又拟合的是什么东西(当时懵了,拟合的是梯度嘛?)
- 适用场景?
-
xgboost
- xgb原理 * 31
- 为什么效果好
- xgboost跟GBDT比优点都有哪些/区别*21
- 怎么选分裂点/重要性排序怎么实现的 *5
- 正则相关:
- xgb中l1正则怎么用的 *2
- xgb里面正则项怎么表示
- LR+L1作用
- L1正则如何求梯度
- 抽样相关:
- Xgboost中的行抽样,可以起到哪些作用
- 样本少了不是会过拟合么,为什么行抽样可以防止过拟合:可以参考bagging思想,对于单颗树而言会确实会过拟合,但是对于整体会减少过拟合
- 缺失值具体怎么做的,怎么考虑
- 损失函数
- 调参
- 参数有哪些
- 如何发现过拟合
- XGBoost模型中对数据进行采样的好处?
- 为什么用二阶泰勒展开而不用一阶*3
- 并行化(不是特征的并行化)怎么实现的?特征并行化怎么做的
- LR和boost的区别
- 与lightgbm区别*6
- 并行是如何并行的
- 为什么处理数据不平衡比较强
- xgb的vc维
- 优势
- xgb与lr的优缺点
- lightgbm
- 推导*3
- rf与lightgbm的区别
- 优势
-
集成学习:见https://www.nowcoder.com/discuss/71482
- bagging、stacking和bossting原理、区别 *25
- stacking blending区别
- 降维
- 有哪些方法?*2
- svd 原理*5
- pca
- 原理/推导*14
- 对于PCA,会有第一主成分、第二主成分,怎么为什么第一主成分是第一,原因是什么
- PCA的主成分是怎么得到的
- svd和pca的联系和区别*8
- 为什么是方差最大?
- 与svd关系
- isomap
- t-sne
- 聚类
- 距离的计算方法 *4
- 什么时候需要用聚类
- dbscan
- 原理*10
- 伪代码
- 与kmeans、optics区别
- 谱聚类
- kmeans
- 原理:最大化簇间距离,最小化簇内距离 *9
- 手写代码
- 怎么训练(E步和M步)*3
- EM算法和kmeans之间联系,和高斯混合模型间联系
- 与dbscan的区别
- K-means 中我想聚成100类 结果发现只能聚成98类,为什么
- 优缺点*2
- 复杂度*2
- k怎么确定*4
- 过拟合
- 解决方法*27
- 为什么会过拟合
- 过拟合与欠拟合区别*2
- L1、L2原理(数学上、图像上解释)、区别*23
- 正则化与偏差、方差关系
- l1、l2如何选择(应用场景)*5
- 判断方法
- l1正则近端梯度下降?推导
- 方差偏差分解的公式 *5
- 偏差和方差对于训练的意义
- 各种范数,为什么不用1/2范数
- L1不可导的时候怎么办
-
朴素贝叶斯
- 原理 (怎么优化等) * 7
- 为什么叫朴素
-
HMM
- 原理*5
- 怎么做词性标注*2
- 应用场景
- 学习策略
- 优化方法
-
CRF
- HMM与CRF区别
- 学习策略*4
- 优化方法 *4
- gmm
- 最大熵模型
- 特征选择的方法 *11
- 如何判断特征的有效性
- 特征与模型的相关性如何计算与表示
- 皮尔逊相关系数、
- 树模型
- L1
- 降维
- 过滤法、包装法、嵌入法
- 牛顿法
- 与梯度下降的区别、优劣比较(优缺点)*5
- 推导 *4
- 拟牛顿法原理,BFGS *3
- lbfgs
- 怎么求海塞矩阵
- 交叉验证
- EM算法推导*3
- 训练集,验证集,测试集的用途,怎么用这些数据来检验模型。
- 生成模型和判别模型
- 区别*3
- 有哪些?*2
- 衡量模型好坏:
- 二分类的评价指标有哪些*3
- ROC曲线的横轴和纵轴分别是什么*3
- 准确率*2
- 召回率*2
- auc
- 计算公式*6
- auc可以用于多分类吗?
- 含义 *2
- 横纵轴都代表什么
- 从概率上面的解释一下?
- 真阳率
- 样本分布不均匀时,怎么评价?
- RMSE
- 假阳率
- 损失函数相关:
- loss function用MSE的不足和改进
- lasso的损失函数
- 常用的损失函数
- VC维的公式、意义、作用*3
- 怎么判断线性与非线性
- 损失函数有哪些?
深度学习
-
softmax
- 原理*5
- 梯度
- 与logistic关系?可以推导吗?
- 梯度消失、梯度爆炸原因?怎么解决?*7
- 交叉熵
- 原理公式*8
- 为什么要用softmax+交叉熵损失而不用softmax+均方根损失 * 2
- BP算法
- 数据归一化在梯度下降时会有什么好处?
- 正向传播、反向传播推导*14
- 计算一层的参数量、计算量
- 初始权重怎么设置?有哪些方法?*3
- 全连接的作用
- bp和深度学习的异同
- 梯度下降的方向是怎么样的
- 激活函数
- 常见激活函数及比较*7
- ReLU的特性、优缺点 *8
- sigmoid函数特性,是凸函数嘛*3
- sigmoid优缺点
- 激活函数的作用是什么
- 解析leaky relu
- tanh梯度
- relu的问题是什么?怎么解决(负半区神经元失活,leak relu/maxout等)
- maxout激活函数的原理
- Batch normalization
- 原理*24
- 先加bn还是先加激活?有什么区别?
- 为什么抑制梯度消失/爆炸、加快收敛速度 *5
- 作用*2
- 反向传播怎么求导
- 优缺点
- dropout
- 原理*13
- 作用 *2
- RNN
- Markov和RNN的区别
- 原理/示意图*8
- 如何训练(推BPTT)*3
- 不收敛怎么办
- rnn为什么会梯度消失*6
- RNN的梯度爆炸怎么解决 *6
- 优势*2
- lstm
- 画图/原理*26
- 参数量
- 为什么可以解决梯度消失*11
- 怎么优化?
- 与rnn区别*3
- 为什么用lstm做时间序列预测而不用传统方法?
- 遗忘门是一个数值还是向量?维度是多少?
- 对于RNN的改进地方在哪?
- 解决了RNN的什么问题:梯度弥散
- 还有什么方式解决梯度消失:relu,bn,合理初始化
- 遗忘门是一个数值还是向量?维度是多少?
- 与GRU区别*3
- GRU:
- 推导/图*6
- 为什么可以解决梯度消失*3
- mrelu-GRU
- 并行RNN
- attention的机制、公式推导 *1
- convLSTM*2
- 正则化方法:AR以及TAR
- sequence to sequence
-
CNN:
- 介绍CNN原理/图示、公式*23
- 怎么实现的?比如caffe中
- CNN对NN的改进之处?
- 权值共享
- 除了图像用卷积,还有什么能用
- 卷积层的工作流程?作用? *5
- group convolution
- dnn与cnn区别
- 卷积时间复杂度
- 计算经过卷积操作后的feature map大小
- pooling原理*2
- pooling的作用*3
- pooling层怎么反向传播*2
- 看过图卷积网络没有?
- 3D卷积看过吗?
- TensorFlow内部是如何实现卷积的
- 卷积的局限性
- 计算感受野、参数数量 *35
- 感知野(感知野其实就是在多个kernel做卷积的时候的窗口区域,就是3个3*3等于1个7*7的感知大小)的作用
- 卷积的作用
- 池化层
- 有哪些: max pooling我蠢到说提取最有特征的特征,其实就是最具有代表性的特征;average pooling提取的是比较general 的特征;global average pooling用来分类的,因为后面网络的加深,full connected layer参数太多了,不容易训练,为了快速准确得到结果,采用global average pooling,没有参数,但是得到的分类效果跟FC差不多。
- 作用
- 反向传播时怎么计算
- 手写代码,设计tf网络,实现32*32的图像10分类
- 如何用cnn做多分类
- FCN,DeepLab v1 v2 v3的区别,和DeepLab和PSPNet有什么区别呢?
- inception
- 原理/图*13
- 多通路并列的作用
- 1 * 1卷积的作用 * 5
- CNN为什么比DNN在图像识别上更好
- NIN:
- 特点
- 比vgg好在哪里
- GoogleNet
- vgg
- 原理/图示 *6
- 1 * 1的卷积核的作用 * 4
- VGG使用3*3的卷积核最大的优势是什么 *3
- 比较VGG和LeNet
- 与resnet哪个参数多?
- ResNet
- 原理 *17
- bn在哪
- 好处
- 在什么情况下比densenet效果好,什么情况下反过来
- 与densenet区别
- 画图
- 为什么用恒等映射 *2
- ResNet主要解决的问题是什么 *4
- 为什么深度深难优化?*3
- r-cnn *3
- mobileNet*3
- shuffleNet
- faster-rcnn
- 原理*13
- rpn流程*2
- fasterRCNN做了region pooling后,图片大小不能整除导致中间的特征不好感知到怎么办
- RPN层的作用是什么
- rpn原理
- RPN网络中的anchor
- roi的作用是什么
- anchor选的太大或太小有什么影响
- 正负样本选取的时候为什么用0.7和0.3的超参,与nms使用0.3的超参是否有关
- smooth l1损失为什么不用l1,为什么不用l2
- w,h回归的时候为什么要用log
- x,y回归的时候为什么用除法
- rpn可否单独拿出来应用等等。
- 与rcnn有什么区别
- xception
- yolo
- 原理*5
- yolo与ssd的区别
- fpn
- SPP
- ssd
- 原理*4
- 与f-rcnn区别*2
- R-FCN
- 与faster-rcnn区别?
- 怎样理解R-FCN的PS RoiPooling
- RPN中正负样本的阈值为(0.7、0.3),中间(0.3-0.7)的不选用会有什么后果?为什么需要把正负样本的阈值设定在这两个相隔较远的值?
- depthwise-CNN
- 原理*2
- 1*1卷积核的作用
-
GAN
- 原理* 8
- gan在实际实现中的loss是什么
- 为什么会梯度消失、如何避免梯度消失 * 8
-
过拟合
- 如何防止/如何提高一个网络的泛化能力?*16
- 原因*2
- 优化
- GD和SGD的区别*5
- adam二阶矩是什么?为什么要用二阶矩
- sgd、adagard、adam的原理 *16
- 优化器选择?
- sgd各个参数怎么设置?
- 权值衰减这个参数怎么设置?
- 三种梯度下降各自的原理、优缺点 * 2
- 动量方式的梯度下降 *4
- 学习率是如何设置的,如何调参 *6
- 深度学习的话,如果一个模型没有办法收敛,是不是说明这个模型就没用了
- 造成不收敛的原因有哪些
- clipping gradient的概念,目的是什么
- 按照你的经验,深度学习的待学习的参数量和训练样本数量之间的关系。
- TensorFlow interactivesession 和 session的区别
- 深度学习框架的底层实现
- Data Augmentation
- 初始化
- 深度学习的适用场景
- 深度学习为什么效果这么好
- 深度学习与传统方法的区别
- 深度学习的特征怎么和传统特征结合
项目相关
- lda *8
- 分词的算法原理
- cv如何做数据增强*6
- 深度学习超参数如何设置?有什么心得体会
- LSH:相似文档、相似图片
- nlp中未登录词怎么处理?
- 两个矩阵,23和33矩阵,拼成一个2*3的,tensorflow怎么操作
- 如何衡量两个句子相似度
- 如何处理数据不平衡问题*10
- deepfm图
- pnn图
- fnn图
- fm,fmm*35
- OneHot的作用:将特征映射到欧氏空间,更合理的计算距离或者相似度度量,表达上更合理
- doc2vec
- 手写tensorflow的图像分类代码
- fasttext
- 原理*2
- softmax用在哪里?
- word2vec
- word2vec 属于监督学习还是非监督学习
- 是怎样实现的、原理?*18
- negative sampling怎么做,为什么这么做*2
- 如何加速word2vec的训练
- 为什么用霍夫曼树做?
- 怎么用哈夫曼树编码的。
- fasttext和word2vec的区别
- 如果想用fasttext(有监督)实现word2vec(无监督)的效果,应该怎么改
- 预训练word2vec加入到模型中是作为参数还是变量(dynamic or static)
- wide and deep模型
- sift特征和hog特征
- 特征工程怎么做的,怎么离散化的
- 图像预处理的方法
- 特征工程你一般怎么做 *4
- 推荐算法:
- 如何解决冷启动
- 协同过滤里面怎么细分?细分之后的算法举出几个?
- 框架
- 协同过滤的itemCF,userCF区别适用场景
- 基于商品的协同过滤,公式实现
- 关联规则, 关联规则具体你知道哪些算法?:Apriori和FP-Growth
- tf-idf
- tf、idf分别是什么
- 关键字怎么提取的,TF-IDF有改进么,怎么改进的
- 命名实体怎么得到的,原理了解
- 归一化方法
- 机器学习中对样本数据不平衡的情况有哪些解决方法 *5
- 项目分工
- 说说你最近看过的一篇paper
场景题
- 用户搜索的时候,给一个query会得到相关的搜索结果,如何根据搜索结果去判断两个query的相似度
- 有高德地图的全部权限,怎么预测道路拥堵情况。
- 数据中有20%的噪声,标签不准确,怎么解决这个问题?
- 在上一题的基础上,视频和微博这两个渠道有哪些直接的,自动化的特征可以利用?(意思是不用人工筛查,不用复杂的图像检测)
- 有一个地理坐标,怎么从我所有的几千万几百万个poi中快速查询到离它最近的几个。我是想答分治、分层索引之类的,但是面试官实际是在问,怎么设计数据结构能最快,怎么把x,y这样的坐标对存成key,没答上让他满意的答案。
- 问了一个实际场景,用户输入一个坐标,怎么推送给他合适的POI。问题描述的有点不清楚,我理解的也有点懵。先说根据用户特征、相似和社交关系等做个性化推送。又说如果训练数据中用户信息不是完全标注好的,就是半监督问题,可先对POI聚类或者embedding等。
- 怎么设计一个判断潜在付费用户的系统,考虑哪些因素?
- 文本二分类的场景,问怎么提取特征,怎么设计评价指标,怎么调节超参数。
- 给两万个样本数据,每个数据输入参数五百个,请问有什么可能会出现的问题并且怎么解决,如果用lr和svm能不能使用。
- 有1T 的数据,10亿个不重复单词,给你一台机器,16G的内存和5T的内存,怎么统计每个单词的个数?
- 如果给你一些数据集,你会如何分类(我是分情况答的,从数据的大小,特征,是否有缺失,分情况分别答的)
- 有一个1000w的大样本,怎么样抽取得到一个10w的小样本,小样本还能基本代表大样本,保持大样本的特性。(我说的是boostrap抽样,有放回抽取n组小样本,然后估计总体均值方差分布,然后重新抽样。。但面试官不满意。。。后来说的是用bagging的思想,抽取不同的小样本然后做任务的时候多数投票机制(各种转移注意力)。。)
- 有一个无限长的数字序列,大到存储其中所有数是不可能的,序列不断传输过来,在某一个时刻喊停,要求以均等概率返回之前已经传过来的某一个数。每过来一个数,就以1/n的概率保留,这样只要存当前留下来的数返回就可以了。
- 怎么进行恶意刷单检测识别
- 10W用户数据,其中有5%label是错的,问这几个算法把错误的数据找出来并赋予正确的类别…
- 怎么判定两个文本的相似度。
- 给你一个检测的项目,检测罐装的可口可乐,瓶装的可口可乐作为负样本,怎么弄?
- 用mapreduce实现10亿级以上数据的kmeans
- 检测20类物体,多少张训练集,怎么训练。
- 10亿个32位的数据,放到4G的空间里,怎么找出只出现一次的数据的个数。
- 人脸识别是怎么做的,例如在机场的场景下,如何通过人脸识别技术找出潜在的危险分子
- 检索问题怎么优化检索建立
- 菜鸟无人仓机器人从A到B,需要多个机器人到达,怎么样效率最高?
- 海量数据中找中位数(数据有100G,内存只有1G):利用外部排序确定,或者可以用两个堆
- 文件里包含了大量URL,每行一个,其中有很多重复。编写一个方法,输出出现次数前5多的URL
- 两个文件,特别大的文件A和B,A50G,B10G,一台电脑,内存2G,硬盘无限大,让你求两个文件的交集,差集
- 我有一个32位的id是唯一的,那么我想压缩一下,让他还唯一,怎么压缩
- 你觉得滴滴打车的拼车价是怎么计算出来的,详细描述。(路径规划,订单预测之类的)
- 你觉得滴滴打车的溢价,1.1倍,1.2倍,这些数值是怎么计算出来的?(订单预测,当前司机数量),目的是什么?
- 如何识别两个不同的场景(环路和高速公路)
- 有一个业务系统,每天要处理1000万次服务请求,如何设计这个系统?
- 10亿个32位正整数,求不同值,只给1GB内存
参考资料
- 菜鸟实习面试题分享:https://www.nowcoder.com/discuss/76939
- face++旷视面经:https://www.nowcoder.com/discuss/76125
- 携程大数据分析一面挂:https://www.nowcoder.com/discuss/76057
- Face++算法实习面试经过:https://www.nowcoder.com/discuss/76016
- 阿里新零售算法一面二面面经 明天三面攒人品:https://www.nowcoder.com/discuss/76003
- 拼多多算法面经:https://www.nowcoder.com/discuss/75998
- 网易互娱数据挖掘一面面经:https://www.nowcoder.com/discuss/75992
- 微盟算法工程师岗:https://www.nowcoder.com/discuss/75958
- Face++算法岗一面挂经:https://www.nowcoder.com/discuss/75901
- 西安应用研究面经,写出来攒人品:https://www.nowcoder.com/discuss/75820
- 美团点评 机器学习/数据挖掘工程师 面经:https://www.nowcoder.com/discuss/75787
- 华为春招实习记录:https://www.nowcoder.com/discuss/75613
- 阿里巴巴算法实习(四轮技术面+一轮HR面) 已拿到offer:https://www.nowcoder.com/discuss/75581
- 阿里算法-图像图形一面面经:https://www.nowcoder.com/discuss/75519
- 阿里机器学习七面面经:https://www.nowcoder.com/discuss/75360
- 腾讯 北京 应用研究一面:https://www.nowcoder.com/discuss/75266
- 腾讯应用研究岗一面:https://www.nowcoder.com/discuss/75239
- 腾讯应用研究实习面经:https://www.nowcoder.com/discuss/75338
- 机器学习算法面经(腾讯阿里网易):https://www.nowcoder.com/discuss/75166
- 微众数据算法笔试面经:https://www.nowcoder.com/discuss/75143
- 2018春招科大讯飞,华为,神策数据,今日头条面经:https://www.nowcoder.com/discuss/75136
- 腾讯 机器学习岗啊呀呀我的处女面:https://www.nowcoder.com/discuss/75000
- 新鲜出炉的腾讯应用研究-机器学习面筋:https://www.nowcoder.com/discuss/74984
- 实习春招-腾讯/阿里/华为-面经【持续更新】:https://www.nowcoder.com/discuss/74954
- 京东春招实习,算法工程师迟到面经:https://www.nowcoder.com/discuss/74759
- 腾讯应用研究一面 武汉:https://www.nowcoder.com/discuss/74725
- 头条算法工程师实习4.14二面凉凉:https://www.nowcoder.com/discuss/74484
- 4.14 头条大数据岗:https://www.nowcoder.com/discuss/74470
- 腾讯新闻算法实习面经:https://www.nowcoder.com/discuss/74301
- 阿里内推算法-图形图像方向,三面结束,总结面经祭奠一下:https://www.nowcoder.com/discuss/74234
- 网易互联网人工智能事业部计算机视觉岗面试总结:https://www.nowcoder.com/discuss/74187
- 4.13京东数据研发一面:https://www.nowcoder.com/discuss/74056
- 网易游戏伏羲实验室人工智能研究员 面经(两轮技术+一轮hr):https://www.nowcoder.com/discuss/74033
- 腾讯线路面试聊天20分钟,一面挂:https://www.nowcoder.com/discuss/73887
- 腾讯应用研究-机器学习一面跪,给大家参考一下问题:https://www.nowcoder.com/discuss/73806
- 阿里机器学习实习岗,两面技术面之后流程到了人力部门:https://www.nowcoder.com/discuss/73612
- 腾讯一面面经分享~攒好运:https://www.nowcoder.com/discuss/73582
- 腾讯滴滴阿里三星实习面经:https://www.nowcoder.com/discuss/73306
- 华为面经 大概是收到offer了吧:https://www.nowcoder.com/discuss/72870
- 小米科技面试全过程:https://www.nowcoder.com/discuss/72155
-
算法渣第二部-阿里 滴滴 小米 搜狗(你知道什么是绝望么):https://www.nowcoder.com/discuss/72113 - 今日头条 AI Lab计算机视觉 实习 远程一面 挂:https://www.nowcoder.com/discuss/72025
- 阿里菜鸟网络现场二面+HR面试:https://www.nowcoder.com/discuss/71927
- 2019届实习机器学习岗经验贴:腾讯,阿里,商汤:https://www.nowcoder.com/discuss/71919
- 今日头条算法实习生2轮面经:https://www.nowcoder.com/discuss/71610
- 昨天头条算法面经:https://www.nowcoder.com/discuss/71505
- 机器学习/深度学习 问题总结及解答:https://www.nowcoder.com/discuss/71482
- 平安科技面试(及格):https://www.nowcoder.com/discuss/70955
- 等了一周的微信三面:https://www.nowcoder.com/discuss/70988
- 新鲜出炉的头条&滴滴&微信算法面经:https://www.nowcoder.com/discuss/70998
- 美团点评 数据挖掘和算法 面经:https://www.nowcoder.com/discuss/71109
- 蚂蚁金服:https://www.nowcoder.com/discuss/71480
- 阿里算法二面新鲜热辣:https://www.nowcoder.com/discuss/69823
- 滚烫的阿里机器学习算法实习岗面经:https://www.nowcoder.com/discuss/69401
- 微信部门面试:https://www.nowcoder.com/discuss/69036
- 阿里机器学习一面面经:https://www.nowcoder.com/discuss/68217
- 算法实习面试经验分享:https://www.nowcoder.com/discuss/68431
- 阿里机器学习面试(高德地图):https://www.nowcoder.com/discuss/77119
- 腾讯暑期实习生面经:https://www.nowcoder.com/discuss/68953
- 算法渣说一下自己碰到的算法面试:https://www.nowcoder.com/discuss/68828
- 迟来的面经,回馈牛客:https://www.nowcoder.com/discuss/67952
- 2017秋招算法岗位一点点小面经:https://www.nowcoder.com/discuss/70012
- 网易互娱 数据挖掘研究员 面经(offer):https://www.nowcoder.com/discuss/78275
- 阿里算法工程师面试经历2018/4(加拿大留学生):https://www.nowcoder.com/discuss/78289
- 找实习真的累,跟风分享波面经吧~ 精:https://www.nowcoder.com/discuss/77936
- 阿里offer,终于等到了offer call,内附面经:https://www.nowcoder.com/discuss/79365
- 美团点评机器学习面经:https://www.nowcoder.com/discuss/79207
- 一个菜鸡算法的实习面经(蚂蚁 美团 七牛云 爱奇艺 深信服) :https://www.nowcoder.com/discuss/79327
- 腾讯机器学习面经:https://www.nowcoder.com/discuss/79407
- 双非渣硕2018秋招春招面经,请各位大佬开喷,反正我不会回复:https://www.nowcoder.com/discuss/79529
- 春招找实习经历回馈:https://www.nowcoder.com/discuss/77702
- 牛客史上最水算法面经:https://www.nowcoder.com/discuss/77758
- 双非沫硕春季找算法实习经历(附心得体会及大量面筋~):https://www.nowcoder.com/discuss/77795
- 头条一面:https://www.nowcoder.com/discuss/81871
- 头条一级部门Data如何?收到推荐算法offer,面经如下:https://www.nowcoder.com/discuss/80875
- Momenta算法实习面经:https://www.nowcoder.com/discuss/80837
- 【头条AI lab&百度】转专业美国渣硕的机器学习面经:https://www.nowcoder.com/discuss/80846
- 谷歌,微软,阿里,美团实习生面经 :https://www.nowcoder.com/discuss/81353
- 无比曲折的阿里机器学习实习面试经历,附面经:https://www.nowcoder.com/discuss/80033
- 拼多多 算法岗位 三面面经:https://www.nowcoder.com/discuss/81880
- 阿里三面面经:https://www.nowcoder.com/discuss/76388
- 阿里算法工程师面经:https://www.nowcoder.com/discuss/83485
- 记录第一次互联网面经Momenta:https://www.nowcoder.com/discuss/83155
- 2018年5月份找实习经历(计算机视觉与深度学习岗):https://www.nowcoder.com/discuss/83377
- 春招实习总结,算法岗:https://www.nowcoder.com/discuss/80357
- 58算法岗远程面试 二面or三面失败面经:https://www.nowcoder.com/discuss/80547
- 携程金融北京部的算法岗一面面经:https://www.nowcoder.com/discuss/80550
- 小弱鸡的春招算法实习面经:https://www.nowcoder.com/discuss/79584
- 百度cv实习算法工程师面经:https://www.nowcoder.com/discuss/74885
- 【AI算法】美团2019校招AI算法提前批面经(已拿两部门offer):https://www.nowcoder.com/discuss/88679
- 【算法】招银信用卡中心AI面试:https://www.nowcoder.com/discuss/120676
- 【算法工程师】百度AIG一、二面面筋:https://www.nowcoder.com/discuss/98541
- 网易互娱一二三面(AI 工程师):https://www.nowcoder.com/discuss/112298
- 网易游戏AI研究员面经:https://www.nowcoder.com/discuss/98305
- 【AI】平安人寿AI研发团队算法面经https://www.nowcoder.com/discuss/92701
- 热乎乎的招银成都面经https://www.nowcoder.com/discuss/118423
- 顺丰提前批人工智能岗技术面面经【这回大概真的凉了?】https://www.nowcoder.com/discuss/92370
- 【算法】vivo人工智能语音算法工程师面经:https://www.nowcoder.com/discuss/115049
- 【算法岗】【vivo人工智能语音算法岗】一面(技术面)面经https://www.nowcoder.com/discuss/92260
- 【算法】【vivo人工智能语音算法岗】二面HR面面经https://www.nowcoder.com/discuss/95197
- 【人工智能岗】中国银联面试经历分享https://www.nowcoder.com/discuss/91333
- 【算法工程师】银联武汉人工智能开发刚面完,热乎着https://www.nowcoder.com/discuss/91879
- 【人工智能】广州网易游戏-人工智能岗https://www.nowcoder.com/discuss/97818
- 【人工智能】网易互娱人工智能研究工程师一面https://www.nowcoder.com/discuss/97689
- 【人工智能】记一次难忘的面试,网易伏羲人工智能研究员5面面经https://www.nowcoder.com/discuss/97427
- 【人工智能研究工程师】网易互娱人工智能研究工程师一面:https://www.nowcoder.com/discuss/97689
- 【学习算法工程师】深信服机器学习算法工程师一面面经https://www.nowcoder.com/discuss/87545
- 【算法】百度-机器学习(已offer-手百推荐feed流):https://www.nowcoder.com/discuss/121233
- 【算法】百度算法岗(机器学习)酱油o.o:https://www.nowcoder.com/discuss/111758
- 【算法】秋招面试–百度机器学习面经–更新至二面:https://www.nowcoder.com/discuss/111385
- 【算法】秋招面试–百度机器学习一面:https://www.nowcoder.com/discuss/109158
- 【算法】华为-海外提前批-1技术,2综合,3boss-机器学习算法:https://www.nowcoder.com/discuss/95240
- 【算法】华为-海外留学生提前比-机器学习算法https://www.nowcoder.com/discuss/95240
- 【人工智能与机器学习】顺丰科技内推提前批人工智能与机器学习HR面,凉凉面经https://www.nowcoder.com/discuss/88906
- 【机器学习】顺丰科技机器学习https://www.nowcoder.com/discuss/89042
- 【机器学习与人工智能工程师】顺丰机器学习与人工智能工程师面经https://www.nowcoder.com/discuss/91192
- 【机器学习】[阿里蚂蚁]IOT实验室-机器学习算法-一面面经https://www.nowcoder.com/discuss/92851
- 【机器学习算法】阿里蚂蚁金服-机器学习算法-二面https://www.nowcoder.com/discuss/93959
- 【算法】阿里蚂蚁-机器学习算法工程师-三面https://www.nowcoder.com/discuss/95225
- 【算法】美团点评机器学习算法工程师面筋:https://www.nowcoder.com/discuss/111220
- 【算法】实习面试–腾讯机器学习面经:https://www.nowcoder.com/discuss/111388
- 【算法】小米机器学习算法工程师面经:https://www.nowcoder.com/discuss/128590
- 【算法】vivo机器学习面经:https://www.nowcoder.com/discuss/113367
- 【算法】vivo机器学习算法工程师视频一面面经https://www.nowcoder.com/discuss/93329
- 【算法】秋招第一次走完全程,vivo机器学习面经https://www.nowcoder.com/discuss/93521
- 【机器学习算法岗】菜鸟的面试:科大讯飞和作业帮https://www.nowcoder.com/discuss/90245
- 【算法】网易互娱面经数据挖掘/机器学习算法(10.9更新二面):<https://www.nowcoder.com/discuss/121338
- 【算法】网易云音乐机器学习面经:https://www.nowcoder.com/discuss/99349
- 【机器学习算法】360手机卫士-机器学习算法研发工程师 面经https://www.nowcoder.com/discuss/97260
- 【算法】虹软机器学习算法工程师初面面经【貌似没什么用】https://www.nowcoder.com/discuss/97154
- 【算法】快手【机器学习】记录~:https://www.nowcoder.com/discuss/102265
- 【算法】快手机器学习算法工程师凉面(经):https://www.nowcoder.com/discuss/101927>
- 【机器学习】快手【机器学习】记录~:https://www.nowcoder.com/discuss/102265
- 【机器学习】快手机器学习算法工程师凉面(经):https://www.nowcoder.com/discuss/101927
- 【算法】贝壳机器学习算法面经:https://www.nowcoder.com/discuss/124931
- 【算法】【数据挖掘】贝壳找房三轮现场面(机器学习/数据挖掘岗)8.26:https://www.nowcoder.com/discuss/99190
- 【算法】贝壳-机器学习面经:https://www.nowcoder.com/discuss/99153
- 【算法/机器学习】【春招+秋招】个人多厂面经分享:https://www.nowcoder.com/discuss/126457
- 【机器学习岗】2018年机器学习岗面试干货(京东/华为/美图/招银):https://www.nowcoder.com/discuss/108820
- 【算法】2018春招秋招算法机器学习岗面经(阿里、腾讯、美团、携程):https://www.nowcoder.com/discuss/106725
- 【机器学习/数据挖掘岗】机器学习/数据挖掘岗2019秋招总结:https://www.nowcoder.com/discuss/138721
- 【算法】机器学习相关面经总结,可自查:https://www.nowcoder.com/discuss/102895
- 【计算机视觉】透心凉的百度-计算机视觉-一面面经https://www.nowcoder.com/discuss/90591
- 【算法开发工程师】OPPO2019提前批计算机视觉算法开发工程师凉经:https://www.nowcoder.com/discuss/138577
- 【算法】计算机视觉算法岗面经:两万字啊你确定不看看:<https://www.nowcoder.com/discuss/128148
- 【视觉计算】CVTE研究院视觉计算一面玄学挂https://www.nowcoder.com/discuss/88751
- 【视觉计算】CVTE视觉计算一面面经https://www.nowcoder.com/discuss/88856