服务热线:400-0033-166
万商云集 - 企业数字化选用平台

企业首选的

数字选用平台

数据分析师在面试时都被问到什么样的问题?

2021-01-04 10:56:21 阅读(333 评论(0)

作为金融专业的应届毕业生,大学已经修过相应的统计数学课程。通常通过自学SQL、R语言,python编程,数据挖掘导论。然而,你学得越多,你就越有疑问。数据分析行业涵盖的知识太多了。你想知道你所学的一切都能在工作中得到测试吗?而且毕业几乎迫于就业的压力,作为菜鸟,想找数据分析的实习。我只想知道数据分析行业的兄弟姐妹们在面试中被问到了什么样的问题?我出生在金融专业。本科毕业后,我去BAT当数据分析师。目前,我也是面试官之一。当我接受采访和采访时,我主要关注七个方面。1.基本工具包括规定动作和可选动作。目前,我的团队不需要关心数据来源和结构化。有一个专门的工程师团队编写爬虫、清洁和维护计算集群和数据库。因此,主要的调查点是查询和衍生指标的计算。1.1规定动作SQL查询:JOINON、DISTINCT、GROUPBY、ORDERBY等。数据分析的第一步是从数据库中提取数据。另外,我们的数据规模是TB级的,所以我们应该能够使用SQL让集群做一些简单的计算,否则如果下载到本地,计算资源肯定是不够的。也许还会问一些非常基本的问题,比如PRIMARYKEY、int、str、double等等。Excel:数据透视表,VLOOKUP、COUNTIFS、SUMIFS、VAR.P、条件格式等,可能涉及到VLOKUP中TRUE和FALSE参数的区别,VAR.P和VAR.细节问题,比如S有什么区别?1.2根据简历问自选动作,简历上写什么就问什么,会问得更深。Python、Stata、R、SPSS、SAS、EViews是比较常见的数据分析工具。顺便说一句,我建议你不要死。毕竟,如果你不死,你可能会死。比如简历上写着“精通Python”,虽然我知道简历注水是正常的,但既然都是“精通”,那我就问pandas,regularexpression,DataFrame.iterrows()是Series还是dictionary还是listoftuples,当你回答tuple和list之间的区别时,你必须回答。。。2.逻辑思维主要分为两个方面:理解业务逻辑的能力和写作的逻辑水平。2.1虽然业务逻辑看似简单清晰,但产生数据的复杂性往往超出大多数人的想象。2.1业务逻辑虽然业务流程看似简单清晰,但数据的复杂性往往超出大多数人的想象。业务逻辑的调查主要通过相关项目经验进行。如果是典型的学校项目,我会更加关注指标设计选择、代理变量选择、误差分析、因果解释等。在这里,我再次建议你不要死。至少你应该非常熟悉写在简历上的项目经验,回答如流。如果我听你在15秒内介绍项目后提出的问题(比如“你为什么说北京经济适用房的建筑面积和建筑年份的乘积是一个非常重要和实用的解释变量”)可以让你困惑,那么你也会写我困惑的尼玛面试评估表!当我回去的时候,我必须批评HR!!!以我为例,我每天接触700多张手表,每张手表通常有200多个字段。这些表通常与字段有关。面对这么多的业务指标,能否快速理解它们之间的联系,面对新的数据需求,能否逻辑清晰地将其分为指标、二级指标,并进行各种计算。面对复杂的局部优化和全局优化需求,能否“抓大放小”,能否快速找到关键控制点、关键影响因素并进行优化?我通常每天只花不到一个小时给CEO和其他老板发一份,关于业务数据分析和后续指导的报告。如果思维不敏捷,逻辑不清晰,就很难做好这项工作。如果思维不敏捷,逻辑不清晰,就很难做好这项工作。毕竟,2.2行文逻辑的最终输出是一份报告,可能是HTML邮件或PDF。文章的结构仍然十分重要。这里就不说了,但关键是先说结论,先写摘要。3.理论储备也分为规定动作和可选动作。3.1规定的行动主要是基本的统计理论,如方差、协方差、算数平均、几何平均、中位数、众数、分位值、双峰数据、长尾数据、假设检验、预期迭代规则、贝叶斯原理等。3.2根据简历问自选动作,我会问简历上写什么。第三次建议你不要死,写测试或机器学习算法至少要知道原则、适用条件和局限性。否则,我会和你谈论Pearsondistancencencetance、K-当meanscluster的随机性问题出现时,你也很尴尬。作为数据分析师,4.对细节的敏感性每天都要注意大量的数据指标。对细节的敏感性非常必要。对统计口径和数据的敏感性主要分为两个方面。4.1统计口径统计口径一致是保证数据可比性的基础,考验数据分析师的敏感性和行业经验。例如,转换率、点击计算转换、注册计算转换或购买计算转换配送时间、用户订单或订单确认或商品仓储计时客户单价包不包括配送费、包装费、代金券折扣4.2数据我非常关心候选人的异常数据波动、群值、平均无代表性等情况快速识别能力。例如,已知寿司套餐单价为1500,葡萄酒单价为300,平均客户单价为2500。你能立即认为这可能是双峰数据或长尾数据,还是双峰和长尾数据5。互联网行业的学习能力正在迅速变化,光数据存储就有机会、MySQL、Hadoop、Spark、Hive、Impala、谷哥三驾马车等很多奇怪的东西。互联网行业的从业者往往要面对新的需求、新的工具和新的方法。候选人必须向我证明他们能否快速掌握新知识,解决新问题。主要的调查方法是了解过去的项目经验或我的家庭作业问题(如Sci)-Hub)。6.排版和简单UI设计我认为数据分析报告必须简洁、清晰、突出。主要的调查方法是制作作业题,让候选人在有限的时间内交一份slides(即PPT)。能掌握标准的MicrosoftDesignlanguage是一个很大的加分项。7.价值观主要取决于工作热情、态度、道德水平等。在这方面,我问的问题比较随机,没有规律可循,甚至问了机械键盘、人体工程学设计等问题。如果您对互联网行业感兴趣,欢迎发送我的私人简历。我去过腾讯阿里巴巴百度滴美团今日头条,HR也认识几个~我是神策数据的创始人桑文峰,从2008年底开始带数据团队。一开始,团队有专门响应统计需求的学生,即数据分析师。后来,我更喜欢带一个工程团队。直到去年我开始创业,公司才有一个专门的分析师团队。让我谈谈我的面试要求。首先,有三点与分析能力无关:1.候选人是否真的对大数据分析感兴趣。如果一个人对某件事非常感兴趣,他会花费120%的精力去学习和研究它,相反,他可能会在工作时间考虑其他事情。数据分析工作通常比较枯燥,获取需求,满足需求,不断重复这个过程。如果你不感兴趣,工作三个月很新鲜,工作六个月不想工作,工作一年立即离开。对于感兴趣的人来说,他们会从需求和数字中找到有趣的东西,从而影响产品的发展。二、积极主动。数据分析通常并不意味着需求是明确的,源数据是现成的,只要一步一步地实现。通常还需要推动工程团队帮助完成数据采集,推动数据平台团队实现更好的分析工具。如果不够积极,这些事情往往会原地踏步。另外,对于业务方提出的需求,不能说只停留在需求本身,还要思考业务方想要什么,如何从数据上帮助他们。三、快速学习能力。大数据分析是一个探索性的行业,很多事情都是原型的。这就要求分析师不断学习,学习专业知识,学习国内外良好的实践。而不是固步自封,只停留在书本上的知识。尝试各种新工具。除上述三个基本要求外,我还将考察:4、抽象能力。能否从混乱的需求中抽象出共性,以优雅的方式更有效地解决问题。例如,在2008年,根据以往的许多脚本,我分析了常见的统计需求,无非是计数、重数和顶级流量统计的需求。因此,我抽象了一个交互界面,将需求开发成本从几天降低到几分钟,甚至产品经理也可以自助完成。5.熟悉数据分析工具。SQL会不会对常用的统计分析工具有足够的了解?6.通过数据为业务带来价值的体验。

内容来源:数据分析网,以上内容来源于网络,不代表本站观点,如有侵权,请联系删除。

最新文章