转数据挖掘需要掌握哪些基本技能?
2021-01-05 13:48:52 阅读(217) 评论(0)
无论是数据分析师还是数据挖掘工程师,我们的目标都是了解数据,从数据中找到所需的信息。做数据分析所需的技能,统计知识肯定是必要的,Excel、SPSS、R等是需要掌握的基本技能。我做数据挖掘,所以我专注于数据挖掘的技能。我主修数学,接触数学更多。数据挖掘需要一定的数学知识,如线性代数、高等代数、凸优化、概率论等。例如,简单的贝叶斯算法需要概率知识,SKM算法需要高代数或区间论知识。当然,您可以直接设置模型,R、Python有现成的算法包,可以直接应用。但是如果你想深入学习这些算法,最好是学习一些数学知识,也会让你以后的道路更加顺畅。我们经常使用的语言包括python、Java、C或者C ,我更多地使用Python或Java。有时用Mapreduce写程序,然后用Hadop或Hyp处理数据,如果使用Python,它将与Spark相结合。工作内容的数据分析更倾向于统计分析,绘制图片,做更多的报告,做一些显示。知乎上有一个回答者叫团支书,他更喜欢数据分析。数据挖掘更倾向于建模。例如,我们做百货公司的数据分析。万达电子商务的数据非常大,项目组需要决定具体要做什么。我们从这一点入手,思考百货数据能给我们什么样的业务推广。我们从中挑出一部分用户分组。消费者在商场购物时会有刷卡的数据记录,万达会员卡的卡号信息和购物记录也会出现在数据中,数据量很大。我们使用这些数据进行分类,并将其分为几个用户组,例如偏爱亲子、时尚女装和奢侈品、汽车配件等。分组后向他们推荐相对容易。我们将使用一些聚类模型作为用户分组,如K-means、K-means 等等,处理数据的维度特别大,是300w*142维。如果全部用于聚类,效果不是很好,因为有些毫无意义,所以我们会降低维度。主要成分分析通常用于降维,我们使用深度学习的算法——AutoEncoder。它有一个输入层、一个隐含层和一个输出层。当数据从输入层进入时,它将被编码,当它从输出层出来时,它将被解码。例如,我们灌输142维数据,将隐含层降低到50维数据,输出或142维数据。也就是说,将最初的142维数据投射到50维数据中,然后恢复到142维,这与之前的142维数据相同,所以我们可以使用中间的50维数据进行聚类分析。最后,我们得到了一个评估指标。您可以理解,该指标值越小越好。越小,每个值越接近中心。如果不需要深度学习算法,评价指标在20万左右,降维后得到600多个指标,效果非常显著。我也想告诉你,如果你没有数学知识,你只需要设置一个模型,但总是停留在入门阶段。如果你想成为一名数据挖掘工程师,我建议至少有一种编程语言,数学至少需要线性代数、概率论和突出优化知识,了解一些机器学习算法的推导和深度学习算法。这个学习起来并不特别困难,我从毕业到现在已经有一年的时间了,有些基本算法几乎已经知道了。每个人都有自己的发展偏好。有人会说数学太难了,我不想挖掘,只想做一些数据分析,做一些很酷的分析图,这当然是可以的。如果你想在你的职业生涯中取得长足的进步,不要贪多贪杂,深入某个领域。在那个领域,你可以结合自己的兴趣成为专家。提高自己的技术和业务能力。技术能力相对容易提高,学习R或Python等简单语言非常快,Java或Ca 会比较慢。当技术能力提高到一定程度时,很难与他人有技术差异。也许工作一年的时候,你只会R,两三年后你就会知道相关的工具和技术。这个时候,你和其他同事的区别在于你的专业能力。很多做技术的人一开始会觉得技术很厉害,但是光有技术并不能让你成为公司的核心成员,所以你必须提高自己的业务能力。如果你的技术结果与业务无关,对公司没有好处,除非你是研究人员,否则领导者不会想要这个结果。学校招聘渠道更注重学位,但随着工作经验的增加,你的技术已经达到了一定的水平,你是两三本书实际上和985毕业的人没有太大的不同。当然,对于应届毕业生来说,学历高的学校更有优势,这是大厂的敲门砖。还有人会问是否需要考研。研究生入学考试应该与你未来的工作道路相结合。如果你想进行数据挖掘,你可以选择参加数学专业的研究生考试,这可以提高你的竞争力。根据我的经验,我的本科生是湖北一所非常普通的学校,研究生申请武汉大学的计算数学专业。但由于两分之差,基础数学被调整。当时家里人劝我服从调剂,至少研究生是武大出来的。然而,我对基础数学不感兴趣,这个专业也不能给我想从事的数据挖掘加分。最好在工作中积累一些实践经验,所以我放弃了研究生学习。如果工作几年后需要提高能力,可以再考研,现在不用考了。现在这个行业越来越受欢迎,很多人都想转行做数据分析。转行学习数据分析师是可以的,但是最好先看看招聘单位的工作内容,如果招聘要求了解PPT、不要考虑Excel之类的,因为这通常招聘统计师,而不是分析师,这对你的职业道路没有太大帮助。如果要求Python,、R或者建模,你可以试试。也许别人不一定想要你,但如果你表现出足够的诚意和自学能力,你仍然有机会被录用。当我在大学学习数学时,我只学习了MATLAB。我学了不到一年。当时,我在学校参加了MATLAB建模比赛,并获得了一等奖。我觉得我很棒。但是在找工作的时候发现很多公司不需要MATLAB或者SAS,因为比较贵,很多都会使用开源R。在采访中,我说我不知道R是什么,领导说,给你两周,学习。后来,我在工作中读了一点书,然后开始了。跳到第四个问题,选择数据分析或数据挖掘很多人认为数据挖掘非常强大,但跳到数据挖掘是不可能的。数据挖掘需要较深的代码技能。起初,我不会写代码。毕业后,我去了一家公司。Title是一名中级数据分析师,但我做的是数据挖掘。在刚入职的一个月内,老板让我用Python得出结果。我以前没有学过Python,我边学边做,所以我也学会了Python。后来,我在这家公司做了一个垃圾文本分类项目。我以前从未接触过这方面。我一边查资料一边自己做。刚开始用公式套,准确率只有80%左右。我开始看公式的推导。了解公式原理后,我知道有些地方可以选择最好的,我可以改进算法。不仅要设置公式,还要了解公式推导,了解源代码,慢慢提高自己的代码能力。当然,如何选择大公司是最好的。大公司一般采取学校招聘,如果你通过学校招聘大公司,但非核心职位,如百度搜索挖掘,当然是最好的,如果不能进入这样的职位,最好去一些新开发的公司,如美团,滴滴,这样的公司有一定数据,会有一些强大的人。第三类公司是初创公司。如果刚毕业,最好不要选择创业公司,风险比较大。从表面上看,很难判断这家公司是否能生存,是否有牛人值得跟随。一些二线公司的业务骨干大多来自BAT,经验丰富。向他们学习可以让他们快速成长。如何面试一定要诚实。不要伪造工作经验和年限,没必要,对自己不好。毕业生在求职时可以表现得真诚一点,不能说一开始就能做很多工作,但能表现出自己的学习能力。我不是一开始就做数据挖掘的,而是在工作中慢慢转。假如你真的想做这个生意,就要有决心,不要着急。讲个小故事。当时想转数据挖掘的时候,不知道是选Java还是Cava。 。当时我投入了很多数据挖掘岗位。我知道通过面试的可能性不大,但我和面试官聊天,询问我的经验。我说我毕业于数学专业。如果我想成为一名数据挖掘工程师,我需要掌握哪些能力。面试官画了一张图,一个圆代表数学,一个圆代表计算机。我们需要的是两个圆的交叉部分。如果编程语言快,可以先学Java。;然后我问他需要看什么信息,等等。我们谈了将近一个小时。其实很多老人都很乐意和新人分享。多看看前人的经历,帮助自己成长,一定会在这个行业有所收获。
推荐阅读
- 线上行业如何更好的生存,找代运营公司?
在这个新媒体、淘宝京东等店铺等线上行业尤其火热的时代,人人都想挤进去创造一片属于自己的天地。然而不管是挤进去个人还是企业,更多都是一些完全不懂得如何运营的毫无经验的小白。于是找代运营公司、寻找靠谱的代运营公司,便成为了和线上行业同等火热的问…查看详情
- 会员管理系统哪个好?八大会员管理系统分享
如今吸引用户走进店铺并不是一件容易的事情,往往铺天盖地的广告才能使用户在产生购物需求时第一时间想到你的店铺或品牌,一个完善的会员管理系统对企业来说非常重要,你知道会员管理系统哪个好吗?以下八个品牌会员管理系统了解一下(排名不分先后)。 1.…查看详情
- 最新ai智能系统外呼排名
随着科技的发展,各种智能系统上市,在我们身边就有很多高科技出现。最让人熟悉不过的就是游戏。各大游戏内的人性化以及智能化也是一种智能系统的体现。这里为大家做了详细的关于ai智能系统外呼排名。 1.易网行ai智能系统外呼。深圳易网行AI电话机器…查看详情
- 财务管理软件都有哪些?推荐5个适合不同规模的企业
财务管理软件是指能有效提升财务工作人员工作效率,减少工作差错率的管理性软件。财务人员的工作琐碎、繁杂,尽管如此,对于财务人员的工作要求却是严谨的。所以一个认真负责的财务工作者,在工作上是会不断寻求好方法,让自己的工作能更加尽善尽美的。那么财…查看详情
- 2022年十大免费cms建站系统有哪些?
今天小编就跟大家盘点一下国内外比较知名的cms建站系统,告诉大家靠谱的cms建站系统有哪些,然后你可以从中选择最适合自己的。希望下面的cms系统你在建站的时候能用上。 1、AdobeAEM Adobe AEM功能可以说是非常强大的,…查看详情
- 实用的超市销售管理系统
随着现代科学技术的高速发展,计算机技术已经渗透到各个领域,成为各行业必不可少的工具。网络与信息化的普及已成为各行业发展不可缺少的东西。然而现在国内市场的一些中小型超市,它们在信息化过程中的步伐要落后于大中型超市,而对于这些企业的资源管理,信…查看详情
- 飞鱼crm软件好用吗
飞鱼CRM是一款知名的客户关系管理软件,广泛应用于企业的销售、市场营销和客户服务等领域。以下是对飞鱼CRM软件的评价和使用体验的综合分析:1. 功能丰富:飞鱼CRM提供了包括客户管理、销售管理、营销自动化、客户服务、报表分析等在内的多个功能…查看详情
- 免费好用的数据库软件有哪些 数据库软件排行榜
数据库客户端管理维护工具很多,除了系统自带的命令行管理工具之外,还有许多图形化管理工具,下面小编就给大家来详细介绍一下免费好用的数据库软件有哪些 数据库软件排行榜这一块的相关内容,希望能帮助到大家。, 数据库软件排行榜 1.Da…查看详情
- U盘数据恢复工具推荐,告别数据丢失烦恼
虽然现在很多东西都特别的方便,但是我们在工作的过程当中也是需要借助U盘的,因为U盘可以随身携带,不管是出差还是去哪里都可以直接用U盘把自己想要播放的内容播放出来,要要比直接另一个笔记本电脑要更加方便一些,那么U盘数据恢复软件有什…查看详情
- 最新版权登记收费标准
著作权中对于公司来说最常用的要数软件著作权了,那么申请一个软件著作权都需要什么材料呢,最关心的问题也就是版权登记收费标准,下面就让小编来为大家一一解答。 一、计算机软件著作权登记需要提供如下材料: 1、软件著作权登记申请表;2、说明书;3、…查看详情
- 推荐四部大众很喜欢的言情小说作品
现在的小说类型复杂多样,而言情小说经久不衰,也许是因为美好的爱情或者是美好的相遇,在现实生活中并不常见,所以人们才需要去言情小说中满足幻想。对于现在的女性们来说,言情小说的存在可以说是生命之光了。 1.何以笙箫默 《何以笙箫…查看详情
- 快手如何换绑手机号?(附上详细方法)
手机号是我们与外界联系的一个载体,当由于种种原因需要更换手机号码,我们需要解绑/注销一些账号,下面小编就给大家来详细介绍一下快手如何换绑手机号这一块的内容,希望能帮助到大家。 快手如何换绑手机号 1.当前绑定的手机号可以正常使用: …查看详情
- cssci期刊是什么意思
cssci期刊是什么?《中文社会科学引文索引》(cssci)由南京大学中国社会科学研究评价中心开发,是国家教育部重点课题攻关项目。cssci根据文献计量学规律,采用定量和定性评价相结合的方法,从全国2700多种中文人文社会科学学术期刊中评选…查看详情
- 实用的建筑工程管理软件,工作进展实时记录
对于做工程的人来说,每天的施工进度都是不相同的,但是,每天都做了些什么工作都需要统计下来,因为户主很有可能会跟我们要当日的工作进展报告的,所以,要记录,那么,建筑工程管理软件有什么? 1、筑业建筑资料软件最新版 是款对于建筑…查看详情
- 恐怖片排行榜前十名送给大家,让你的假期旅程不寂寞
假期一到就要去找片源了,找的那叫一个撕心裂肺啊,大部分看过了,或者不知道水平如何,这里小编就要毛遂自荐一下了,良心推荐的恐怖片排行榜前十名送给大家,让你的假期旅程不寂寞,恐怖片让你们兴奋起来。第一名:午夜凶铃午夜凶铃,十大顶级恐怖片之一,是…查看详情
猜你喜欢
最新文章
扫码二维码
立即领取《千元实战营销秘籍》
还可免费试用营销管理系统
*如有疑问,请随时拨打免费咨询热线:400-0033-166
服务时间:8:30-18:00
软件企业
认定号:川RQ-2018-0216
高新技术企业
认定号:GR201951001121
关注微信公众号
和10万中小企业共同成长
扫码下载APP
享全方位服务一触即达
Copyright © 2004-2022 万商云集(成都)科技股份有限公司 版权所有 蜀ICP备12001963号-2 川公网安备 51010402000322号
快速找产品
找一找哪款产品适合您?
咨询热线:400-0033-166
免费查找信息保护中请放心填写-
-
电话沟通
在线咨询
获取方案
下载APP
官方微信
扫码下载APP
全方位服务一触即达
关注万商云集
和10万中小企共成长
TOP
企业首选的数字选用平台