数据科学家都在用哪些类型的工具?
2021-01-06 09:56:03 阅读(175) 评论(0)
摘要:工具/产品/解决方案是数据科学家洞察数据的利器。KDNugets网站对这一观点进行了年度调查,分析了数据科学家使用的工具类型,并提供了匿名的原始数据。通过主成分析(PCA)法律降维分析同时分析所有工具的关系。一般来说,PCA通过统计大样本数据的性质(eg,分析协方差),试图用主要特征来解释关系。分析结果:目前分析的目标是通过一些主要成分来分析95种工具之间的关系。主要成分的数量最终由PCA的特征值决定。这里有两条规则:一条是根据特征值大于1的特征值数量选择主要成分的数量;一种是绘制陡坡图(screeplot),通过95个特征值,你会发现拐点的特征值。特征点陡坡图显示在第13和第14特征点时的拐点。因此,这里选择的13个主要成分可以解释它们之间的关系,如下图所示。(点击查看大图)根据主成分析列出了13种工具(投票数大于20):大数据生态(Hadoop、Spark)和开源项目:Hadoop,HBase,Hive,Mahout,MLlib,OtherHadoop/HDFS-basedtools,Pig,Scala,Spark,SQLonHadoptols微软数据科学家工具:MicrosoftAzureML,MicrosoftPowerBI,MicrosoftSQLServer,基于Python的RevolutionAnalytics机器学习:Dataiku,H2O(0xdata),Python,scikit-learn,Theano,VowpalWabitSAS公司产品:JMP,SASBase,SASEnterpriseMinerMATLAB、R语言等统计工具:GnuOctave,MATLAB,Orange,R,RapidMiner,Rattle,WekaIBM产品:IBMCognos,IBMSPSSModeler,IBMSPSSStatistics,IBMWatsonalyticslinux工具和SQLang:Actian,C/C ,Perl,SQLang,Unixshell/awk/gawk深度学习:Caffe,Pylearn2商务智能软件:PentahoandQlikView数据分析平台:DatamerandZementisexcel和Word统计工具:XLStataterexcel其他:OtherDeepLearningtools,Otherfreeanalytics/dataminingtools,OtherHadoop/HDF-basedtools,Otherpaidanalytics/datamining/datasciencesoftware,Otherprograminglanguages数据可视化:C4.5/C5.0/See5,Miner3D,在选择大数据、数据挖掘和数据分析工具时,Oracledataminer总结数据科学家更喜欢有一定生态基础的工具,这样每个工具都可以相互支持。选择正确的工具来提高大数据项目的成功机会是非常重要的。为了提高大数据项目的成功机会,选择正确的工具是非常重要的。没有孤立的工具可以进行所有的数据分析,专业的数据专家倾向于使用不止一种相关的工具(发现数据专家平均使用5种数据分析工具)。您可以根据使用相关工具的数据专家来决定您的选择。另一种观点是选择大厂的产品,比如,IBM、大品牌的微软和SAS产品更丰富,可以让你的产品更容易扩展。
推荐阅读
猜你喜欢
最新文章
扫码二维码
立即领取《千元实战营销秘籍》
还可免费试用营销管理系统
*如有疑问,请随时拨打免费咨询热线:400-0033-166
服务时间:8:30-18:00
软件企业
认定号:川RQ-2018-0216
高新技术企业
认定号:GR201951001121
关注微信公众号
和10万中小企业共同成长
扫码下载APP
享全方位服务一触即达
Copyright © 2004-2022 万商云集(成都)科技股份有限公司 版权所有 蜀ICP备12001963号-2 川公网安备 51010402000322号
快速找产品
找一找哪款产品适合您?
咨询热线:400-0033-166
免费查找信息保护中请放心填写-
-
电话沟通
在线咨询
获取方案
下载APP
官方微信
扫码下载APP
全方位服务一触即达
关注万商云集
和10万中小企共成长
TOP
企业首选的数字选用平台