我应该将哪个库用于大数据项目[关闭]

     2023-04-18     26

关键词:

【中文标题】我应该将哪个库用于大数据项目[关闭]【英文标题】:which library should I use for big data project [closed] 【发布时间】:2013-11-24 05:29:55 【问题描述】:

该项目旨在使用大数据技术分析患者的疾病细胞,以表明哪些治疗可以产生最好的结果和最少的副作用。

但我认为使用 python 或 java 库。我无法决定哪种语言的库对我的项目更有用。如果你有任何经验,你能帮帮我吗?我对大数据一无所知。

【问题讨论】:

什么是“病人的病细胞”,“大数据技术”对您来说意味着什么? 疾病是项目细节的总称。大数据技术意味着巨大的数据。我研究最有效的方法 【参考方案1】:

查看Anaconda。它几乎将大数据分析所需的每个库都捆绑到一个安装程序中。

Anaconda 发行版还包括 Disco MapReduce,因此您拥有设置分布式文件系统 MapReduce 场以执行大型分析作业所需的所有工具。

【讨论】:

非常感谢。所以你说python更有用吗? 你可以使用python或java。如果你使用 java,你会想要深入研究 Hadoop。 Java/Hadoop 解决方案比 Disco/python 有更多的主流使用,但学习曲线也更陡峭。

用于桌面应用程序开发的java框架[关闭]

...,我需要使用Java开发桌面应用程序。现在,我面临着我应该使用哪个框架的决定。有什么优秀的吗?我已经在这个论坛中搜索过已经完成的不同问题,但大多数是2014年或更早的时候。答案正如@StephaneM告诉这个话题。无论如何你... 查看详情

我应该使用哪个 C++ GUI 库

】我应该使用哪个C++GUI库【英文标题】:WhichC++GUIlibraryshouldIuse【发布时间】:2012-11-2011:45:39【问题描述】:我正在开发一个细分工具(用于研究目的,不用于商业用途),我想知道应该使用哪个图形用户界面,因为有很多。我... 查看详情

大数据项目1(数据预处理问题)(代码片段)

数据预处理一、了解什么是预处理二、为什么要进行预处理三、数据预处理基本方法1、基础方法四、应用1.准备数据2.导入库3.导入数据集4.数据清洗——查看缺失值(1)处理普通空值(2)处理年龄年份金额等数... 查看详情

这个场景是大数据项目吗?

】这个场景是大数据项目吗?【英文标题】:Isthisscenarioabigdataproject?【发布时间】:2016-07-1518:10:00【问题描述】:我参与了一个分两个阶段的项目,我想知道这是否是一个大数据项目(我是这个领域的新手)在第一阶段我有这种... 查看详情

我应该使用哪个库在 Node.JS 上进行服务器端图像处理? [关闭]

】我应该使用哪个库在Node.JS上进行服务器端图像处理?[关闭]【英文标题】:WhichlibraryshouldIuseforserver-sideimagemanipulationonNode.JS?[closed]【发布时间】:2012-05-2808:33:10【问题描述】:我在Node.JSwiki上找到了一个相当largelistofavailablelibrar... 查看详情

哪个库用于视频和音频录制? [关闭]

】哪个库用于视频和音频录制?[关闭]【英文标题】:Whichlibraryforvideoandaudiorecording?[closed]【发布时间】:2011-08-0322:18:47【问题描述】:我正在寻找一个库来记录来自网络摄像头的图像和来自麦克风的声音并生成视频文件(avi、mpe... 查看详情

上传包含密钥的 django 项目时,我应该使用哪个 gitignore 文件? [关闭]

】上传包含密钥的django项目时,我应该使用哪个gitignore文件?[关闭]【英文标题】:whichgitignorefileshalliusewhenuploadingadjangoprojectwhichcontainasecretkey?[closed]【发布时间】:2020-12-3013:17:36【问题描述】:我是GitHub新手:我上传了一个没有... 查看详情

大数据分析师题库整理(partone)

Day0116.下列哪个属性是hdfs-site.xml中的配置dfs.replication17.以下不属于监督学习模型的是关联分析18.以下四项指标中,不能用于线性回归中的模型比较的是R方19.以下选项不属于原始数据来源的是统计年鉴20.以下选项哪个不属于分... 查看详情

> 100 mio 的大数据项目选择哪种数据模型。项目

】>100mio的大数据项目选择哪种数据模型。项目【英文标题】:Whichdatamodeltochooseforbigdataprojectwith>100mio.items【发布时间】:2016-05-0413:31:43【问题描述】:我正在从事一个大数据项目,从不同的在线卖家那里收集大量产品信息,... 查看详情

大数据项目组-月度考核汇报0102

目录01-2023年02月-月度考核汇报2月份完成项目情况2月份学习情况3月份学习计划老师点评02-2023年03月-月度考核汇报项目完成情况本月学习内容下月学习计划老师点评01-2023年02月-月度考核汇报2月份完成项目情况MySQL数据同步到Elasti... 查看详情

客快物流大数据项目:docker的迁移与备份(代码片段)

Docker的迁移与备份一、容器保存为镜像可以通过以下命令将容器保存为镜像dockercommitmynginxmynginx_image基于新创建的镜像创建容器dockerrun-di--name=mynginx2-p81:80mynginx_image访问81端口二、镜像备份可以通过以下命令将镜像保存为tar文... 查看详情

sklearn 大数据线性回归

】sklearn大数据线性回归【英文标题】:sklearnlinearregressionforlargedata【发布时间】:2014-05-0507:08:22【问题描述】:sklearn.LinearRegression是否支持在线/增量学习?我有100组数据,我正在尝试完全实现它们。对于每个组,有超过10000个实... 查看详情

客快物流大数据项目(七十六):使用impala对kudu进行dml操作

文章目录使用Impala对kudu进行DML操作一、将数据插入Kudu表 查看详情

客快物流大数据项目:大数据项目为什么使用docker

目录大数据项目为什么使用Docker一、场景一二、场景二三、场景三大数据项目为什么使用Docker随着大数据平台型产品方向的深入应用实践和Docker开源社区的逐渐成熟,业界有不少的大数据研发团队开始使用Docker。简单来说... 查看详情

客快物流大数据项目(八十四):impala优化

 文章目录Impala优化一、​​​​​​​Impala关键配置二、Impala查询分析三、​​​​​​​​​​​​​​Impala优化思路Impala优化一、​​​​​​​​​​​​​​Impala关键配置分配给此角色的内存软限制,由Linux内核强... 查看详情

我应该将所有项目存储在一个存储库中还是多个存储库中?

】我应该将所有项目存储在一个存储库中还是多个存储库中?【英文标题】:ShouldIstoreallprojectsinonerepositoryormultiple?【发布时间】:2010-09-1222:14:48【问题描述】:我目前正在使用TortoiseSVN来管理我目前正在进行的几个项目。当我第... 查看详情

Dockerfile 应该提交到哪个代码存储库?

】Dockerfile应该提交到哪个代码存储库?【英文标题】:Whatcode-repositoryshouldtheDockerfilegetcommittedto?【发布时间】:2019-12-1812:24:17【问题描述】:长话短说我应该在哪里提交Dockerfile?在项目代码库中还是在devops代码库中?推理细节... 查看详情

我应该使用哪个函数将非结构化文本文件读入 R? [关闭]

】我应该使用哪个函数将非结构化文本文件读入R?[关闭]【英文标题】:WhichfunctionshouldIusetoreadunstructuredtextfileintoR?[closed]【发布时间】:2013-11-1122:34:00【问题描述】:这是我在这里的第一个问题,我是R新手,试图弄清楚如何进... 查看详情