导航:首页 > 免费资讯 > 以下哪些站点可以获得免费开源数据集

以下哪些站点可以获得免费开源数据集

发布时间:2023-08-17 20:02:57

❶ github上有哪些开源的python机器学习

1. Scikit-learn
Scikit-learn 是基于Scipy为机器学习建造的的一个Python模块,他的特色就是多样化的分类,回归和聚类的算法包括支持向量机,逻辑回归,朴素贝叶斯分类器,随机森林,Gradient Boosting,聚类算法和DBSCAN。而且也设计出了Python numerical和scientific libraries Numpy and Scipy
2.Pylearn2
Pylearn是一个让机器学习研究简单化的基于Theano的库程序。
3.NuPIC
NuPIC是一个以HTM学习算法为工具的机器智能平台。HTM是皮层的精确计算方法。HTM的核心是基于时间的持续学习算法和储存和撤销的时空模式。NuPIC适合于各种各样的问题,尤其是检测异常和预测的流数据来源。
4. Nilearn
Nilearn 是一个能够快速统计学习神经影像数据的Python模块。它利用Python语言中的scikit-learn 工具箱和一些进行预测建模,分类,解码,连通性分析的应用程序来进行多元的统计。
5.PyBrain
Pybrain是基于Python语言强化学习,人工智能,神经网络库的简称。 它的目标是提供灵活、容易使用并且强大的机器学习算法和进行各种各样的预定义的环境中测试来比较你的算法。
6.Pattern
Pattern 是Python语言下的一个网络挖掘模块。它为数据挖掘,自然语言处理,网络分析和机器学习提供工具。它支持向量空间模型、聚类、支持向量机和感知机并且用KNN分类法进行分类。
7.Fuel
Fuel为你的机器学习模型提供数据。他有一个共享如MNIST, CIFAR-10 (图片数据集), Google’s One Billion Words (文字)这类数据集的接口。你使用他来通过很多种的方式来替代自己的数据。
8.Bob
Bob是一个免费的信号处理和机器学习的工具。它的工具箱是用Python和C++语言共同编写的,它的设计目的是变得更加高效并且减少开发时间,它是由处理图像工具,音频和视频处理、机器学习和模式识别的大量软件包构成的。
9.Skdata
Skdata是机器学习和统计的数据集的库程序。这个模块对于玩具问题,流行的计算机视觉和自然语言的数据集提供标准的Python语言的使用。
10.MILK
MILK是Python语言下的机器学习工具包。它主要是在很多可得到的分类比如SVMS,K-NN,随机森林,决策树中使用监督分类法。 它还执行特征选择。 这些分类器在许多方面相结合,可以形成不同的例如无监督学习、密切关系金传播和由MILK支持的K-means聚类等分类系统。
11.IEPY
IEPY是一个专注于关系抽取的开源性信息抽取工具。它主要针对的是需要对大型数据集进行信息提取的用户和想要尝试新的算法的科学家。
12.Quepy
Quepy是通过改变自然语言问题从而在数据库查询语言中进行查询的一个Python框架。他可以简单的被定义为在自然语言和数据库查询中不同类型的问题。所以,你不用编码就可以建立你自己的一个用自然语言进入你的数据库的系统。
现在Quepy提供对于Sparql和MQL查询语言的支持。并且计划将它延伸到其他的数据库查询语言。
13.Hebel
Hebel是在Python语言中对于神经网络的深度学习的一个库程序,它使用的是通过PyCUDA来进行GPU和CUDA的加速。它是最重要的神经网络模型的类型的工具而且能提供一些不同的活动函数的激活功能,例如动力,涅斯捷罗夫动力,信号丢失和停止法。
14.mlxtend
它是一个由有用的工具和日常数据科学任务的扩展组成的一个库程序。
15.nolearn
这个程序包容纳了大量能对你完成机器学习任务有帮助的实用程序模块。其中大量的模块和scikit-learn一起工作,其它的通常更有用。
16.Ramp
Ramp是一个在Python语言下制定机器学习中加快原型设计的解决方案的库程序。他是一个轻型的pandas-based机器学习中可插入的框架,它现存的Python语言下的机器学习和统计工具(比如scikit-learn,rpy2等)Ramp提供了一个简单的声明性语法探索功能从而能够快速有效地实施算法和转换。
17.Feature Forge
这一系列工具通过与scikit-learn兼容的API,来创建和测试机器学习功能。
这个库程序提供了一组工具,它会让你在许多机器学习程序使用中很受用。当你使用scikit-learn这个工具时,你会感觉到受到了很大的帮助。(虽然这只能在你有不同的算法时起作用。)
18.REP
REP是以一种和谐、可再生的方式为指挥数据移动驱动所提供的一种环境。
它有一个统一的分类器包装来提供各种各样的操作,例如TMVA, Sklearn, XGBoost, uBoost等等。并且它可以在一个群体以平行的方式训练分类器。同时它也提供了一个交互式的情节。
19.Python 学习机器样品
用亚马逊的机器学习建造的简单软件收集。
20.Python-ELM
这是一个在Python语言下基于scikit-learn的极端学习机器的实现。

❷ 免费数据库有哪些

常用数据库
1. IBM 的DB2
作为关系数据库领域的开拓者和领航人,IBM在1997年完成了System R系统的原型,1980年开始提供集成的数据库服务器—— System/38,随后是SQL/DSforVSE和VM,其初始版本与SystemR研究原型密切相关。DB2 forMVSV1 在1983年推出。该版本的目标是提供这一新方案所承诺的简单性,数据不相关性和用户生产率。1988年DB2 for MVS 提供了强大的在线事务处理(OLTP)支持,1989 年和1993 年分别以远程工作单元和分布式工作单元实现了分布式数据库支持。最近推出的DB2 Universal Database 6.1则是通用数据库的典范,是第一个具备网上功能的多媒体关系数据库管理系统,支持包括Linux在内的一系列平台。
2. Oracle
Oracle 前身叫SDL,由Larry Ellison 和另两个编程人员在1977创办,他们开发了自己的拳头产品,在市场上大量销售,1979 年,Oracle公司引入了第一个商用SQL 关系数据库管理系统。Oracle公司是最早开发关系数据库的厂商之一,其产品支持最广泛的操作系统平台。目前Oracle关系数据库产品的市场占有率名列前茅。
3. Informix
Informix在1980年成立,目的是为Unix等开放操作系统提供专业的关系型数据库产品。公司的名称Informix便是取自Information 和Unix的结合。Informix第一个真正支持SQL语言的关系数据库产品是Informix SE(StandardEngine)。InformixSE是在当时的微机Unix环境下主要的数据库产品。它也是第一个被移植到Linux上的商业数据库产品。
4. Sybase
Sybase公司成立于1984年,公司名称“Sybase”取自“system”和 “database” 相结合的含义。Sybase公司的创始人之一Bob Epstein 是Ingres 大学版(与System/R同时期的关系数据库模型产品)的主要设计人员。公司的第一个关系数据库产品是1987年5月推出的Sybase SQLServer1.0。Sybase首先提出Client/Server 数据库体系结构的思想,并率先在Sybase SQLServer 中实现。
5. SQL Server
1987 年,微软和 IBM合作开发完成OS/2,IBM 在其销售的OS/2 ExtendedEdition 系统中绑定了OS/2Database Manager,而微软产品线中尚缺少数据库产品。为此,微软将目光投向Sybase,同Sybase 签订了合作协议,使用Sybase的技术开发基于OS/2平台的关系型数据库。1989年,微软发布了SQL Server 1.0 版。
6. PostgreSQL
PostgreSQL 是一种特性非常齐全的自由软件的对象——关系性数据库管理系统(ORDBMS),它的很多特性是当今许多商业数据库的前身。PostgreSQL最早开始于BSD的Ingres项目。PostgreSQL 的特性覆盖了SQL-2/SQL-92和SQL-3。首先,它包括了可以说是目前世界上最丰富的数据类型的支持;其次,目前PostgreSQL 是唯一支持事务、子查询、多版本并行控制系统、数据完整性检查等特性的唯一的一种自由软件的数据库管理系统.
7.mySQL
mySQL是一个小型关系型数据库管理系统,开发者为瑞典MySQL AB公司。在2008年1月16号被Sun公司收购。目前MySQL被广泛地应用在Internet上的中小型网站中。由于其体积小、速度快、总体拥有成本低,尤其是开放源码这一特点,许多中小型网站为了降低网站总体拥有成本而选择了MySQL作为网站数据库。MySQL的官方网站的网址是: www.mysql.com

转自别人的

❸ 请问有免费的大数据分析平台吗


思迈特软件Smartbi致力于为企业客户提供一站式商业智能解决方案。Smartbi适用于企业级数据分析,帮助企业将异构系统的数据取数到统一的数据仓库中。

Excel更多是个人办公数据处理工具。做企业级的商业数据分析,通常数据来自不同的业务系统,需要数据工程师整合到数据仓库或者介入大数据平台,然后清洗、在输出到数据层工前端的数据分析。整个过程涉及到业务部分——业务数据库——数据仓库——数据/BI部门——业务部门。而Smartbi可以连接企业数据库、数据清洗、整合数据,利用细致的权限分发数据和图表看板,多人合作形成可视化报告。

BI软件数据处理指的是在数据分析之前对数据进行清洗(extract)、转换(transform)、加载(load),简称ETL。源数据可能来自不同的业务系统,它们有不同的数据格式,也包含一些冗余的信息。ETL负责将分散的、异构数据源中的数据如关系数据、平面数据文件等抽取到临时中间层后,进行清洗、转换、集成,最后加载到数据仓库或数据集市中,成为联机分析处理、数据挖掘提供决策支持的数据。
我们使用excel做数据计算的时候,往往需要用户进行大量复杂繁琐的的平面单元格公式计算,而用Smartbi进行数据分析时,我们直接在搜索页面输入想要分析的内容,通过AI人机对话,系统自动分析出可视化图,图表也是根据分析情况自动给推荐的。Smartbi自然语言分析基于预训练的语言模型,赋予智能机器人(下文简称小麦)强大的语言解析能力,能快速的将对应的信息反馈给用户,致力于帮助用户更智能的进行大数据分析,以推动业务发展和产业升级。
用户可在系统通过语音或者文字输入的方式传递自然语言,Smartbi会自行解析后将对应业务主题的数据分析结果或者对应的问答信息反馈给用户,提供了更智能的用户交互方式,极大的简化了数据分析的过程。用户也可在前端对小麦反馈的结果进行核实,提供对应的信息给小麦自动调优。

思迈特软件Smartbi经过多年持续自主研发,凝聚大量商业智能最佳实践经验,整合了各行业的数据分析和决策支持的功能需求。满足最终用户在企业级报表、数据可视化分析、自助探索分析、数据挖掘建模、AI智能分析等大数据分析需求。

思迈特软件Smartbi个人用户全功能模块长期免费试用
马上免费体验:Smartbi一站式大数据分析平台

❹ 免费的java快速开发平台有哪些

一、方正集团

二、ES2007
1、ES2007介绍
方正飞鸿智能信息平台(Fix ES2007)是方正集团推出的国内领先企业基础架构中间件平台。Fix ES2007平台基于SOA架构体系,结合数据建模、业务建模、可视化流程引擎、动态表单设计等多种实现工具,其柔性的特点,保障了基于ES2007平台开发的系统可在.net平台与j2ee平台上无缝的切换运行,是企业应用开发的一个高效、强大、开放的开发工具。

2、ES2007技术特点
•高效的平台业务逻辑扩展
•组织机构设置和权限机制
•强大的工作流引擎和任务监控,协同机制
•应用部署以及模块运行,升级,管理机制
•强大的工作流引擎
•图形化工作流程设计
•所见即所得表单设计
•完善安全的权限分配体系

3、产品特性
•大并发海量数据的支撑
•即时通讯工具的外网通讯
•即时通讯工具的平台开发性
•全面的SOA 支持
•流程引擎标准化、性能更优
•全面的数据库支持(Oracle,Sqlserver,DB2,Sybase,Mysql)
•全面的WEB 服务器支持(iis,tomcat,websphere,weblogic,jboss,glassfish,apusic)
•全面的AJAX 技术的运用
•全面的浏览器支持(IE,FireFox,Chrome)
•富客户端技术的支持(Flex,silverlight)
•平台接口更标准,更易用

4、产品组件
•业务逻辑 建模工具 Studio
•流程引擎 Workflow
•表单设计 Formdesign
•数据库工具 DTS
•即时通讯 MSQ
•统一界面管理 Portal
•多种主题管理 Theme
•快速高效的代码开发框架 SDK
•企业应用集成EAI
•业务流程管理BPM
•面向服务架构 SOA

5、特色创新
• 快速开发性
开发效率提升高达70%、10 分钟可以完成一个流程全过程开发、1 天可以完成一个小型应用(如OA 办公系统)。
• 企业信息管理特征组件
封装了大量的企业信息管理不同行业的特征组件和业务模型,让使用者更关注于业务,从而使其从技术中解放出来,能迅速的构架用户的业务系统。
• 跨语言
可以无缝的在C#和JAVA 语言中切换,可以顺利的在.Net 和J2EE 平台上切换,是全球唯一款支持跨语言的中间件平台。大多数软件公司在为用户服务时往往会被用户左右,而用户很多情况会对需求发生变更,而对语言的变更也不在少数,而一旦发生,对与开发商来说将是致命的,因为语言是不互通的,换一门系统的开发语言,将会把系统的工作量放大两倍,而使用本平台,这些问题将不复存在。
• 多数据库
支持主流关系型数据库,如Oracle,Sqlserver,DB2,Sybase,Mysql。
• 跨平台
支持多操作系统,如WINDOWS,LINUX,UNIX,使用户部署时不用再关心终端服务器,只需要关注用户系统的业务开发即可。

6、案例
【支持的平台技术和产品】
FIX ES2007业务基础平台支持广泛的平台、系统和应用技术,构建在ES2007业务平台上的业务系统,具有最广泛的技术兼容性和可扩展性:
•操作系统支持
支持如下网络操作系统:NT,UNIX,Linux等。
支持如下客户端:WindowsXP及更高版本,浏览器IE6.0及更高版本。
•数据库支持
支持如下数据库接口:ODBC,JDBC,BADO。
支持Oracle 9i 及更高版本、SQL Server 2000及更高版本等数据库。
•组件和总线支持
支持如下组件和总线标准:COM,ActiveX,OLE,.Net。

•分布计算和服务支持
支持如下分布计算和服务技术:DCOM,EJB(J2EE)。
支持如下分布计算支撑环境:.Net、BEA WebLogic、IBM WebSphere等。
•Web服务支持
支持如下Web服务支持技术:Serverlet,ISAPI/NSAPI。
支持如下主流Web服务器产品:MS IIS、BEA WebLogic、IBM WebSphere等。
•网络和应用协议
支持多种应用协议,包括:
通讯协议:HTTP、TCP/IP
邮件协议:SMTP,POP3
应用协议:DCOM、EJBIIOP、EJBRMI

基于FastUnit平台实现快速开发:可视化、无代码、快速开发。

三、J-HI是一款JAVA WEB应用软件快速开发开源平台,
主要服务于软件企业和传统行业企事业单位信息中心的开发人员,为他们提供一套完整的一站式的JAVA WEB应用软件快速开发解决方案。
平台包括如下几个部分:
1、J-HI平台集成环境:J-HI团队开发了一个集成开发环境J-HI Studio,在此集成开发环境之上,开发人员能够快速搭建自己的开发环境,创建自己的模型,快速生成代码。
2、核心框架:平台为Java代码与JS代码之间提供了一套完整的面向对象的核心框架支撑系统,可以认为这是一个抽象层,无论是在页面表现上,还是 在 CURD的任意一层,平台均提供了最大限度的抽象。用以保证平台本身的可扩展性、稳定性及灵活性。J-HI平台中提供了大量的API(Java与JS),为用户在开发过程中随需调用,从而进一步加快开发速度,保证代码质量。
3、业务平台功能:包括权限管理、组织结构、枚举管理、国际化管理、任务管理、日志管理、Excel报表管理、消息管理等。
4、工作流:包括工作流引擎及流程编辑器等。

具体资料参考地址:http://fei-6666.iteye.com/blog/993452

阅读全文

与以下哪些站点可以获得免费开源数据集相关的资料

热点内容
电脑上怎么下载班智达的软件 浏览:1128
无痕迹消除图片软件 浏览:694
免费小票软件 浏览:928
华为在哪里设置软件停止运行 浏览:938
用电脑键盘调节声音大小 浏览:1234
自动刷软件赚钱 浏览:1238
古装连续剧免费版 浏览:1393
工免费漫画 浏览:1127
手机软件专门储存文件 浏览:1485
uos如何用命令安装软件 浏览:1288
有线耳机插电脑麦克风 浏览:629
侏罗纪世界3在线观看完整免费 浏览:974
单个软件怎么设置名称 浏览:700
凤凰网电脑版下载视频怎么下载视频怎么下载 浏览:1359
明白之后如何免费获得无人机 浏览:810
如何解禁软件菜单 浏览:823
副路由器连接电脑视频 浏览:1331
内置wifi电视如何装软件 浏览:1075
手机换零免费雪碧 浏览:1565
国行苹果如何下载美版软件 浏览:1184