数据库

注册

 

发新话题 回复该主题

数据库在数据分析中是怎么应用的 [复制链接]

1#

  那首先简单介绍一下非关系型数据库的优点——易扩展、数据量大、性能高、数据库结构简单。这些优点决定了它在架构的层面上的可扩展能力非常强,读写性能也很高,尤其是数据之间的无关系性,这也是其区别于关系型数据库的最大特点。

关系型数据库的特点在于储存方式采用表格的方式,白用结构化的方式存储数据,为了避免重复、规范化数据以及充分利用好存储空间,把数据按照最小关系表的形势进行存储,这样数据管理的就可以变得非常清晰和一目了然。同时关系型数据库只具备纵向扩展能力,扩展的空间也是有限的,因此在数据分析和数据处理中需要格外注意。


  另外,虽然关系型数据库存储数据和处理数据的可靠性很不错,但是一旦面对海量数据的处理的时候效率就会变得很差,特别是遇到高并发读写的时候性能就会下降,那么在面对海量数据进行大数据分析的时候,就要格外注意在读写的进程当中。


  那数据分析师每天都会使用各种不同的语言编写几千个查询,运行在Mode编辑器里的查询超过百万个,那一般用MySQL、PostgreSQL、Redshift、SQLServer、BigQuery、Vertica、Hive和Impala这几个,由此可见数据库的应用在数据分析的过程中是举足轻重的。

预览时标签不可点收录于话题#个上一篇下一篇
分享 转发
TOP
发新话题 回复该主题