大数据小白对Bigdata的所见所闻所感

08月28日    2206    2    2

\n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n\n \n

作为一名学习大数据的在校大学生来说,大数据这三个字早已经耳熟能详了。除了在学校的专业课学习之外,我利用暑期的时间来到一家IT培训机构实习,想了解更多有关大数据的知识。

所谓大数据,百度百科上给的解释是,指无法在一定时间范围内用常规软件工具进行捕捉、管理和处理的数据集合,是需要新处理模式才能具有更强的决策力、洞察发现力和流程优化能力的海量、高增长率和多样化的信息资产。而在我看来,所谓大数据,就是将很多信息存储在一个平台里,这个平台就叫做数据库。数据库可以在用户有需求的时候,将这些数据提取出来,供用户使用。

实习给我安排的工作是编辑,表层意思好像与大数据并没有关系,但实际上这份工作每天需要浏览成千上万,甚至更多所有有关大数据、人工智能、黑科技等等这方面的文章。将这些文章美化,转载到网站上,供更多读者享用。在家的时候,每每打开这类题材的文章,我的耐心都不会迫使自己去把它阅读完,快速的扫一眼,就认为自己已经读懂了文章核心所在,其实并不然!这回工作所需,也不敢怠慢,久而久之,似乎喜欢上了这种阅读的乐趣。

\n \n

  在阅读过程中,有几篇文章让我对大数据有了新的看法。

  随着大数据的普及,越来越多的人对大数据有了自己的想法,那大家有了解过图数据分析吗?

\n \n

了解图数据分析之前,必须给大家普及一个新名词:图计算

  所谓图计算,就是去挖掘人、物和实体之间潜在的联系。但这些联系用传统的数据库很难表示出来,所以这也就引用新的方法:图数据分析。

  那么图数据分析有哪些特点呢?

1、包含节点和边

2、节点上有属性;

3、边有名字和方向,并总是有一个开始节点和一个结束节点;

4、边也可以有属性。

其实,在图数据库里,重点就是一个图(或网),而最终所取决的就是点到点的关系。而在传统关系型数据库中,是把所有有关系的属性放到一个表中,将这些有关系的表放到一个库里。而在图中,倘若这两个属性有关系,那么他们之间自然就会形成联系。相反,也就不会产生边,这样的话,自动就会将那些没有关系的点进行隔离,于是就形成了关系型数据库中一个个独立的库。

除了关系型数据库,图数据库,还有键值(Key-Value)存储数据库,这是一种NoSQL(非关系型数据库)模型。在相比数据数额庞大的传统数据库中,查询单条记录,KV 数据库的速度会快很多。那么KV数据库是否能封装达到图数据库的功能呢?实际上是可以的,前提是预先建立足够多的关联。倘若某个查询没有预先建立关联,那么KV数据库使用起来就比较费事了。但是图数据库就不需要考虑这些,只要建立最基本的关联,其他潜在的关联都可以通过基本的关联推导出来,甚至可以自己找出两个点之间的关联。这个性能,KV数据库是无法完成的。

那么问题来了!图数据库就一定是性能最优,效果最好的数据库吗?

答案显然是否定的,有些图数据库的很多提升和优化都是基于关系型数据库和查询技术来做的。在同样的场景下,相比于关系型数据库,图数据库确实可以省去很多额外的操作。但图数据库同样也会面临安全问题,同样也是依赖于底层数据库安全机制的支持。所以,没有最优的数据库类型,只有最适合的!

以上简述了几种数据库类型,有利有弊,相信大家也和我一样,对大数据,数据库这些名词有了一定的了解。我也会认真的学习别的知识,然后分享给大家!!!


回复量:2
伊雨烟客
伊雨烟客 08月28日 原创文章。在AI时代下,大数据作为基础的技能将变得非常普遍且专业。
格物致知
格物致知 09月05日 嗯,文章真不错