※ 引述《APE36 (PT乡民)》之铭言:
: 请问大家认为在巨量资料(big data)数据库的定义中,
: 何谓是结构化性的资料(structured data)?
: 何谓非结构化资料(unstructured data)?
: 关于这两点假如要提出来做说明,感觉好像都找不到相关的说明例子
: 不知道有人对这定义性的问题熟悉吗??
: 可否分享相关资讯给小弟!!THX
就小弟粗略的观点来解释,如有错误请海涵
目前我们DB绝大多数的设计都是所谓的关联式数据库
会用所谓的正规化来设计资料表避免资料重复等问题
所以我们在取资料时常会需要Join许多资料表才能完成
而目前很热门的big data,其资料来源是四面八方且都没
经过整理,比如说你的公司在facebook开了一个粉丝团
你想了解并分析粉丝们对公司产品的喜好,因此跟facebook
购买资料,但这一些资料并没经过整理,也许很像文字档的LOG
,如何分析这样大量且非正规化的资料,这就是big data的
卖点了