Re: [问卦] Big data跟统计有什么差?

楼主: stosto (树多)   2015-09-02 21:26:21
大数据是人家创出来的新名词唬你们用的,因为资料探勘做了几十年不换新名词没题材
data mining才是主体,大数据没意义,data mining 找出来的资讯才有意义
另外不用数据库管理的基本知识也可以做data mining,是找出规则不是管理数据库
data mining的核心在探勘算法,有很多种,统计的方法可以拿来当成一种
另外你举的例子是关联规则算法做出来的预测结果,这不是泡沫排序好吗!
还有你排序可排出规则的话,相信我你会上IEEE,打脸那些fellow等级的教授
※ 引述《RonaldFisher (费雪)》之铭言:
: ※ 引述《apple123773 (逆水)》之铭言:
: : 不过假使您真的要学可能要先有数据库管理的基础再来说
: 你讲的并不对
: 统计是统计 big data是big data
: 如果你将big data跟统计的相关 回归这些扯上关系 就太小看big data了
: data mining是统计 time series / nonparametric / MANOVA 这些都是统计
: 是一种成熟的工具/手法
: big data就吾人所知就是辞意上的big data , 借由大批量的数据去萃取出一些资讯
: 例如 时雨量 : 假设苗栗8月的观测站有每个站点的时雨量记录
: 假设有120个观测站 8月共有31天 总共有89280组数据
: 这就是一组时雨量big data
: 你问我这个有什么用?? 单看一个月可能没用 但是看完一整年365天共105万笔data后
: 运用许多资料观测手法会有些发现 : 举例某站8月上限值固定卡在200毫米就上不去了
: 推估: 8月该观测站雨量记录可能故障了 / 实际调阅相关资料发现果然异常并作修复
: 顾名思义借由分析大量资料去获得个别甚至萃取出独特资讯
: 需要的是强大的数据库整理手法 or bubble sort概念 而不是统计
: 有错再请确切使用神版友强大更正~
作者: RonaldFisher (费雪)   2015-09-02 21:29:00
bubble sort是基础中的基础概念 =_= 我没说只用这个就可以排出规则..
作者: dos01 (朵斯01)   2015-09-02 21:30:00
这篇说的不错
作者: myutwo150 (O51owtuym)   2015-09-02 21:34:00
bubble sort根本八竿子打不着边 别凹了
作者: dos01 (朵斯01)   2015-09-02 21:36:00
从定义来说 统记范围很广 广义来说有经过"运算"就算统记了
作者: drajan (EasoN)   2015-09-02 21:37:00
clustering的确是统计喔. 不管是K-means还是gaussianmixture 事实上都是从统计方法衍生出来的
作者: dos01 (朵斯01)   2015-09-02 21:38:00
另外趋势、偏态那种把资料排在一起的也算统计
楼主: stosto (树多)   2015-09-02 21:39:00
你这样讲所有东西都是统计了
作者: myutwo150 (O51owtuym)   2015-09-02 21:43:00
你可以去看看Vapnik的页面上统计一词出现多少次再来说SVM是不是统计
作者: skizard ( )   2015-09-02 21:50:00
楼主: stosto (树多)   2015-09-02 21:53:00
对不起我错了 我知识薄弱不知这些是统计学衍生出来的
作者: xxxg00w0 (寒夜)   2015-09-02 22:00:00
cluster不是统计有吗?嗯……我怎么觉得你提到的东西都有在统计看过的印象啊……抽样方法那边就有了SVM没学过 来翻翻看好了
作者: limingche (dddooo)   2015-09-02 22:08:00
SVM是统计
作者: franktpmvu (fch)   2015-09-02 22:44:00
知识果然有他的深度 文无第一阿 做人还是谦虚的好

Links booklink

Contact Us: admin [ a t ] ucptt.com