你们有人能简单易懂的解释一下什么叫大数据和数据挖掘么?

  • 逃啊逃啊逃
    rt,昨天嘴快把两件事说道一起了,被一个妹子委婉的纠正了一下,弱爆了


    回来百度一下发现看得也是一知半解,特意上来求各位大神指教


  • d
    darkccc
    数据挖掘这块是不是属于“模糊”控制板块的啊?
  • 七粒尘
    数据挖掘非常nb

    比如可以在网上搜到月球探测的各种问题和相关20多个专利和最前沿研究这些科学家的电话。

    不会的人是找不出来的
  • n
    novic
    大数据只是记录用户行为的数据库而已,当然,数量级很大,几万几十万的都不好意思和别人打招呼。

    数据挖掘,就是你每天发20个约炮信息,另有某人每天发20个求炮信息,然后通过数据分析挖掘出你们有匹配关系,然后系统给你们互相发好友推荐,然后加了约了炮了爽了走了,然后你们坚定的告诉周围的人——真是TMD约炮神器。
  • T
    TG春上春
    大数据就是捅鸡局怎么保8。数据采掘是一种伪科学,在财报极其难看的时候怎么忽悠股东,参见萎卵和骚泥如何评价销量和财报。

    本帖最后由 TG春上春 于 2013-8-6 11:22 通过手机版编辑
  • c
    cloudian
    posted by wap

    我来说个正经的,大数据就是新概念忽悠人,说白了就是很多数据。数据挖掘就是meta分析。
  • z
    zxsoft
    +1。赞同。

    其实区别是数据挖掘可以不基于大数据。但提到大数据几乎一定会联系到数据挖掘。
  • d
    darkccc
    做这块的肯定收入很高,真心羡慕啊。。。
  • 逃啊逃啊逃
    就是说,“大数据”这个概念是一定有很多很多数据并且一定要有“数据挖掘”这项技术来对之进行分析才有价值


    那为什么有单说“大数据”的这个概念?离开了“数据挖掘”之外的“大数据”部分又是什么?
  • 億万千
    人肉搜索算不算数据挖掘
  • S
    SXB的皮卡丘
    大数据是趋势表现,数据挖掘是针对方法
  • y
    yzh
    个人理解就是大数据是因为现在技术手段达到和互联网爆发之后获取手段提升,结果就是人的所有行为都能被数据化,所以数据量一下子爆发

    之后因为数据量的大爆发,导致数据挖掘就很火,因为要找出数据之间的联系就很有价值,比如通过你拉屎,撒尿的频率,量,质量来判断你是两把半还是2分钟,好吧,这是我编出来的
  • s
    saradush
    233 max, 老婆研究生就读的KNOWLEDGE OF MANAGEMENT, DATA MINING,现在工作还没着落...
  • 好蓝啊
    举个例子:s1的统计局君
    大数据就是s1的用户产生的访问数据,帖子等
    数据挖掘就是通过这些数据发现s1哪些号是马甲,哪些人有基情。
  • 大头木
    大数据就是tg水区,数据挖掘就是老走X
  • 放浪的无责任男
    水平如何,我这里招一个,帝都,具体私信
  • 一只纯猪头
    大数据是指承载如今海量数据的技术
  • 不是他
    233, 谁敢把老婆介绍给 放浪的无责任男
  • g
    gdx2840
    数据挖掘好像与数据仓库有点关系。主要是通过对数据进行etl (抽取转换加载),然后通过切片,切块,上钻下钻等操作进行处理。大概就是这么回事吧。
  • g
    gdx2840
    一些专业数据库比如oracle db2都有data ware house 版本,应该提供data mining 支持。
  • B
    BlackGod
    比如你做一个app ,流量很大, app客户端上传到服务端的数据就是大数据
    数据挖掘就是你从这些数据中分析出关键指标 ,作为app,关心的无非就是用户留存、用户回访、用户转化率之类的数据
    更细致的可以做到在应用的页面上埋点 可以分析出用户在哪个页面放弃的几率最高从而改善你的app

    [本帖最后由 BlackGod 于 2013-8-6 18:23 编辑]
  • s
    shramm
    要查wiki不要查baidu
  • a
    asher
    QQ的圈子就是数据挖掘了吧。。
  • s
    sumeru
    看wiki条目吧,中文的解释的也挺详细的。
  • f
    fleaken
    mark
  • s
    sijigh
    桃子,把妹子介绍给我吧
  • h
    highlightt
    这部分和data mining没关系(但是有间接联系),和把没结构的big data变成有结构的数据稍微有那么一点点关系。
  • 小虫A
    DPI会告诉你想知道的一切
  • k
    karlmao
    至少可以看出这两者之间有没有联系
  • n
    nvidia007
    唉,运营商是最适合做大数据挖掘的,数据量比谁都多,可惜就是不够重视,或者重视了不够钱做……
  • 上海狗狗
    不要乱说...


    数仓/数据集市是数据挖掘的基础,说白了就是一个有主题的大数据库,所谓的etl,钻取,切片都是基于数仓的数据加工和查询方法而已

    所谓的大数据时代,基本都是基于海量但又逻辑化的数仓而言


    数据挖掘则是一个更深的概念,它依附于数仓之上,是对于数据本身的深层次研究分析以达到预测与决策的目的,比较复杂,有兴趣我以后单独开帖解释
  • g
    gdx2840
    那就说专业点:
    数据挖掘(Data Mining)是从大量的、不完全的、有噪声的、模糊的、随机的数据中,提取隐含在其中的、人们事先不知道的、但又是潜在有用的信息和知识的过程。
    提取的信息和知识必须具备可信、新颖、有效和易于理解这四个特点
    数据挖掘的任务是从数据中发现模式。模式有很多种,按功能可分为两大类:预测型(Predictive)模式和描述型(Descriptive)模式;描述型数据挖掘包括数据总结、聚类及关联分析等,预测型数据挖掘包括分类、回归及时间序列分析等
    数据挖掘建立在各种数据源的基础上,重在发现隐藏在数据深层次的对人们有用的模式(Patterns),一般并不过多考虑执行效率和响应速度。
  • 8
    888999000
  • b
    banditcat
    似乎不是什么了不起的技术
  • b
    breeze7086
    数据挖掘本质上是离不开大数据的
    没有大数据做基础,挖掘出来的东西也没有说服力
  • s
    shramm
    不过data mining是不做解释的 只是单纯寻找数据之间的关联性
  • H
    HEIREN
  • 水星的爱
    三逃,,这事儿你得问我呀,嘿嘿
  • h
    highlightt
    Not Necessarily.

    很多的医疗,临床方面的data mining做得非常深和透彻,但是实际上并不和大数据挂钩。Data mining,在有大数据,而且可以正确地使用大数据的情况下,当然更加有效率和更有针对性,但是并不一定完全没有说服力。
  • h
    highlightt
    不完全正确,在大多数的analytics环境下面,data mining必须得makes sense,尤其在客户面向的情况下。当然,现在也有很多machine learning的black box approach,其实也是data mining,但是非常难解释。
  • 逃啊逃啊逃
    愿闻其详
  • p
    pikachu
    感觉大数据说的其实是对海量数据的处理引出的相关技术和解决方法,比如存储方式,效率,安全,备份。
    挖掘是从大数据中提取所需信息。侧重于分析和相关算法的准确性和效率
  • C
    Crusher
    看来tg做bi的还挺多的
    厦门地区有意换工作的筒子可pm我详细情况,有nosql巨量数据经验的最佳,靠谱的话待遇不是问题
  • g
    g1982117
    我认为两个侧重点不一样,都是方法的研究,一个是研究如何管理大规模数据的方法,一个是研究如何从有一定规模数据中提取有效数据的方法
  • l
    lvcha
    嗯,譬如发现50%的买卫生巾的同时会买避孕套,然后把避孕套和卫生巾摆放在一起?
  • j
    jinwyp
    有nosql巨量数据经验的最佳