你们有人能简单易懂的解释一下什么叫大数据和数据挖掘么?
- 逃啊逃啊逃rt,昨天嘴快把两件事说道一起了,被一个妹子委婉的纠正了一下,弱爆了
回来百度一下发现看得也是一知半解,特意上来求各位大神指教 - darkccc数据挖掘这块是不是属于“模糊”控制板块的啊?
- 七粒尘数据挖掘非常nb
比如可以在网上搜到月球探测的各种问题和相关20多个专利和最前沿研究这些科学家的电话。
不会的人是找不出来的 - novic大数据只是记录用户行为的数据库而已,当然,数量级很大,几万几十万的都不好意思和别人打招呼。
数据挖掘,就是你每天发20个约炮信息,另有某人每天发20个求炮信息,然后通过数据分析挖掘出你们有匹配关系,然后系统给你们互相发好友推荐,然后加了约了炮了爽了走了,然后你们坚定的告诉周围的人——真是TMD约炮神器。 - TG春上春大数据就是捅鸡局怎么保8。数据采掘是一种伪科学,在财报极其难看的时候怎么忽悠股东,参见萎卵和骚泥如何评价销量和财报。
本帖最后由 TG春上春 于 2013-8-6 11:22 通过手机版编辑 - cloudianposted by wap
我来说个正经的,大数据就是新概念忽悠人,说白了就是很多数据。数据挖掘就是meta分析。 - zxsoft+1。赞同。
其实区别是数据挖掘可以不基于大数据。但提到大数据几乎一定会联系到数据挖掘。 - darkccc做这块的肯定收入很高,真心羡慕啊。。。
- 逃啊逃啊逃就是说,“大数据”这个概念是一定有很多很多数据并且一定要有“数据挖掘”这项技术来对之进行分析才有价值
那为什么有单说“大数据”的这个概念?离开了“数据挖掘”之外的“大数据”部分又是什么? - 億万千人肉搜索算不算数据挖掘
- SXB的皮卡丘大数据是趋势表现,数据挖掘是针对方法
- yzh个人理解就是大数据是因为现在技术手段达到和互联网爆发之后获取手段提升,结果就是人的所有行为都能被数据化,所以数据量一下子爆发
之后因为数据量的大爆发,导致数据挖掘就很火,因为要找出数据之间的联系就很有价值,比如通过你拉屎,撒尿的频率,量,质量来判断你是两把半还是2分钟,好吧,这是我编出来的 - saradush233 max, 老婆研究生就读的KNOWLEDGE OF MANAGEMENT, DATA MINING,现在工作还没着落...
- 好蓝啊举个例子:s1的统计局君
大数据就是s1的用户产生的访问数据,帖子等
数据挖掘就是通过这些数据发现s1哪些号是马甲,哪些人有基情。 - 大头木大数据就是tg水区,数据挖掘就是老走X
- 放浪的无责任男水平如何,我这里招一个,帝都,具体私信
- 一只纯猪头大数据是指承载如今海量数据的技术
- 不是他233, 谁敢把老婆介绍给 放浪的无责任男
- gdx2840数据挖掘好像与数据仓库有点关系。主要是通过对数据进行etl (抽取转换加载),然后通过切片,切块,上钻下钻等操作进行处理。大概就是这么回事吧。
- gdx2840一些专业数据库比如oracle db2都有data ware house 版本,应该提供data mining 支持。
- BlackGod比如你做一个app ,流量很大, app客户端上传到服务端的数据就是大数据
数据挖掘就是你从这些数据中分析出关键指标 ,作为app,关心的无非就是用户留存、用户回访、用户转化率之类的数据
更细致的可以做到在应用的页面上埋点 可以分析出用户在哪个页面放弃的几率最高从而改善你的app
[本帖最后由 BlackGod 于 2013-8-6 18:23 编辑] - shramm要查wiki不要查baidu
- asherQQ的圈子就是数据挖掘了吧。。
- sumeru看wiki条目吧,中文的解释的也挺详细的。
- fleakenmark
- sijigh桃子,把妹子介绍给我吧
- highlightt这部分和data mining没关系(但是有间接联系),和把没结构的big data变成有结构的数据稍微有那么一点点关系。
- 小虫ADPI会告诉你想知道的一切
- karlmao至少可以看出这两者之间有没有联系
- nvidia007唉,运营商是最适合做大数据挖掘的,数据量比谁都多,可惜就是不够重视,或者重视了不够钱做……
- 上海狗狗不要乱说...
数仓/数据集市是数据挖掘的基础,说白了就是一个有主题的大数据库,所谓的etl,钻取,切片都是基于数仓的数据加工和查询方法而已
所谓的大数据时代,基本都是基于海量但又逻辑化的数仓而言
数据挖掘则是一个更深的概念,它依附于数仓之上,是对于数据本身的深层次研究分析以达到预测与决策的目的,比较复杂,有兴趣我以后单独开帖解释 - gdx2840那就说专业点:
数据挖掘(Data Mining)是从大量的、不完全的、有噪声的、模糊的、随机的数据中,提取隐含在其中的、人们事先不知道的、但又是潜在有用的信息和知识的过程。
提取的信息和知识必须具备可信、新颖、有效和易于理解这四个特点
数据挖掘的任务是从数据中发现模式。模式有很多种,按功能可分为两大类:预测型(Predictive)模式和描述型(Descriptive)模式;描述型数据挖掘包括数据总结、聚类及关联分析等,预测型数据挖掘包括分类、回归及时间序列分析等
数据挖掘建立在各种数据源的基础上,重在发现隐藏在数据深层次的对人们有用的模式(Patterns),一般并不过多考虑执行效率和响应速度。 - 888999000
- banditcat似乎不是什么了不起的技术
- breeze7086数据挖掘本质上是离不开大数据的
没有大数据做基础,挖掘出来的东西也没有说服力 - shramm不过data mining是不做解释的 只是单纯寻找数据之间的关联性
- HEIREN
- 水星的爱三逃,,这事儿你得问我呀,嘿嘿
- highlighttNot Necessarily.
很多的医疗,临床方面的data mining做得非常深和透彻,但是实际上并不和大数据挂钩。Data mining,在有大数据,而且可以正确地使用大数据的情况下,当然更加有效率和更有针对性,但是并不一定完全没有说服力。 - highlightt不完全正确,在大多数的analytics环境下面,data mining必须得makes sense,尤其在客户面向的情况下。当然,现在也有很多machine learning的black box approach,其实也是data mining,但是非常难解释。
- 逃啊逃啊逃愿闻其详
- pikachu感觉大数据说的其实是对海量数据的处理引出的相关技术和解决方法,比如存储方式,效率,安全,备份。
挖掘是从大数据中提取所需信息。侧重于分析和相关算法的准确性和效率 - Crusher看来tg做bi的还挺多的
厦门地区有意换工作的筒子可pm我详细情况,有nosql巨量数据经验的最佳,靠谱的话待遇不是问题 - g1982117我认为两个侧重点不一样,都是方法的研究,一个是研究如何管理大规模数据的方法,一个是研究如何从有一定规模数据中提取有效数据的方法
- lvcha嗯,譬如发现50%的买卫生巾的同时会买避孕套,然后把避孕套和卫生巾摆放在一起?
- jinwyp有nosql巨量数据经验的最佳