大数据扫盲 _____更新在81#__书单更新在122#__更新一些感受#
- l32606这才是个实在的问题,论证了半天,这也骗钱,那也骗钱。码农连骗钱的伎俩还不会。
转型数据挖掘有可能吗? - l32606兄弟能否给科普一下,这是什么行业?
- lishuanzhu
- ggankMARK....
- 魂淡
- lishuanzhu
- lobytao20前两天有看到一本书叫《大规模分布式存储系统》。在公司天天接触技术部门,倒是有兴趣学一学数据存储,大数据之类的,对互联网和开发有一定经验,但不是开发岗位的人。有没有什么入门级别的好书推荐看看,适合我这种的?
- chak那么,怎么样才冷狗发财呢?
- lishuanzhu
- liberpike
- lishuanzhu
- woiszhu其实,几乎大部分的BI,到最后都沦为写ETL代码和开发报表了,最多再加些图形可视化展示。
相对成功的应用也就是关联分析,最初炒作的啤酒与尿布就是关联分析,
现在的推荐系统也基本上是关联分析。
啤酒与尿布,在业内早就成了笑话。
BI也好,大数据也好,再怎么炒作,如果底层的算法不能达到要求,就只能是吹牛。
以统计为基础的预测算法,永远不知道什么时候对,什么时候错。只能给你一个大概的可能性。
也不知道什么情况下有用,什么情况下没用,只能通过实验去试。
随机启发式搜索算法,容易陷入局部极值。
要真正做出成功的BI应用,不但需要对业务极其了解,还要对算法底层有相当的了解。
现在的许多工具,对算法做了封装,许多人只会用算法,并不懂算法的真正原理。 - lishuanzhu
- lishuanzhu
- woiszhu只会用工具的人,很容易就被专业领域的人员所取代了。
现在各种领域的人员,都已经把计算机作为基本技能,
他们一旦掌握了这些工具,只会使用BI工具的人,就面临失业的危险。
聪明的专业人员,使用工具+熟练的业务,其效果完全可以秒杀只会使用BI工具的人员。
未来会是BI领域专业化,形成新的较细的交叉。
其实机器学习有一个基本定理,说的就是这个:
没有免费的午餐定理。
算法必须和业务背景相结合。 - nt941这么高端的东西D版都有人讨论啊。
- xcode搬个板凳来听课。
谢谢楼主,楼主好人,楼主一生平安 - lishuanzhu回复116#pcer
第二条我觉得看方向,如果是想做数据挖掘,我已经列出书单了。
如果是数据处理,其实也没什么,你们SAP HANA 是第一个要掌握的,其次Hadoop啊,什么各种NoSQL, 原则上JAVA是要捡回来的。 以后的数据平台一定是多元化的,不单单是关系型数据库了.
Hadoop系列我比较看好Cloudera社区的版本, 看<<Hadoop权威指南>>第三版,前八章滚瓜烂熟之后,可以混个Cloudera的认证回来。 - kaidokido回复1#lishuanzhu
看不懂。。我用用数据挖掘的一般软件就行了 - lishuanzhu
- 薜定谔的猫马克一下
- myliyifei楼主是学霸啊,问一下,现在神经网络的发展有什么大的突破吗?
- lishuanzhu
- ayuan不错,mark一下,慢慢看iOS fly ~
- Hisoka-J想明年弄弄mongo-hadoop
- 丰乳肥臀
- 丰乳肥臀啤酒加尿布不是 很久很久之前 宣传 数据挖掘用的例子吗? 这和大数据有什么直接关系。。。关系数据库一样 数据挖掘 。。。
- Hisoka-J
- 沙发上的土豆唉,数学重新捡起来不好捡
- 丰乳肥臀可以得,一个master,几个虚的slave, 我跑起来过。。
- lishuanzhu
- lishuanzhu
- hong1118我厂在挖大数据苦逼.
帝都北厂-数据部- - lishuanzhu
- 丰乳肥臀
- 沙发上的土豆读书的时候学的data mining还有模式识别的知识全都还给老师了,前几天跟老熊聊起HMM,还是毕业论文的题目,现在忘得一干二净;想要开始完全是零起步。
- lishuanzhu
- lishuanzhu
- heavenfly又是一专业学术贴,好好学习一下
- 沙发上的土豆呼叫中心应该算是非结构化数据的data mining的一个应用领域吧,个人所见
- popes期待楼主的讲座~
最好在上海~哈 - 沙发上的土豆你有什么样的需求才能决定做什么样的数据挖掘吧;嗯,应该是这样
- beafhorse
- lishuanzhu
- 有病就得电