excel使用者转型,数据处理相关求建议
- alann以前都是用excel,现在手上有两个数据文件,都是几十万行文本格式,数据文件a是主要处理的文件,数据文件b是关联文件。需要处理的工作不只是查询,还有一些加工工作,包括识别并删除一些文件a的无效数据,关联文件b的一些数据,还有一些简单的对某几行几列的加减乘除运算。
由于文件行数较多,使用excel已经力不从心,且这个工作要每天更新,有什么好用的替代工具吗?由于本人无专业数据库知识基础,要求易学易懂,处理速度快,软件工具本身最好也不要太大。
求教。 - bigwizardexcel是数据整理软件,而不是数据处理软件
- alann那就求数据整理软件,总之整理还是处理不在乎,黑猫白猫能抓到老鼠就是好猫,方便好用能快速实现我的需求就是好工具。
- 洒家又回来了用勤哲吧,我已经零基础完成了整个公司的ERP系统。
- johentaiexcel不行那就上access
- riva128SAS 吧
不过几十万行EXCEL处理也很轻松的,把数据区域设置成表,速度会快很多
[本帖最后由 riva128 于 2016-8-24 15:57 编辑] - alann如果只有一个数据表我用excel处理一下就算了,问题是两个表都很大,表a去vlookup表b的数据会很慢
- ZHHK99access,处理数据应该没压力吧。好学易用。几十万条的数据处理不用数据库能行?就看哪个数据库用起来简单省心。
- yeskey导入sql server处理,都是微软产品,很容易集成的
- ages7mark下个决心学个sqlserver吧,难度不大的,当时我一点基础没有让我搞,还好有朋友会,然后剩下就是把自己的要求说清楚然后让朋友把语句写好发我,多弄几次,就慢慢懂了
- b0207191windows计划任务+ python
- 爱不可以重来最先想到的就是SQL,不要怕,不难的
- alannsql server是不是体积很大?后台占内存很多?我办公电脑已经非常卡了
- riva128那EXCEL也能用SQL的
- 0瞎子0mysql就够了
- 有钱屌就大access足矣,上手简单,又不需要苛刻的安装环境,如果有兴趣,还能自己在access做个软件界面出来,一劳永逸,谁都能用,定期把excel导入就行了。如果使用sqlserver或者mysql,熟练还好,要是不熟练,每次导入可能都会碰到因为excel里面数据不规范引起的各种奇怪问题,界面不友好,除了你本人,其他人都无法操作。如果access都觉得难,可以找人用access给你做个带操作界面的软件,能按照你提供的excel格式导入,并按照要求做分析和数据修理就行了,费用应该也不贵。
- kh2841找个dba帮数据导入再把sql写出来,没dba就自学access或者python。有这么大量的数据,肯定是分析员或者BI,要是都不会只能换岗了
- jzhl用access可以用查询拖拉鼠标生成临时表,然后再一层层的调用。可以不写SQL生成很复杂的查询。当然懂的SQL用半自动的方法玩的更顺手,对一些几十个字段的表的查询生成更是解放生产力。所以还是学点sql更好,反正也不难学。
- handsomeken找人开发吧,把数据收集整理分析都自动化了。
- engp0447我的第一反应是用微软的PowerQuery免费插件。
可以参考这个知乎帖子:
https://www.zhihu.com/question/25018406
里面有回答者用Power Query插件处理百万行级别数据的经历。当然帖子里也提到了其他各种方法。
有关powerquery可以看看这个帖子:
https://www.zhihu.com/question/26798445
本帖最后由 engp0447 于 2016-8-24 17:42 通过手机版编辑 - alann感谢楼上各位回答,目前想法是用access,最大好处是办公电脑直接就有装,无需安装额外软件。
为了方便,想以后能自动化加工这两个几十兆的文件,这是要学习怎么用宏和vba吗?还需要学习sql语言吗?我会一点编程,但sql语言一窍不通。 - 有钱屌就大如果一点不会,上手vba和sql还是有一点难度的,可能一开始会很慢,建议先学会如何把excel的数据导入到access,保证不丢数据,然后开始学习简单的sql写法,然后在access里面尝试写一些复杂的sql来过滤出自己想要的数据,或者删除掉重复的无效的数据,这样至少能让你先快速用起access来解决目前的工作,然后在一点点啃vba,慢慢把导入功能先做出来,在做界面,界面出来后把之前写的sql往里面一套,基本就差不多了
- engp0447vba处理几十万行数据可能速度堪忧…
- jzhl一般你可以这样理解,vba主要是做界面和操作逻辑的。sql是用来处理数据的。access单用户性能还可以的。当然性能不够,可以比较简单的把数据库换成其他的数据库,access只做为UI编程工具。所以你如果用97或之前的版本,最好把窗体设计和查询以放在一个文件里,数据表单独放一个文件。
- para用access就可以了,而且是一个套件的, 几十万行小case,都不用导入access,做个表关联就行,等于用access的引擎处理一下excel而已,很快,一般写一句话就搞定。
sql很简单,就4个关键字,平常说话有逻辑就没问题,都是复杂的单句。