excel使用者转型,数据处理相关求建议

  • a
    alann
    以前都是用excel,现在手上有两个数据文件,都是几十万行文本格式,数据文件a是主要处理的文件,数据文件b是关联文件。需要处理的工作不只是查询,还有一些加工工作,包括识别并删除一些文件a的无效数据,关联文件b的一些数据,还有一些简单的对某几行几列的加减乘除运算。
    由于文件行数较多,使用excel已经力不从心,且这个工作要每天更新,有什么好用的替代工具吗?由于本人无专业数据库知识基础,要求易学易懂,处理速度快,软件工具本身最好也不要太大。
    求教。
  • b
    bigwizard
    excel是数据整理软件,而不是数据处理软件
  • a
    alann
    那就求数据整理软件,总之整理还是处理不在乎,黑猫白猫能抓到老鼠就是好猫,方便好用能快速实现我的需求就是好工具。
  • 洒家又回来了
    用勤哲吧,我已经零基础完成了整个公司的ERP系统。
  • j
    johentai
    excel不行那就上access
  • r
    riva128
    SAS 吧
    不过几十万行EXCEL处理也很轻松的,把数据区域设置成表,速度会快很多

    [本帖最后由 riva128 于 2016-8-24 15:57 编辑]
  • a
    alann
    如果只有一个数据表我用excel处理一下就算了,问题是两个表都很大,表a去vlookup表b的数据会很慢
  • Z
    ZHHK99
    access,处理数据应该没压力吧。好学易用。几十万条的数据处理不用数据库能行?就看哪个数据库用起来简单省心。
  • y
    yeskey
    导入sql server处理,都是微软产品,很容易集成的
  • a
    ages7mark
    下个决心学个sqlserver吧,难度不大的,当时我一点基础没有让我搞,还好有朋友会,然后剩下就是把自己的要求说清楚然后让朋友把语句写好发我,多弄几次,就慢慢懂了
  • b
    b0207191
    windows计划任务+ python
  • 爱不可以重来
    最先想到的就是SQL,不要怕,不难的
  • a
    alann
    sql server是不是体积很大?后台占内存很多?我办公电脑已经非常卡了
  • r
    riva128
    那EXCEL也能用SQL的
  • 0
    0瞎子0
    mysql就够了
  • 有钱屌就大
    access足矣,上手简单,又不需要苛刻的安装环境,如果有兴趣,还能自己在access做个软件界面出来,一劳永逸,谁都能用,定期把excel导入就行了。如果使用sqlserver或者mysql,熟练还好,要是不熟练,每次导入可能都会碰到因为excel里面数据不规范引起的各种奇怪问题,界面不友好,除了你本人,其他人都无法操作。如果access都觉得难,可以找人用access给你做个带操作界面的软件,能按照你提供的excel格式导入,并按照要求做分析和数据修理就行了,费用应该也不贵。
  • k
    kh2841
    找个dba帮数据导入再把sql写出来,没dba就自学access或者python。有这么大量的数据,肯定是分析员或者BI,要是都不会只能换岗了
  • j
    jzhl
    用access可以用查询拖拉鼠标生成临时表,然后再一层层的调用。可以不写SQL生成很复杂的查询。当然懂的SQL用半自动的方法玩的更顺手,对一些几十个字段的表的查询生成更是解放生产力。所以还是学点sql更好,反正也不难学。
  • h
    handsomeken
    找人开发吧,把数据收集整理分析都自动化了。
  • e
    engp0447
    我的第一反应是用微软的PowerQuery免费插件。

    可以参考这个知乎帖子:
    https://www.zhihu.com/question/25018406

    里面有回答者用Power Query插件处理百万行级别数据的经历。当然帖子里也提到了其他各种方法。

    有关powerquery可以看看这个帖子:
    https://www.zhihu.com/question/26798445

    本帖最后由 engp0447 于 2016-8-24 17:42 通过手机版编辑
  • a
    alann
    感谢楼上各位回答,目前想法是用access,最大好处是办公电脑直接就有装,无需安装额外软件。
    为了方便,想以后能自动化加工这两个几十兆的文件,这是要学习怎么用宏和vba吗?还需要学习sql语言吗?我会一点编程,但sql语言一窍不通。
  • 有钱屌就大
    如果一点不会,上手vba和sql还是有一点难度的,可能一开始会很慢,建议先学会如何把excel的数据导入到access,保证不丢数据,然后开始学习简单的sql写法,然后在access里面尝试写一些复杂的sql来过滤出自己想要的数据,或者删除掉重复的无效的数据,这样至少能让你先快速用起access来解决目前的工作,然后在一点点啃vba,慢慢把导入功能先做出来,在做界面,界面出来后把之前写的sql往里面一套,基本就差不多了
  • e
    engp0447
    vba处理几十万行数据可能速度堪忧…
  • j
    jzhl
    一般你可以这样理解,vba主要是做界面和操作逻辑的。sql是用来处理数据的。access单用户性能还可以的。当然性能不够,可以比较简单的把数据库换成其他的数据库,access只做为UI编程工具。所以你如果用97或之前的版本,最好把窗体设计和查询以放在一个文件里,数据表单独放一个文件。
  • p
    para
    用access就可以了,而且是一个套件的, 几十万行小case,都不用导入access,做个表关联就行,等于用access的引擎处理一下excel而已,很快,一般写一句话就搞定。

    sql很简单,就4个关键字,平常说话有逻辑就没问题,都是复杂的单句。