求助电工!数据处理!
- xiaobingss我有一个14.5g的csv数据,大概5000多万条。想分割成大概50到100万条一个的csv.
同时由于数据是utf8编码的,希望可以转换成excel不乱码的。
谁可以帮忙处理?本人外行。可以有偿。
我查过解决方案python,linux都可以,我不太懂,感激。 - peng123456不考虑速度for循环! csv能直接导入到数据库小尾巴~
- infpowercsv 分割器
- lidongbest
- xiaobingss
- xiaobingss
- xiaobingss
- infpowercsv压缩下很小的,楼主可以试下,10g压缩后大概100M
- trokeysed直接切文件行
- zhenyue我能说这个vim操作几下就ok么
- trokeysed -n '起始行,终止行p' FILE > 最终文件
- 风一样的sb我不懂,乱说一下:
先弄入数据库,然后请人远程协助或者求人写个脚本命令之类的,导出几十个excel表格 - xRAINsed 研究一下
- funcc50万行的excel处理起来也慢的很,最好用数据库
- znmLinux sed 重定向就好了吧 iOS fly ~
- xiaobingss感谢楼上,这些我都不懂。数据库复杂了。当前尝试linux切一下
- freerockvim 管道,几行命令的事儿 iOS
- 碧的绿都是文本压缩一下可以到1/50
- yxmrpython切割容易,但写入excel效率不高吧
- Aweallsplit 命令
- lifanxisplit就行。不过这个数据量用Excel处理真是吃力了。你需要考虑用Drill,或者Hive。
- godgunhandexcel 如果打开文件超过5万行会非常慢的。如果对整列用了比较复杂的公式那就更麻烦了, 更新计算结果都要等半天。
- lidongbest你压缩成zip,网盘给我