星期三字典清理器——能合并几万G字典的工具
本帖最后由 中国的星期三 于 2014-2-10 05:51 编辑简称wed。
(0)合并后的结果,完全没有重复。
(1)用2G/4G/8G内存,并借助于硬盘空间,能合并几万G字典。
(2)能在Win/Linux/Mac运行,需要安装Java。
Java1.5/Java1.6/Java1.7/Java5/Java6/Java7都行。
(4)中间过程、最终结果,截图:
(5)如何安装配置Java?
如果你的操作系统是64位的,建议安装64位的Java,这能充分利用你的内存,大大缩短跑程序的时间。
推荐Java7,因为更快。官方下载地址:http://www.oracle.com/technetwor ... nloads-1880260.html
先勾选这项:“Accept License Agreement”,然后,
32位Java,选:jdk-7u51-windows-i586.exe 64位Java,选:jdk-7u51-windows-x64.exe 配置,看下图。
(6)wed的适用对象:(a)字典爱好者 (b)专业跑包店 (c)其它专业机构
(7)2014年1月5日,下载版本:星期三字典清理器_wed-0.2
(8)如何运行?
把各种混乱的字典放在D:/MyDict。关闭别的程序,节省内存。保证D:/剩余空间大于字典总尺寸的2倍。
如果你有4G内存,用:
F:\wed>java -server -Xmn1200m -Xms1500m -Xmx2500m -jar wed.jar D:/MyDict
如果你有8G内存,用:
F:\wed>java -server -Xmn4000m -Xms4200m -Xmx5500m -jar wed.jar D:/MyDict
如果你想一边看电影一边搞wed,把5500m改成:5000m就行了。
错误信息04:Could not reserve enough space for object heap.
把3个数字都减去100m。如果还失败,再都减去100m。
(9)上面的指令还能干嘛?
如果你有20G一个的字典文件,想要切割成100左右的文件,也能用这条。
(10)Windows控制台太短,wed跑了一会儿,看不到以前的log了,怎么办?
设置控制台属性--布局,缓冲区大小—宽度,120;高度,9999。窗口大小—宽度,120;高度,60以上。
(11)有人说,小字典才好。请看(6),想想人家跑包店了。
(18)wed经过了多次的长久的测试,千锤百炼质量高,可以放心使用。
(19)wed还有其它的整理字典的功能,以后再公布。
(20)欢迎跟帖提需求,我会持续改进。
能合并不错 能去重复更佳~~~~~~~~ 不错!!支持!!!! 字典合并已经没有意义,那么大字典跑一个都要很久,不如小字典短时间出 帮顶了。!! 不如小字典短时间出 你字典也要做好排序啊,弱口令 生日 8位数字 手机 不错!!支持!!!!
我的经验是,跑再大的字典,不如抓更多的包 谢谢楼主。 不管别人如何,我顶你 怎么最近送金币的这么多???