ubnt解决方案
楼主: 上上网

寻找整理数据字典爱好人士

[复制链接]

2130

回帖

13万

积分

4978 小时

在线时间

上将

注册时间
2014-4-9
金币
133272 个
威望
12 个
荣誉
2 个
累计签到:4 天
连续签到:0 天
[LV.20]漫游旅程
发表于 2017-9-27 06:38
本帖最后由 vcxz 于 2017-9-27 08:40 编辑


我来给大家举一个稍微复杂一点例子(近GB文档的其中一部分):供大家思考,共同学习。欢迎讨论
这是真实实战的情况
目标:仔细精准提取只有密码部分


  1. 2460 四区 寻梦 okpkqw1379513 okpk0567440854 369741 0714 9759[0] 龙☆凤舞 D259 E576 E304 78
  2. 2 460 四区 寻梦 okpkqw1379513 okpk0567440854 369741 0714 9759[0] 龙☆凤舞 D259 E576 E304
  3. 7999 二区,凤舞 killer1611 610cipher 19820918 55 9617 爱在烈火焚烧 C643 A677 A121 破保[]
  4. 7 994 二区,凤舞 goodness5566 wtxamthebest520 54320801 83 520032 天煞泪 C644 G369 E363 破保[]
  5. 7971 二区 凤舞 yanyan787878 wy042588 042588 80 180060 蓝灵飞飞 B260 I883 B811
  6. 1989 二区,凤舞 lylly5201314 xw647755 xw647755 67 1835278 凌乱灵炎怒 A226 F346 B419
  7. 2277 二区 凤舞 miming333 m3884236 little369 72 816854 赤龙飘逸醉阿蒙 D391 F573 G519 破保
  8. 2466 二区,凤舞 wo715086375 liuyanghannifu 471243291 76 87363 我是色羊 C663 F726 F504 破保
  9. 21 52 二区,凤舞 gufcbing gufcbing 133986 49 1065321 情圣【侠】降敌 E465 H853 C302 破
  10. 512 二区,凤舞 sanmaogegeha 13995951027 987321456 96 163 ★小三子★ E666 J579 C430 破
  11. 1304 二区,凤舞 xq1989322 xqwlh123456789 XQWLH13881277375xq 85 11272 爱你☆琴 G683 D459 E453 破保  
  12. 4940 二区 凤舞 xinghua7 012345678999 00 72 0 龙0之吻 A125 F548 E522 破保[] 220
  13. 325 4 二区,凤舞 w11350416 101015520 11350416 90 6574 咔哇怡 B426 G427 I172 破保
  14. 6250 二区,凤舞 kisskis76048015 kisskis 2691998 81 0 龙舞£封心一箭 A894 F408 B221 破
  15. 167 二区,凤舞 laolin6826683 781125 123 71 4148 娱乐天下 G117 F116 J118 破保[] 61.
  16. 314 二区,凤舞 ff511987100ff buainvren303 13612280643f 84 483400 f枫f G502 D793 J403 破保[] 219
  17. 80 41 二区,凤舞 dy8023310 fujiayu1421 6233253 68 985216 抖不完的烟丝 D855 E802 D483 破保[] 222
  18. 1724 二区,凤舞 sj15333434269 13604638 13604638 36 94429 ~熊猫吃竹子~ G339 J691
  19. 3905 gj 二区 凤舞 chunhua1982 xhw123123 123123 卡 生命◎自然女神 99 40164   113
  20. 3483 gj二区 凤舞 kingshaozaici haoshaozaici 123456 卡 天杀鹄衅 93 6633428   59.50
  21. 3456 gj 二区 凤舞 az41780419 yinhong1985 1042626911  n天v使n 95 1556561  zengwei1984 219.152
  22. 3199 gj 二区 凤舞 cc222226022 chendetao1121 1002 卡 极度☆宝贝 93 4766109   1
复制代码









128

回帖

1767

积分

253 小时

在线时间

上尉

注册时间
2014-11-18
金币
1600 个
威望
1 个
荣誉
0 个
累计签到:1 天
连续签到:0 天
[LV.20]漫游旅程
发表于 2017-9-27 08:52
本帖最后由 F.. 于 2017-9-27 08:55 编辑

小于1G的单个文件用UE还是可以的。不同文件不同分析,找出共同点用UE或者命令把共同点代替掉就可,或者用命令把共同点提取出来(这个UE做不了)。




本帖子中包含更多资源

您需要 登录 才可以下载或查看,没有账号?注册 微信登录

x

2130

回帖

13万

积分

4978 小时

在线时间

上将

注册时间
2014-4-9
金币
133272 个
威望
12 个
荣誉
2 个
累计签到:4 天
连续签到:0 天
[LV.20]漫游旅程
发表于 2017-9-27 09:02
F.. 发表于 2017-9-27 08:52
小于1G的单个文件用UE还是可以的。不同文件不同分析,找出共同点用UE或者命令把共同点代替掉就可,或者用命 ...



终于来说话了。存货很多啊,大牛

我上面的例子,还有另一层意思。判断到底哪个是密码,很难,很模糊

估计你也有体会,并且很深。最后,实在是看的烦了,就把所有隔壁的列都当成是密码来提取

呵呵


128

回帖

1767

积分

253 小时

在线时间

上尉

注册时间
2014-11-18
金币
1600 个
威望
1 个
荣誉
0 个
累计签到:1 天
连续签到:0 天
[LV.20]漫游旅程
发表于 2017-9-27 09:08
我上面去掉中文前面的,后面第一例是用户名,第二例是密码。
第一例不可能是密码,原因就不说了,第三例有些字符太短,不像密码,而且算是密码大多是简单数字也没什么用,那么只有第二例。

128

回帖

1767

积分

253 小时

在线时间

上尉

注册时间
2014-11-18
金币
1600 个
威望
1 个
荣誉
0 个
累计签到:1 天
连续签到:0 天
[LV.20]漫游旅程
发表于 2017-9-27 09:10
知道你说的用LINUX之类的命令提取需要的例就可,但是要统一例是命令的弱点。没UE直观。

2130

回帖

13万

积分

4978 小时

在线时间

上将

注册时间
2014-4-9
金币
133272 个
威望
12 个
荣誉
2 个
累计签到:4 天
连续签到:0 天
[LV.20]漫游旅程
发表于 2017-9-27 09:19
F.. 发表于 2017-9-27 09:08
我上面去掉中文前面的,后面第一例是用户名,第二例是密码。
第一例不可能是密码,原因就不说了,第三例有 ...



实战经验。实话

有很多你认为的第一列,就是密码

例子就不举了

我的意思,文档大了,确实不好分。累眼,看的时间长了,特烦。我搞不清裤子为什么这么复杂,注册ID与密码分不清楚。其它情况先不说

我实在无奈,只好把这两列(注册ID与密码)统统认为是密码

3352

回帖

1万

积分

4788 小时

在线时间

上校

注册时间
2015-5-1
金币
14029 个
威望
12 个
荣誉
1 个
累计签到:1 天
连续签到:0 天
[LV.20]漫游旅程
发表于 2017-9-27 10:34
本帖最后由 上上网 于 2017-9-27 10:36 编辑

那些是ID  那些是PASSWORD






本帖子中包含更多资源

您需要 登录 才可以下载或查看,没有账号?注册 微信登录

x

128

回帖

1767

积分

253 小时

在线时间

上尉

注册时间
2014-11-18
金币
1600 个
威望
1 个
荣誉
0 个
累计签到:1 天
连续签到:0 天
[LV.20]漫游旅程
发表于 2017-9-27 11:12
上上网 发表于 2017-9-27 10:34
那些是ID  那些是PASSWORD

最后面的是密码
第一例不可能是密码的
不放心可以把第一例与第三例留下,

3352

回帖

1万

积分

4788 小时

在线时间

上校

注册时间
2015-5-1
金币
14029 个
威望
12 个
荣誉
1 个
累计签到:1 天
连续签到:0 天
[LV.20]漫游旅程
发表于 2017-9-27 14:36
vcxz 发表于 2017-9-26 18:18
请楼主放出一个你的小文件的附件出来(你认为不太好处理的。要有明文的)
我可以结合你的数据,再分析 ...

如果你要弄我全部给你
上一个两个几m东西有什么用

2130

回帖

13万

积分

4978 小时

在线时间

上将

注册时间
2014-4-9
金币
133272 个
威望
12 个
荣誉
2 个
累计签到:4 天
连续签到:0 天
[LV.20]漫游旅程
发表于 2017-9-27 14:49
上上网 发表于 2017-9-27 14:36
如果你要弄我全部给你
上一个两个几m东西有什么用




谢谢对我的信任

其实是大家相互学习

你上张你的数据的截图好吗?

唉!极希望    @F..     大牛的数据,和我的比较下。感觉他的数据比我的多,但,不知道重复率怎样包括有些有压缩密码的不知道能不能打开。我先做个梦吧。呵呵










449

回帖

8155

积分

405 小时

在线时间

中校

注册时间
2016-5-5
金币
7316 个
威望
59 个
荣誉
0 个
累计签到:699 天
连续签到:0 天
[LV.730]常住居民
发表于 2017-9-27 16:51
UltraEdit处理小文件很顺手,但是几十个GB的裤子最好还是用对应的DB省心些
一般洗库SQL Server、My SQL、Oracle和Sybase是必备的通用工具Toad就足够你折腾
数据格式或者编码问题才是洗库碰到最头疼的问题,同时也能看出数据表单设计人员的功底

2130

回帖

13万

积分

4978 小时

在线时间

上将

注册时间
2014-4-9
金币
133272 个
威望
12 个
荣誉
2 个
累计签到:4 天
连续签到:0 天
[LV.20]漫游旅程
发表于 2017-9-27 17:04
yunnanyaic 发表于 2017-9-27 16:51
UltraEdit处理小文件很顺手,但是几十个GB的裤子最好还是用对应的DB省心些
一般洗库SQL Server、My SQL、O ...


不知道你的“存货”,有多少?

请放出来瞧瞧?谢谢

站点统计 | Archiver | 手机版 | 无线门户 ( 粤ICP备11076993号|粤公网安备44010602008359号 ) |网站地图

GMT+8, 2024-5-5 19:42

返回顶部 返回列表