阡陌居

用户名  找回密码
 立即注册
img_loading
智能检测中
帖子
热搜: 新人报到
楼主: edennow

[软件] 【FixText】文件全局搜索功能说明(新增章节序号检测和重排)

[复制链接]

用户组:版主

      UID
1796
      积分
482
      回帖
127
      主题
16
      发书数
9
      威望
396
      铜币
12282
      贡献
0
      阅读权限
100
      注册时间
2025-3-1
      在线时间
123 小时
      最后登录
2025-5-29
 楼主| 发表于 2025-4-27 20:49 | 显示全部楼层
本帖最后由 edennow 于 2025-4-27 20:52 编辑
冥王 发表于 2025-4-27 20:37
噢噢  不是用的extramap  用的是txtformat词库-。- (③和④)
所以有点怪怪的词组   等下试试用extramap ...

前面的两个自定义词库的选项我是有持续维护的,相对来说准确率还可以接受。

txtformat 那两个除了一些特别离谱的错误被我屏蔽了之外,基本是原封不动搬过来的,准确率都比较低(的地得那个还算可以了),只是用来补充一些自定义词库遗漏的修改。可想而知在 txtformat 里面用它那些词库疯狂出错,把鼠标点冒烟有多痛苦了。

建议还是从第 0 个开始依次往下执行,用自定义词库改完之后,后面的 txtformat 词库其实正常来讲找不出太多错了。等把繁转简那两个也查完就差不多可以了,后面的那些用途比较特殊的也基本不用管。

另外建议用 bc 的时候设置一下每行长度的限制(或者 5.0 以上的版本可以设置自动换行),让它可以自动拆分显示,不然那些比较长的行比较起来不太方便。
回复

举报

用户组:分区版主

我同阿公做嘢

重建论坛勋章

      UID
100
      积分
2818
      回帖
1124
      主题
12
      发书数
1
      威望
2249
      铜币
14805
      贡献
0
      阅读权限
100
      注册时间
2025-2-27
      在线时间
308 小时
      最后登录
2025-5-29
发表于 2025-4-27 20:51 | 显示全部楼层
edennow 发表于 2025-4-27 20:49
前面的两个自定义词库的选项我是有持续维护的,相对来说准确率还可以接受。

txtformat 那两个除了一些特 ...

感谢大佬~  确实用了0和1之后读起来都顺畅多了~
[发帖际遇]: 冥王 在论坛上传违禁小说,被网警发现,处罚 1 铜币. 幸运榜 / 衰神榜
回复

举报

用户组:秀才

宠辱不惊,闲看庭前花开花落;去留无意,漫随天外云卷云舒

      UID
2535
      积分
792
      回帖
301
      主题
14
      发书数
10
      威望
624
      铜币
10878
      贡献
0
      阅读权限
40
      注册时间
2025-3-2
      在线时间
338 小时
      最后登录
2025-5-29
发表于 2025-4-27 21:40 | 显示全部楼层
冥王 发表于 2025-4-27 20:37
噢噢  不是用的extramap  用的是txtformat词库-。- (③和④)
所以有点怪怪的词组   等下试试用extramap ...

txtformat的词库我也用过,绝大部分都是对改错,然后一个个对照贼伤眼睛
回复

举报

用户组:版主

      UID
1796
      积分
482
      回帖
127
      主题
16
      发书数
9
      威望
396
      铜币
12282
      贡献
0
      阅读权限
100
      注册时间
2025-3-1
      在线时间
123 小时
      最后登录
2025-5-29
 楼主| 发表于 2025-4-27 23:03 | 显示全部楼层
Llinx 发表于 2025-4-27 21:40
txtformat的词库我也用过,绝大部分都是对改错,然后一个个对照贼伤眼睛

用那个 txtformat 词库我都是改完之后直接把方向调转过来再对比,瞬间大部分改错变成大部分改对哈哈,把一些需要的同步过去之后再反过来覆盖掉就好了。

改试卷除了改八九十分的比较轻松,改一二十分的难度也差不多,只要挑对的出来给分就好了。
回复

举报

用户组:儒士

      UID
690
      积分
448
      回帖
396
      主题
13
      发书数
7
      威望
236
      铜币
3602
      贡献
0
      阅读权限
30
      注册时间
2025-3-1
      在线时间
50 小时
      最后登录
2025-5-29
发表于 2025-4-28 10:00 | 显示全部楼层
工具挺好,可惜我这是mac是否就无缘了啊,能否做一个支持mac平台的
[发帖际遇]: aero 向女王献媚,收到打赏 4 铜币. 幸运榜 / 衰神榜
回复

举报

用户组:分区版主

我同阿公做嘢

重建论坛勋章

      UID
100
      积分
2818
      回帖
1124
      主题
12
      发书数
1
      威望
2249
      铜币
14805
      贡献
0
      阅读权限
100
      注册时间
2025-2-27
      在线时间
308 小时
      最后登录
2025-5-29
发表于 2025-4-28 10:13 | 显示全部楼层
Llinx 发表于 2025-4-27 21:40
txtformat的词库我也用过,绝大部分都是对改错,然后一个个对照贼伤眼睛

是啊 我还以为出了啥子问题-。-
正确的都改错了
回复

举报

用户组:分区版主

我同阿公做嘢

重建论坛勋章

      UID
100
      积分
2818
      回帖
1124
      主题
12
      发书数
1
      威望
2249
      铜币
14805
      贡献
0
      阅读权限
100
      注册时间
2025-2-27
      在线时间
308 小时
      最后登录
2025-5-29
发表于 2025-4-28 10:14 | 显示全部楼层
edennow 发表于 2025-4-27 23:03
用那个 txtformat 词库我都是改完之后直接把方向调转过来再对比,瞬间大部分改错变成大部分改对哈哈,把 ...

还有一些读校才能看出的问题有没有可能也查得出

不过好像涉及到太多知识点,口语化,还有些搭配问题

有点难度
[发帖际遇]: 台风把 冥王 家中玻璃砸烂,损失了 1 铜币. 幸运榜 / 衰神榜
回复

举报

用户组:秀才

宠辱不惊,闲看庭前花开花落;去留无意,漫随天外云卷云舒

      UID
2535
      积分
792
      回帖
301
      主题
14
      发书数
10
      威望
624
      铜币
10878
      贡献
0
      阅读权限
40
      注册时间
2025-3-2
      在线时间
338 小时
      最后登录
2025-5-29
发表于 2025-4-28 10:36 | 显示全部楼层
aero 发表于 2025-4-28 10:00
工具挺好,可惜我这是mac是否就无缘了啊,能否做一个支持mac平台的

代码本身应该没什么跨平台的问题,在mac上装个php和python环境,将bat脚本改成sh脚本就行,虽然每用过mac,但mac用的是bash?
[发帖际遇]: Llinx 体重严重超标,花了 4 铜币 购买减肥药. 幸运榜 / 衰神榜
回复

举报

用户组:儒士

      UID
690
      积分
448
      回帖
396
      主题
13
      发书数
7
      威望
236
      铜币
3602
      贡献
0
      阅读权限
30
      注册时间
2025-3-1
      在线时间
50 小时
      最后登录
2025-5-29
发表于 2025-4-28 10:38 | 显示全部楼层
Llinx 发表于 2025-4-28 10:36
代码本身应该没什么跨平台的问题,在mac上装个php和python环境,将bat脚本改成sh脚本就行,虽然每用过mac ...

是的,但是很多校对软件不支持mac,我自己只能简单用cotEditor改一改
回复

举报

用户组:版主

      UID
1796
      积分
482
      回帖
127
      主题
16
      发书数
9
      威望
396
      铜币
12282
      贡献
0
      阅读权限
100
      注册时间
2025-3-1
      在线时间
123 小时
      最后登录
2025-5-29
 楼主| 发表于 2025-4-28 14:57 | 显示全部楼层
冥王 发表于 2025-4-28 10:14
还有一些读校才能看出的问题有没有可能也查得出

不过好像涉及到太多知识点,口语化,还有些搭配问题

脚本的主要修改方式还是简单的词组和正则匹配,有记录就能查出,无记录就不行。所以可以尝试把自己碰到的一些错误也加进去,持续堆新的规则就能解决更多问题。但是不具备很多 AI 模型的上下文理解和一些语法分析的能力,只能用明确的规则,解决明确的问题。

其实现在用脚本的各种词库跑一遍,有不少修改如果没有相关的语文知识,可能也不一定能理解为什么要改了。主要的作用还是能够在网文这些长篇文本里快速检测和解决一些基础常见的问题,也不用耗费过多的运行时间和调用成本。
回复

举报

您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

Archiver|手机版|小黑屋|阡陌居

GMT+8, 2025-5-29 19:33 , Processed in 0.098299 second(s), 23 queries .

Powered by Discuz! X3.5

© 2001-2025 Discuz! Team.

快速回复 返回顶部 返回列表