阡陌居

 找回密码
 立即注册
搜索
热搜: 新人报到
查看: 213|回复: 2

[求助] 大佬快来!大量硬回车问题,如何处理

[复制链接]

用户组:举人

唱,跳,rap,篮球!

重建论坛勋章

      UID
859
      积分
1524
      回帖
14
      主题
125
      发书数
121
      威望
1333
      铜币
8130
      贡献
0
      阅读权限
50
      注册时间
2025-3-1
      在线时间
48 小时
      最后登录
2025-4-28
发表于 2025-3-30 11:47 | 显示全部楼层 |阅读模式
本帖最后由 txt 于 2025-4-4 20:04 编辑

人都麻了,txtformat检测出的硬回车经常上千处,编辑-换行符格式-切换为Dos/Windows,才能检测出
特别是这几种情况:


①句末无标点+②句末无能代表结束句子的(如句号、问号、感叹号等)+③辅助符号(波浪线~等),都会被识别成有硬回车。④

很明显,下一句移到咔嚓后
---------------------------------------


啪嗒后加个逗号,下一句移上去?啪嗒后加句号,下一句不变?
我倾向加句号,读起来方便,但标点又不规范

---------------------------------------







然后就是这些辅助类符号,有的改了影响阅读

---------------------------------------



最后,有没有类似word里这种软回车,批量替换处理方法,解决最后几张图的硬回车提示

本帖子中包含更多资源

您需要 登录 才可以下载或查看,没有账号?立即注册

×
[发帖际遇]: txt 向女王献媚,收到打赏 2 铜币. 幸运榜 / 衰神榜
回复

使用道具 举报

用户组:儒士

      UID
1796
      积分
399
      回帖
91
      主题
12
      发书数
6
      威望
341
      铜币
8585
      贡献
0
      阅读权限
30
      注册时间
2025-3-1
      在线时间
64 小时
      最后登录
2025-4-29
发表于 2025-3-30 14:40 | 显示全部楼层

回帖奖励 +6 铜币

本帖最后由 edennow 于 2025-3-30 14:53 编辑

txtFormat 提供的这个硬回车正则本来就匹配了一些不应该算成错误的情况(比如 ~ 结尾之类的)。

可以尝试手动调整写法,改成用这样的正则来匹配:

^(?!··+|===+)(?!.*第[一二两三四五六七八九十〇零百千O0-9]{1,12}[章节節回集部卷篇])(.*?)(?<![\]}※〕::》】;;.。??”…!'’」』))\n!—〗\-─~~])$

这种“硬回车”还是得根据不同的情况来分类处理,有一些是要给当前行的结尾补上结尾标点,比如句号省略号之类的;有一些是要将当前行和下一行直接连接在一起,取消断行。

可以先大概归纳一下文本里有哪些可以简单统一替换的情况。
比如很多文本里是在“道”或者“说”之类的地方直接断行,那只要搜索 ([说道])\n 的正则,改成 \1:\n 或者 \1。\n 就行了,这样就能处理掉一定比例的简单错误。
类似还有象声词“咔嚓”“啪”之类的,只要匹配上,换成类似 \1!\n 这种就能解决。然后再人工判断残留的其他硬回车。

这种问题要想一键处理不太现实,如果直接一刀切把两行强行合并,或者强行在每行的末尾加上句号或者省略号,只会把文本改得面目全非,和作者的原意也存在很多的不相符。

另外如果有用这个脚本:https://www.1000qm.vip/forum.php?mod=viewthread&tid=2282

建议装一下 python,使用【文件全局搜索】来查这种硬回车,里面提供了一些预置的正则来处理各种情况,也能一眼看出文本中有多少处错误,不用去 txtFormat 里面重复点击坐牢。

点评

txt
感谢大佬,我去研究研究。链接里的查找单双引号很好用  发表于 2025-3-30 15:12

评分

参与人数 1铜币 +2 收起 理由
杨超越 + 2 认真回复!

查看全部评分

回复

使用道具 举报

您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

Archiver|手机版|小黑屋|阡陌居

GMT+8, 2025-4-29 03:48 , Processed in 0.105018 second(s), 25 queries .

Powered by Discuz! X3.5

© 2001-2025 Discuz! Team.

快速回复 返回顶部 返回列表