序号 UID4478
好友1 人
听众1 人
收听2 人
阅读权限50
注册时间2025-3-2
最后登录2025-4-26
在线时间111 小时
用户组:举人
阡陌居•坤门™大弟子
 
UID4478
积分1097
回帖233
主题145
发书数97
威望805
铜币4795
贡献6
阅读权限50
注册时间2025-3-2
在线时间111 小时
最后登录2025-4-26
|
像这种
:“..............”
..............”
用正则表达式替换成
:“........”
例子:
天空男子怒喝叫道:“虽然是圣母给予了我们生命,但是我人族绝不做食物,我人族绝不屈服。”愿意一搏的随我走,我们为人族杀出一条血路。从此刻起,我人族不敬巫,不拜仙,不尊圣母,只靠我们自己。杀!”
例子:
后土悠悠说道:“洗去记忆还原成最本源的三魂七魄就是了。”
至于章程,天地间种族万千可分为六道,上二道,中二道,下二道,灵魂轮回也该有所不同,生者一世死后审判,善者轮回上二道,平庸者轮为中二道,恶者轮回下二道。”
把回车(第二个右引号内的一个或多个)删掉,变成一个人说的一句话。
我用这个“([\x4e00-\x9fa5]+)”(.*?)”一直匹配不到。
-----------------------------------------------------------------------------------------------------------------------------------------------------------------------------
我还有个疑问,这个就不去办公室发帖了,只是单纯的疑问:
校对文本查重是什么逻辑,本人不会爬虫,一般是在收集的开源阅读找文本下载导出,然后用txtFormat校对,但是昨天校对两本书都被守护者提示与河洛文本不同不超过100处/十几处。
不同不超过100处是说我是拿河洛的文本抄袭的,我的理解没错吧。
我的疑问出来了,如果河洛的文本已经到顶了,我再怎么改不都是和它越来越相似,我总不能在里面夹带私货吧。
这次那个十几处的文本的确发现了新问题,就是上面那个引号不匹配,合成一句话,But,我怕我弄好之后,差距就更小了咋办,我总不能干过人家收费的吧。
如果我已经改到改不了了,和查重版的相似的时候,我应该咋办哇。
怕没人回,我发个红包,球球你们给些建议吧,有用的建议我还有奖。
|
|