(19)国家知识产权局 (12)发明 专利申请 (10)申请公布号 (43)申请公布日 (21)申请 号 202210286380.4 (22)申请日 2022.03.23 (71)申请人 北京环球智库文化发展 有限公司 地址 100027 北京市朝阳区霄云 路15号一 层1127 (72)发明人 王卫民  (74)专利代理 机构 杭州斯可 睿专利事务所有限 公司 33241 专利代理师 林君勇 (51)Int.Cl. G06F 40/30(2020.01) G06F 40/253(2020.01) G06F 40/211(2020.01) (54)发明名称 一种中文 文本语句的排列组合处 理方法 (57)摘要 本发明公开了一种中文文本语句的排列组 合处理方法, 采用在键盘上增加设有一个敲击键 或自动完成敲击动作, 电脑输入录入中, 输入一 个词组后执行再敲击键动作形成所述的隔开间 隔宽度, 或者通过自动完成敲击动作对输入一个 词组后自动形成所述所需的隔开间隔宽度; 或者 是采用敲击键方法或自动完成敲击动作方法这 两种方法中其中单独一种方法或两种方法相结 合的处理方法。 可提高中文或日文文本的辨识 度, 减少词组辨认环节, 提高阅读速度, 避免混淆 词义, 减少语义分歧 效果。 权利要求书1页 说明书5页 CN 114757196 A 2022.07.15 CN 114757196 A 1.一种中文 文本语句的排列组合处 理方法, 其特 征在于: 包括如下处 理步骤 A1.在需要录入的语句或文本中, 不再以单个汉字为单元, 采用按照语法规定对每一语 句所构成的词组进行排列组合, 形成一句遵循语法规定的以词组为组合单元构成新的排列 组合语句排版呈现结果, 相邻两个词组之 间设有提高词组语境识别作用和避免误认所需的 隔开间隔宽度; A2.采用在键盘上增加设有一个敲击键或自动完成敲击动作, 电脑输入录入中, 输入一 个词组后执行再敲击键动作形成步骤1所述的隔开间隔宽度, 或者通过自动完成敲击动作 对输入一个词组后自动形成步骤1所述所需的隔开间隔宽度; A3.在上述步骤2中, 采用敲击键方法或自动完成敲击动作方法这两种方法中其中单独 一种方法或两种方法相结合的处 理方法。 2.按照权利要求1所述的中文文本语句的排列组合处理方法, 其特征在于: 所述的词组 包括但不限于地名、 人名、 专有组织、 专业 术语和缩略语, 避免相邻词组发生混淆误认。 3.按照权利要求1所述的中文文本语句的排列组合处理方法, 其特征在于: 所述的敲击 键采用现有基于键盘基础上新增分布设置的独立敲击键, 输入一个词组后敲击执行该敲击 键, 便可自动形成步骤1所述所需的隔开间隔宽度。 4.按照权利要求1所述的中文文本语句的排列组合处理方法, 其特征在于: 所述的自动 完成敲击动作方式采用在输入软件端 预先配置 建立设有词组数据库, 词组数据库内配置安 装设有步骤1所述语法规定的所有词组, 一旦在输入软件端需要输入录入的语句, 词组数据 库中的词组就会与输入的语句进 行自动识别比对, 并在 采集比对得到的相 邻词组之 间动形 成步骤1所述所需的隔开间隔宽度。 5.按照权利要求1所述的中文文本语句的排列组合处理方法, 其特征在于: 所述的步骤 1所述所需的隔开间隔宽度的宽度大于单个汉字之 间的间隔宽度, 可以眼睛直接识别词组, 不致混淆词组与字之间的区别。 6.按照权利要求1所述的中文文本语句的排列组合处理方法, 其特征在于: 所述的步骤 1所述所需的隔开间隔宽度可根据辨识度要求单独设定间隔宽度, 以能够避免混淆辨识为 准。 7.按照权利要求1所述的中文文本语句的排列组合处理方法, 其特征在于: 所述的步骤 1所述所需的隔开间隔宽度采用一个汉字的四分之一宽度或更窄。 8.按照权利要求4所述的中文文本语句的排列组合处理方法, 其特征在于: 所述的输入 软件端包括但不限于w ord软件。 9.按照权利要求1或3所述的中文文本语句的排列组合处理方法, 其特征在于: 所述的 敲击键采用借用现有键盘上配置的空格键或采用通过键盘自定义设置形成敲击键作用的 自定义键; 采用空格键或自定义键时, 在A2 步骤中, 在输入一个词组后执行再快速双击所述 空格键或自定义键动作形成步骤1所述所需的隔开间隔宽度。权 利 要 求 书 1/1 页 2 CN 114757196 A 2一种中文 文本语句的排列组合处理 方法 技术领域 [0001]本发明涉及 一种文本语句处理方法, 尤其是涉及 一种中文文本语句的排列组合处 理方法。 背景技术 [0002]原有中文文本排列组合存在的缺点: 由于中文象形文字(方块字)的特殊性, 语句 都是由单个字为单元排版, 往往依靠对整句语句的理解来辨识词组和语义, 阅读过程中读 者需要词组辨认环节, 会浪费一定时间, 而且词组的组合方式不是唯一的, 同时也由于词组 和语义本身存在一定的不确定性, 不同的字可存在多种组合使用状态, 致使组合起来的语 句更容易产生含义上的歧义现象发生。 [0003]以单个汉字为单元的语句排列, 地名、 人名、 专有名词等误认几率高。 例如 《史记 · 老子列传》 中说老子过关, “关尹喜曰 ”, 有人说是“关尹”是关卡的官员, “喜”是官员的名字; 有人说“关尹”是人名, 称为 “关尹子”; 也有人说应该是 “关尹” “喜曰”, 即“守关官员高兴 的 说”或“关尹高兴的说 ”, 由此形成较为明显的理解歧义。 如果以本发明申请方案以词组为单 元进行排列处理, 则如下: (1)关尹喜曰, (2)关尹喜曰, (3)关尹(人名放大)喜曰; 从而可更 好避免混淆。 并且古文中辨认地名、 人名、 专有名词和其他词组更为困难, 如果新出版古代 文献使用以 “词组”为单元的排版方法则可以降低阅读难度, 有利于普通读者学习古代文 化。 本方法对孩子学习中文更加有益, 由于孩子对词组不熟悉, 往往不知如何辨别词组, 学 习过程花费很多时间在辨认词组上。 [0004]中文表达力需提升 的背景介绍: 汉字来源于三千年前的甲骨文造字, 由于 甲骨文 造字已经结束, 不再产生新的汉字, 因此单个汉字的资源已经枯竭, 后来出现汉字词组来增 加中文语言 的表达力。 词组主要以二个汉字组成, 如: “我们、 精神、 宇宙、 世界、 时间、 空间 ” 等, 但人们对自然和事物的认识愈来愈深化、 细化、 广泛化、 情感化和概念化, 需要的词组愈 来愈多, 现在词组的资源也基本接近枯竭, 因此提升中文的表达力具有现实意义。 以词组为 单元的组合方式可以在原有词组后面增加表意符号或字, 如: 人性、 动物性、 存在性、 本原 性、 等“性”为词尾, 表达更为本质的含义; 机械化、 自动化、 拟人化、 虚拟化、 等以 “化”为词 尾, 表达一种趋势、 泛化、 内质传递; “性”、“化”等词尾可以随着时代表达的需要不断增加, 从而增加中文的表达力。 词组为单元 的语句呈现方式可以发展出词根+词尾的新式词组结 构, 二字词组+词尾组成的三字词组系统或三字词组+词尾组成的四字词组系统是二字词组 系统的有力补充。 增加大写(加大字号, 宽度不变, 高度略增加)来表示人名、 地名、 国名、 专 有名词、 缩略语等, 避免与普通词语的混淆。 [0005]名词解释 [0006]A: 词组间隔或空格; a: 单字间隔。 大写: 字体同宽, 高度略高于文本字体, 用 于人 名、 地名、 国家名、 专业组织名、 专业 术语、 缩略语等。说 明 书 1/5 页 3 CN 114757196 A 3

.PDF文档 专利 一种中文文本语句的排列组合处理方法

文档预览
中文文档 7 页 50 下载 1000 浏览 0 评论 309 收藏 3.0分
温馨提示:本文档共7页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
专利 一种中文文本语句的排列组合处理方法 第 1 页 专利 一种中文文本语句的排列组合处理方法 第 2 页 专利 一种中文文本语句的排列组合处理方法 第 3 页
下载文档到电脑,方便使用
本文档由 人生无常 于 2024-03-18 17:44:15上传分享
友情链接
站内资源均来自网友分享或网络收集整理,若无意中侵犯到您的权利,敬请联系我们微信(点击查看客服),我们将及时删除相关资源。