国家标准网
文库搜索
切换导航
首页
频道
仅15元无限下载
联系我们
首页
仅15元无限下载
联系我们
批量下载
(19)国家知识产权局 (12)发明 专利申请 (10)申请公布号 (43)申请公布日 (21)申请 号 202210286380.4 (22)申请日 2022.03.23 (71)申请人 北京环球智库文化发展 有限公司 地址 100027 北京市朝阳区霄云 路15号一 层1127 (72)发明人 王卫民 (74)专利代理 机构 杭州斯可 睿专利事务所有限 公司 33241 专利代理师 林君勇 (51)Int.Cl. G06F 40/30(2020.01) G06F 40/253(2020.01) G06F 40/211(2020.01) (54)发明名称 一种中文 文本语句的排列组合处 理方法 (57)摘要 本发明公开了一种中文文本语句的排列组 合处理方法, 采用在键盘上增加设有一个敲击键 或自动完成敲击动作, 电脑输入录入中, 输入一 个词组后执行再敲击键动作形成所述的隔开间 隔宽度, 或者通过自动完成敲击动作对输入一个 词组后自动形成所述所需的隔开间隔宽度; 或者 是采用敲击键方法或自动完成敲击动作方法这 两种方法中其中单独一种方法或两种方法相结 合的处理方法。 可提高中文或日文文本的辨识 度, 减少词组辨认环节, 提高阅读速度, 避免混淆 词义, 减少语义分歧 效果。 权利要求书1页 说明书5页 CN 114757196 A 2022.07.15 CN 114757196 A 1.一种中文 文本语句的排列组合处 理方法, 其特 征在于: 包括如下处 理步骤 A1.在需要录入的语句或文本中, 不再以单个汉字为单元, 采用按照语法规定对每一语 句所构成的词组进行排列组合, 形成一句遵循语法规定的以词组为组合单元构成新的排列 组合语句排版呈现结果, 相邻两个词组之 间设有提高词组语境识别作用和避免误认所需的 隔开间隔宽度; A2.采用在键盘上增加设有一个敲击键或自动完成敲击动作, 电脑输入录入中, 输入一 个词组后执行再敲击键动作形成步骤1所述的隔开间隔宽度, 或者通过自动完成敲击动作 对输入一个词组后自动形成步骤1所述所需的隔开间隔宽度; A3.在上述步骤2中, 采用敲击键方法或自动完成敲击动作方法这两种方法中其中单独 一种方法或两种方法相结合的处 理方法。 2.按照权利要求1所述的中文文本语句的排列组合处理方法, 其特征在于: 所述的词组 包括但不限于地名、 人名、 专有组织、 专业 术语和缩略语, 避免相邻词组发生混淆误认。 3.按照权利要求1所述的中文文本语句的排列组合处理方法, 其特征在于: 所述的敲击 键采用现有基于键盘基础上新增分布设置的独立敲击键, 输入一个词组后敲击执行该敲击 键, 便可自动形成步骤1所述所需的隔开间隔宽度。 4.按照权利要求1所述的中文文本语句的排列组合处理方法, 其特征在于: 所述的自动 完成敲击动作方式采用在输入软件端 预先配置 建立设有词组数据库, 词组数据库内配置安 装设有步骤1所述语法规定的所有词组, 一旦在输入软件端需要输入录入的语句, 词组数据 库中的词组就会与输入的语句进 行自动识别比对, 并在 采集比对得到的相 邻词组之 间动形 成步骤1所述所需的隔开间隔宽度。 5.按照权利要求1所述的中文文本语句的排列组合处理方法, 其特征在于: 所述的步骤 1所述所需的隔开间隔宽度的宽度大于单个汉字之 间的间隔宽度, 可以眼睛直接识别词组, 不致混淆词组与字之间的区别。 6.按照权利要求1所述的中文文本语句的排列组合处理方法, 其特征在于: 所述的步骤 1所述所需的隔开间隔宽度可根据辨识度要求单独设定间隔宽度, 以能够避免混淆辨识为 准。 7.按照权利要求1所述的中文文本语句的排列组合处理方法, 其特征在于: 所述的步骤 1所述所需的隔开间隔宽度采用一个汉字的四分之一宽度或更窄。 8.按照权利要求4所述的中文文本语句的排列组合处理方法, 其特征在于: 所述的输入 软件端包括但不限于w ord软件。 9.按照权利要求1或3所述的中文文本语句的排列组合处理方法, 其特征在于: 所述的 敲击键采用借用现有键盘上配置的空格键或采用通过键盘自定义设置形成敲击键作用的 自定义键; 采用空格键或自定义键时, 在A2 步骤中, 在输入一个词组后执行再快速双击所述 空格键或自定义键动作形成步骤1所述所需的隔开间隔宽度。权 利 要 求 书 1/1 页 2 CN 114757196 A 2一种中文 文本语句的排列组合处理 方法 技术领域 [0001]本发明涉及 一种文本语句处理方法, 尤其是涉及 一种中文文本语句的排列组合处 理方法。 背景技术 [0002]原有中文文本排列组合存在的缺点: 由于中文象形文字(方块字)的特殊性, 语句 都是由单个字为单元排版, 往往依靠对整句语句的理解来辨识词组和语义, 阅读过程中读 者需要词组辨认环节, 会浪费一定时间, 而且词组的组合方式不是唯一的, 同时也由于词组 和语义本身存在一定的不确定性, 不同的字可存在多种组合使用状态, 致使组合起来的语 句更容易产生含义上的歧义现象发生。 [0003]以单个汉字为单元的语句排列, 地名、 人名、 专有名词等误认几率高。 例如 《史记 · 老子列传》 中说老子过关, “关尹喜曰 ”, 有人说是“关尹”是关卡的官员, “喜”是官员的名字; 有人说“关尹”是人名, 称为 “关尹子”; 也有人说应该是 “关尹” “喜曰”, 即“守关官员高兴 的 说”或“关尹高兴的说 ”, 由此形成较为明显的理解歧义。 如果以本发明申请方案以词组为单 元进行排列处理, 则如下: (1)关尹喜曰, (2)关尹喜曰, (3)关尹(人名放大)喜曰; 从而可更 好避免混淆。 并且古文中辨认地名、 人名、 专有名词和其他词组更为困难, 如果新出版古代 文献使用以 “词组”为单元的排版方法则可以降低阅读难度, 有利于普通读者学习古代文 化。 本方法对孩子学习中文更加有益, 由于孩子对词组不熟悉, 往往不知如何辨别词组, 学 习过程花费很多时间在辨认词组上。 [0004]中文表达力需提升 的背景介绍: 汉字来源于三千年前的甲骨文造字, 由于 甲骨文 造字已经结束, 不再产生新的汉字, 因此单个汉字的资源已经枯竭, 后来出现汉字词组来增 加中文语言 的表达力。 词组主要以二个汉字组成, 如: “我们、 精神、 宇宙、 世界、 时间、 空间 ” 等, 但人们对自然和事物的认识愈来愈深化、 细化、 广泛化、 情感化和概念化, 需要的词组愈 来愈多, 现在词组的资源也基本接近枯竭, 因此提升中文的表达力具有现实意义。 以词组为 单元的组合方式可以在原有词组后面增加表意符号或字, 如: 人性、 动物性、 存在性、 本原 性、 等“性”为词尾, 表达更为本质的含义; 机械化、 自动化、 拟人化、 虚拟化、 等以 “化”为词 尾, 表达一种趋势、 泛化、 内质传递; “性”、“化”等词尾可以随着时代表达的需要不断增加, 从而增加中文的表达力。 词组为单元 的语句呈现方式可以发展出词根+词尾的新式词组结 构, 二字词组+词尾组成的三字词组系统或三字词组+词尾组成的四字词组系统是二字词组 系统的有力补充。 增加大写(加大字号, 宽度不变, 高度略增加)来表示人名、 地名、 国名、 专 有名词、 缩略语等, 避免与普通词语的混淆。 [0005]名词解释 [0006]A: 词组间隔或空格; a: 单字间隔。 大写: 字体同宽, 高度略高于文本字体, 用 于人 名、 地名、 国家名、 专业组织名、 专业 术语、 缩略语等。说 明 书 1/5 页 3 CN 114757196 A 3
专利 一种中文文本语句的排列组合处理方法
文档预览
中文文档
7 页
50 下载
1000 浏览
0 评论
309 收藏
3.0分
赞助2.5元下载(无需注册)
温馨提示:本文档共7页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
下载文档到电脑,方便使用
赞助2.5元下载
本文档由 人生无常 于
2024-03-18 17:44:15
上传分享
举报
下载
原文档
(274.9 KB)
分享
友情链接
互联网信息服务算法推荐管理规定.pdf
重点网络安全:“3保1评”(分保、等保、关保、密评).pptx
ISO IEC 27005-2022 信息安全、 网络安全和隐私保护-信息安全风险管理指南.pdf
GB 22021-2008 国家大地测量基本技术规定.pdf
NB-T 10929-2022 风力发电机组 变流器 可靠性技术规范.pdf
NY-T 3850-2021 设施果菜秸秆原位还田技术规程.pdf
T-CEC 595—2022 基于云的电力应用的开发与测试要求.pdf
DB37-T 4074—2020 山东省美丽村居建设标准 山东省.pdf
GB-T 20204-2006 水利水文自动化系统设备检验测试通用技术规范.pdf
GB-T 20257.3-2017 国家基本比例尺地图图式 第3部分:125 000 150 000 1100 000地形图图式.pdf
GB-T 16180-2014 劳动能力鉴定 职工工伤与职业病致残等级.pdf
DB11-T 598-2018 供热企业服务规范 北京市.pdf
T-CAQI 225—2021 钢制模块化装配污水处理池体技术要求.pdf
DB34-T 1835-2022 高速公路收费人员微笑服务规范 安徽省.pdf
DB11-T 1190.1-2015 古建筑结构安全性鉴定技术规范 第1部分:木结构 北京市.pdf
DB42-T 1865.6-2022 政府网站集约化建设规范 第6部分:运维管理 湖北省.pdf
T-CEC 596—2022 量子IPSec VPN设备功能与检测技术规范.pdf
JR-T 0231—2021 银行业第三方软件开发工具包(SDK)安全接入指南.pdf
GB-T 42081-2022 志愿服务基础数据元.pdf
T-CEC 694—2022 变电站二次系统数字化设计编码规范.pdf
1
/
3
7
评价文档
赞助2.5元 点击下载(274.9 KB)
回到顶部
×
微信扫码支付
2.5
元 自动下载
点击进入官方售后微信群
支付 完成后 如未跳转 点击这里下载
站内资源均来自网友分享或网络收集整理,若无意中侵犯到您的权利,敬请联系我们
微信(点击查看客服)
,我们将及时删除相关资源。