(19)国家知识产权局
(12)发明 专利申请
(10)申请公布号
(43)申请公布日
(21)申请 号 202210355136.9
(22)申请日 2022.03.31
(66)本国优先权数据
202210164327.7 202 2.02.22 CN
(71)申请人 北京颐圣智能科技有限公司
地址 100025 北京市朝阳区高碑店乡八里
庄村陈家林甲2 号尚巴里文创园B座三
层304(A)室
(72)发明人 周禹同 魏先友
(74)专利代理 机构 北京天达知识产权代理事务
所(普通合伙) 11386
专利代理师 李明里
(51)Int.Cl.
G16H 50/30(2018.01)
G16H 50/70(2018.01)G06F 40/30(2020.01)
G06F 16/25(2019.01)
G06N 3/04(2006.01)
G06N 3/08(2006.01)
(54)发明名称
一种基于临床行为反馈的自学习医疗风控
系统及方法
(57)摘要
本发明涉及一种基于临床行为反馈的自学
习医疗风控系统及方法, 包括至少一个医生端和
服务端; 服务端接收临床医生通过医生端在诊疗
过程中产生第一数据文件; 在对第一数据文件进
行结构化处理后, 通过内置的风控模 型进行处理
得到风控结果, 并反馈回到对应的医生端; 临床
医生通过医生端, 根据风控结果对第一数据文件
进行修改和/或补充得到第二数据文件; 服务端
接收医生端发送的第二数据文件, 根据对应的第
一数据文件、 第二数据文件和风控 结果对本次风
控结果进行评价, 并依据评价结果通过自学习的
方式更新风控模 型。 本发明利用医生临床行为的
反馈对模型进行评价, 使模型基于策略逻辑自我
迭代更新, 判断依据更加的精准。
权利要求书4页 说明书14页 附图4页
CN 114678132 A
2022.06.28
CN 114678132 A
1.一种基于临床行为反馈的自学习医疗风控系统, 其特征在于, 包括至少一个医生端
和服务端; 所述 服务端与每 个医生端通信连接进行 数据交互;
所述服务端接收临床医生通过某个医生端在诊疗过程中产生的包括病案数据在内的
第一数据文件; 在对第一数据文件进行结构化处理后, 通过内置的风控模型进行处理得到
风控结果, 并反馈回到对应的医生端; 临床医生通过所述医生端, 根据风控结果对所述第一
数据文件进行修改和/或补充得到第二数据文件;
所述服务端接收所述医生端发送的第二数据文件, 根据对应的第一数据文件、 第二数
据文件和 风控结果对本次风控结果进行自动评价, 并依据评价结果, 通过自学习的方式更
新风控模型。
2.根据权利要求1所述的自学习医疗风控系统, 其特征在于, 所述服务端包括结构化处
理模块、 评价模块、 风控 模型和自学习训练数据库;
所述结构化处理模块, 用于采用NLP方法, 对第 一数据文件或第二数据文件进行处理得
到结构化的第一数据文件St或第二数据文件St+1;
所述风控模型, 用于根据所述结构化的第一数据文件St进行处理得到风控结果at;
所述评价模块, 用于根据每次诊疗过程中对应的结构化的第一数据文件St、 第二数据文
件St+1和风控结果at, 对每次风控结果进行评价得到 评价结果rt;
所述自学习训练数据库, 用于将每次医疗 风控中对应的第一数据文件St、 第二数据文件
St+1、 风控结果at和评价结果rt作为1组医疗风控记录数据进行存 储;
所述风控模型为自学习的神经网络模型, 通过从自学习训练数据库中调取多组 的医疗
风控记录数据进行自学习训练, 更新模型参数。
3.根据权利要求2所述的自学习医疗风控系统, 其特征在于, 所述风控模型包括第 一风
控模型和/或第二 风控模型;
所述第一风控模型为风险识别模型, 用于对包括病案数据在内的结构化的第 一数据文
件St中存在的包括选择错误、 内容漏填和内容冲突在内的风险进行识别输出风控结果at; 风
控结果at反馈到医生端后, 临床医生在医生端参照风控结果at对所述第一数据文件St进行
修改得到第二数据文件St+1;
所述第二风控模型为辅助决策模型, 用于依据包括病案数据在内的结构化的第 一数据
文件St产生后续诊疗 辅助决策结果的风控结果at; 辅助决策结果反馈到医生端后, 临床医生
在医生端参照辅助决策结果对所述第一数据文件St进行诊疗决策内容的补充得到第二数
据文件St+1。
4.根据权利要求3所述的自学习医疗风控系统, 其特征在于, 所述第 一风控模型或第 二
风控模型的结构相同, 均包括:
神经网络结构相同的当前策略网络和目标策略网络; 神经网络结构相同的当前价值网
络和目标价 值网络;
其中,
所述当前策略网络, 以结构化的第一数据文件St为输入, 输出对所述第一数据文件的风
控结果at; 在风控模型的每次自学习后, 对当前 策略网络的网络参数进行 更新;
所述目标策略网络, 其网络参数为延时同步的当前决策网络的网络参数; 用于在风控
模型的自学习过程中, 根据输入的结构化后的第二数据文件St+1, 产生对第二数据文件的风权 利 要 求 书 1/4 页
2
CN 114678132 A
2控结果at+1;
所述当前价值网络, 用于在风控模型的自学习过程中, 根据输入的结构化后的第一数
据文件St和对应的风控结果at进行预测得到当前自学习过程的Q值; 在风控模型的每次自学
习后, 对当前 策略网络的网络参数进行 更新;
所述目标价值网络, 用于在风控模型的自学习过程中, 根据输入的第二数据文件St+1和
以第二数据文件St+1为输入在所述目标策略网络中输出的风控结果at+1进行预测得到当前
自学习过程的Q ’值; 其网络参数为延时同步的当前价 值网络参数。
5.根据权利要求 4所述的自学习医疗风控系统, 其特 征在于,
所述自学习的学习过程中, 包括以下步骤:
从自学习训练数据库随机采样N组医疗风控记录数据{St, j、 at, j、 rt, j、 St+1, j}; j=1,2,
3…N; St, j为第j组数据中的结构化的第一数据文件, at, j为第j组数据中的结构化的风控结
果; rt, j为第j组数据中的评价结果; St+1, j为第j组数据中的结构化的第二数据文件;
使用St, j和at, j在所述当前价 值网络中进行 预测, 计算出St, j为输入的预测价 值Q;
使用St+1, j在目标策略网络中计算出at+1, j;
结合St+1, j和at+1, j在所述目标价值网络中进行预测, 计算出以St+1, j为输入的目标的预
测价值Q’;
结合Q’和rt, j计算出以St, j为输入的目标价 值;
根据N次学习的损失梯度来更新当前价值网络参数; 所述损失梯度根据St, j为输入的预
测价值和目标价 值确定;
使用N次学习的最大化预测价 值来更新当前 策略网络的参数。
6.根据权利要求2所述的自学习医疗风控系统, 其特 征在于,
所述结构化处理模块, 采用NLP算法将非结构化的病案数据转换为语义空间中的高维
度向量表示;
在所述高维度向量表示中, 病案数据中每个句子的文本数据对应一个句子向量, 每个
句子向量均包括 一个字段名向量和多个词向量。
7.根据权利要求6所述的自学习医疗风控系统, 其特 征在于,
风控模型中的策略网络采用端到端结构的神经网络; 包括编码器网络和解码器网络;
所述编码器网络, 用于对语义空间中的包括每个句子的字段名向量和词向量的高维度
向量进行编码得到向量空间中的所有句子编码后的高维编码向量;
解码器网络, 用于对所述编码器网络 输出的高维编码向量进行解码, 输出质控结果;
所述解码器网络的解码过程为循环解码; 每次解码输出一个质控点结果, 多次解码输
出多个质控点结果;
在每次解码过程中, 将所述编码器网络输出的高维编码向量配合上一 次解码输出的质
控点结果作为本次解码的输入。
8.根据权利要求7所述的自学习医疗风控系统, 其特征在于, 所述编码器网络包括第 一
编码网络和第二编码网络;
所述第一编码网络中, 包括与句子向量数量相同的句子编码网络;
每个句子编码网络对句子向量进行编码, 得到包括句子位置+内容编码向量的句编码
向量; 所述句 子位置编码向量为对语义空间中的句 子向量的字段名向量进行编码的结果;权 利 要 求 书 2/4 页
3
CN 114678132 A
3
专利 一种基于临床行为反馈的自学习医疗风控系统及方法
文档预览
中文文档
23 页
50 下载
1000 浏览
0 评论
309 收藏
3.0分
温馨提示:本文档共23页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
本文档由 人生无常 于 2024-03-18 17:44:49上传分享