发明专利
专利类型未知
专利状态2019104061789
专利号专利号 | 2019104061789 | 专利名称 | 一种基于关键词序列结构的文档相似度度量方法及系统 |
---|---|---|---|
专利类型 | 发明专利 | 国际分类 | G06F40/30(2020.01),G06F40/289(2020.01),G06F40/194(2020.01),G06F16/33(2019.01),G06F16/335(2019.01) |
申请人 | 申请地址 | 212003 江苏省镇江市学府路61号 | |
发明人 | 申请日期 | 2019-05-16 | |
下证状态 | 未知 | 更新时间 | 2025-01-14 07:07:08 |
专利摘要 | 本发明公开了一种基于关键词序列结构的文档相似度度量方法,该方法包括:存储两篇文档W1与W2并设置关键词序列,在文档W1与W2内分别查找所述关键词序列中的所有关键词出现的位置集合;根据关键词出现的位置生成关于关键词序列分别在文档W1与W2中的特征集合,进而得到所述关键词序列分别在W1与W2中的结构特征值;根据所述关键词序列在W1与W2中的结构特征值计算文档W1与W2关于所述关键词序列的相似度。本发明有利于规避文档词句语义角度度量相似性的偏差,本发明也可以规避已有方法中的从关键词角度度量相似性时,忽视一组关键词前后因果关系在文档分布结构特征提取中影响的不足,实用性更强,准确率更高。 |
买卖双方需提供 | 平台提供 | 转让后买方可获得 | ||
---|---|---|---|---|
企业 | 个人 | 专利代理委托书 专利权转让协议 办理文件副本请求书 发明人变更声明 | 专利证书 手续合格通知书 专利登记簿副本 | |
买方 | 企业营业执照 企业组织机构代码证 | 身份证 | ||
卖方 | 企业营业执照 专利证书原件 | 身份证 专利证书原件 |
专利状态:已下证
专利类型:发明专利
询价专利状态:已下证
专利类型:发明专利
询价专利状态:已下证
专利类型:发明专利
询价专利状态:已下证
专利类型:发明专利
询价您的咨询我们已收到,稍后会有专业顾问与您联系。