发明专利
专利类型未知
专利状态2020106680108
专利号专利号 | 2020106680108 | 专利名称 | 一种混合粒度多视图新闻数据聚类方法 |
---|---|---|---|
专利类型 | 发明专利 | 国际分类 | G06F16/906(2019.01),G06K9/62(2022.01) |
申请人 | 重庆邮电大学 | 申请地址 | 400065 重庆市南岸区南山街道崇文路2号 |
发明人 | 代劲 | 申请日期 | 2020-07-13 |
下证状态 | 未知 | 更新时间 | 2025-05-27 08:48:55 |
专利摘要 | 本发明属于数据挖掘领域,特别涉及一种混合粒度多视图新闻数据聚类方法,该方法包括:采用TF‑IDF方法对原始的混合粒度多视图新闻数据进行特征选择,得到统一标签粒度的多视图新闻数据;计算该数据的TF‑IDF值,根据TF‑IDF值数据进行映射,得到各个视图的特征向量空间;计算各个视图的信息熵以及各个视图的权重;根据各个视图的权重对特征向量空间中的值进行加权融合,得到各视图的特征矩阵;采用多视图K‑means算法对融合后的特征矩阵进行聚类;本发明通过特征选择对不同粒度进行统一的标签生成处理,使各个视图的特征统一到相同的粒度,同时通过信息熵来反映不同视图对聚类簇结构的贡献程度,从而使聚类后的效果更好。 |
买卖双方需提供 | 平台提供 | 转让后买方可获得 | ||
---|---|---|---|---|
企业 | 个人 | 专利代理委托书 专利权转让协议 办理文件副本请求书 发明人变更声明 | 专利证书 手续合格通知书 专利登记簿副本 | |
买方 | 企业营业执照 企业组织机构代码证 | 身份证 | ||
卖方 | 企业营业执照 专利证书原件 | 身份证 专利证书原件 |
专利状态:已下证
专利类型:发明专利
询价专利状态:已下证
专利类型:发明专利
询价专利状态:已下证
专利类型:发明专利
询价专利状态:已下证
专利类型:发明专利
询价您的咨询我们已收到,稍后会有专业顾问与您联系。