发明专利
专利类型未知
专利状态201710514238X
专利号专利号 | 201710514238X | 专利名称 | 基于N-gram模型的弹幕主题提取方法、介质、设备及系统 |
---|---|---|---|
专利类型 | 发明专利 | 国际分类 | G06F40/284(2020.01),G06F40/216(2020.01),H04N21/235(2011.01),H04N21/435(2011.01) |
申请人 | 申请地址 | 430000 湖北省武汉市武汉东湖开发区软件园东路1号软件产业4.1期B1栋11楼 | |
发明人 | 申请日期 | 2017-06-29 | |
下证状态 | 未知 | 更新时间 | 2025-05-27 08:17:09 |
专利摘要 | 本发明公开了一种基于N‑gram模型的弹幕主题提取方法、介质、设备及系统,涉及直播领域。该方法包括以下步骤:提取弹幕数据;提取表示某种特定意图的词语对应的特征,添加到自定义词库;将没有实际意义的词加入自定义停用词库;数据预处理:去除“弹幕内容”字段为空的数据;去掉“弹幕内容”字段中的标点符号;经过数据预处理的弹幕内容,采用N‑gram模型来表示,N‑gram模型表示语句中某词的出现概率与之前N‑1个词相关,N为正整数;将每条弹幕内容切分成一组词向量,依据自定义词库中的成词规则来切分每条弹幕内容,根据自定义停用词库来过滤无用的词语。本发明能够准确提取弹幕主题。 |
买卖双方需提供 | 平台提供 | 转让后买方可获得 | ||
---|---|---|---|---|
企业 | 个人 | 专利代理委托书 专利权转让协议 办理文件副本请求书 发明人变更声明 | 专利证书 手续合格通知书 专利登记簿副本 | |
买方 | 企业营业执照 企业组织机构代码证 | 身份证 | ||
卖方 | 企业营业执照 专利证书原件 | 身份证 专利证书原件 |
专利状态:已下证
专利类型:发明专利
询价专利状态:已下证
专利类型:发明专利
询价专利状态:已下证
专利类型:发明专利
询价专利状态:已下证
专利类型:发明专利
询价您的咨询我们已收到,稍后会有专业顾问与您联系。