摘 要:本文针对用户画像领域相关发明专利申请的专利申请和保护现状,对比国内外该领域专 利申请状况与授权率的异同,围绕典型案例解析该领域的客体审查标准,给出用户画像 领域专利申请客体审查的建议。

关键词:用户画像 客体判断 信息表达 技术方案

人工智能热点算法之用户画像相关专利申请保护现状及审查规则解析

一、引言

用户画像也被称为用户多维分析,是获悉用户 真实需求和指导企业产品设计的重要工具,它在很大 程度上体现了用户的真实特征和业务诉求。用户画像 本质上是现实用户在网络世界中的虚拟代表,是表达 用户需求和指导产品设计方向的重要工具。

构建画像的主要流程就是以用户自身属性和在 互联网上的交互数据为数据基础,通过建模或统计分 析得到用户特征再映射到业务标签上,从而形成用户 画像。目前用户画像在诸多领域都有广泛应用,例 如:产品设计、信息检索、推荐系统、风险控制、精 准营销等① 。

随着用户画像的广泛应用,其相关专利申请量 也出现了大幅增长。

涉及用户画像的发明专利申请呈现出两个主要 类型。一类是涉及用户画像本身的构建方法;另一类 是涉及用户画像在各个领域的应用。由于这两类申请 的解决方案中经常均会涉及算法特征以及商业规则和 方法特征,因此,该领域的发明专利申请如何才能构 成专利保护的客体成为企业界、实务界乃至学术界热 议的焦点问题。

二、专利申请及保护现状

(一)国内外专利申请态势

  1. 专利申请趋势

笔者围绕用户画像对中国专利摘要数据库、美 国专利全文数据库、欧洲专利全文数据库、日本专利 全文数据库、韩国专利全文数据库进行了检索,检索 截止时间为 2021 年 10 月。

参见图 1,根据从上述数据库获取的专利申请数 据进行分析,可以发现:全球在 2010-2021 年围绕该 领域的申请量呈现出上升趋势,特别是在 2019 年增 长最快, 比 2018 年同期增长了 1.5 倍,并在 2020 年 超过了 2,400 件。

人工智能热点算法之用户画像相关专利申请保护现状及审查规则解析

图1 全球用户画像领域发明专利逐年申请量趋势图

国内用户画像相关专利申请量也同样呈现出逐 年增长的趋势,同样是在 2019 年出现爆发式增长, 申请量接近 2018 年的 3 倍。正是由于中国用户画像相关专利申请量的快速增加,带动了五局整体的快 速上升趋势。特别是在 2020 年,我国申请量超过了 2,100 件,参见图 2。

人工智能热点算法之用户画像相关专利申请保护现状及审查规则解析

图2 中国用户画像领域逐年申请量

2 . 五局申请量对比

从中国、美国、欧洲、日本和韩国五局围绕用 户画像的专利申请量来看,参见图 3,中国在用户画 像领域的专利申请量 (5,761 件 ) 居于第一,美国 (802 件 ) 居于第二,日本 (209 件 ) 居于第三,欧洲仅有美 国的八分之一,中国的五十分之一,韩国占比最少。

人工智能热点算法之用户画像相关专利申请保护现状及审查规则解析

图3 用户画像领域五局申请量分布

3 . 重点申请人分布

全球用户画像相关专利的各申请人的申请量从 高到低次为:腾讯、百度、平安、阿里巴巴、京东、 深圳壹账通、北京三快、北京达佳互联、奇虎、北京 奇艺世纪,参见图 4。

可以看出,自 2010-2021 年, 国内在用户画像 相关申请比国外活跃,前 10 名全部来自国内;在五 局中,中国相关申请量占据明显优势。

人工智能热点算法之用户画像相关专利申请保护现状及审查规则解析

图4 用户画像领域申请量前10

4 . 中、美、日局授权率对比

图 5 是中、美、日三局关于用户画像领域的授 权率对比图。可以看出,日本、美国在用户画像领域 的专利授权率分别为 46% 和 43%,明显高于中国用 户画像领域的授权率 10%。

从这点可以反映出,用户画像领域的专利申请 在中国较难获得专利权。这与我国在该领域明显处于 领跑地位的专利申请量形成了鲜明的对比。

人工智能热点算法之用户画像相关专利申请保护现状及审查规则解析

图5 中、美、日局用户画像领域授权率对比图

三、审查规则解析及典型案例

(一)现有审查规定

如上所述,用户画像相关发明专利申请的特点 就是权利要求的方案中包含算法特征或商业规则和方 法特征,而算法特征以及商业规则和方法特征因不属 于技术特征,故而,当技术特征和非技术特征交织在 一起时,容易给方案是否构成专利保护客体的判断带 来难点。

《专利审查指南》第二部分第九章第 6.1.2 节规定: 对一项包含算法特征或商业规则和方法特征的权利要 求是否属于技术方案进行审查时,需要整体考虑权利 要求中记载的全部特征。如果该项权利要求记载了对 要解决的技术问题采用了利用自然规律的技术手段, 并且由此获得符合自然规律的技术效果,则该权利要 求限定的解决方案属于专利法第二条第二款所述的技 术方案。如果权利要求中涉及算法的各个步骤体现出 与所要解决的技术问题密切相关,如算法处理的数据 是技术领域中具有确切技术含义的数据,算法的执行能直接体现出利用自然规律解决某一技术问题的过程, 并且获得了技术效果,则通常该权利要求限定的解决 方案属于专利法第二条第二款所述的技术方案。

上述规定强调了对于包含算法特征或商业规则 和方法特征的新领域、新业态相关发明专利申请,如 果上述算法特征或商业规则和方法特征能够与技术特 征一起,或者能够使方案整体上解决技术问题,那么 也可以构成技术手段的一部分。特别是,对于改进在 于算法的解决方案,如果该解决方案涉及的算法特征 能够体现出其具体的应用领域,并且能够解决该领域 中的技术问题,例如,该解决方案中算法处理的数据 是诸如图像领域中的像素或视频、通信领域中的代码、 语义解析过程中的文本或词句,亦或是其他具体领域 中的技术问题,并且,权利要求中的算法各步骤要能 体现出解决该技术问题的具体过程,那么,该解决方 案能够构成技术方案。

下面,笔者将结合两个案例,从正反两方面介 绍上述审查规则的具体适用方式。

(二)典型案例

  1. 案例 1 :一种电力行业的用户画像构建方法【案情概述】

目前,电力行业普遍是构建用户价值细分体系, 得到不同价值的用电客户后,再根据某些定量的指标 提供增值服务。然而,这样的方法存在以下缺点:没 有将定性数据和定量数据相结合,得到的结论的可解 释性不高,从而不能清楚、全面地描述用户行为的具 体特征。

为此,该申请提出了一种电力行业的用户画像 构建方法,将电力行业的用户行为的频度、程度、近 期预测相结合,能够多方位描述不同属性的用电客户 的行为特征,从而有效辅助电力公司的业务人员根据 用电客户的情况提供差异化增值服务。

【权利要求】

  1. 一种电力行业的用户画像构建方法,其特征 在于,包括:

根据数据库中的字段生成用户的基本属性标签, 其中所述用户的基本属性包括地区、电压等级、行业、 用电类别、入网时长、是否为高耗能、是否为三方用 户;和 / 或

基于用电行为、缴费行为和交互行为分别生成 用户的基本行为标签;

基于所述用电行为生成用户的基本行为标签包括:

基于安全用电行为、异常用电行为、变更用电行 为、正常用电行为分别构建用户的二级行为标签体系;

基于所述安全用电行为构建用户的二级行为标 签体系包括:

生成用以描述所述安全用电行为的二级行为标 签,申请文件以及审查过程

其中,所述用以描述所述安全用电行为的二级 行为标签包括 :用电设备安全性高、用电设备安全性 低、用电安全管理能力高、用电安全管理能力低;

所述用户画像构建方法还包括:生成用以描述所 述用电设备安全性高 / 低的三级行为标签,

其中,所述用以描述所述用电设备安全性高 / 低 的三级行为标签包括:频繁出现安全隐患、偶尔出现 安全隐患、从不出现安全隐患、曾出现严重安全隐患、 未曾出现严重安全隐患、潜在安全用电风险低和潜在 安全用电风险高;

生成用以描述所述用电设备安全性高 / 低的三级 行为标签包括:

从用电检查表中获取用户近三年安全隐患总次 数,并计算相应的近三年安全隐患频率 ;若所述近三 年安全隐患频率高于行业月平均安全隐患频率,则生 成所述频繁出现安全隐患的三级行为标签,否则生成 所述偶尔出现安全隐患或 所述从不出现安全隐患的 三级行为标签;

根据所述用电设备的安全隐患类型生成所述曾 出现严重安全隐患或所述未曾出现严重安全隐患的三 级行为标签;

从所述用电检查表中获取用户近三月安全隐患 总次数,并计算相应的近三月安全隐患频率 ;若所述 近三月安全隐患频率高于预设频率阈值,则生成潜在 安全用电风险高的三级行为标签,否则生成潜在安全 用电风险低的三级行为标签。

【案例分析】

权利要求 1 涉及一种用户画像构建方法,该方法 所要解决的问题是当前电力行业不能清楚、全面地描 述用户行为的具体特征。为解决上述问题,该申请所采用的手段是通过人为设定的属性信息和用电行为、 缴费行为和交互行为来描述客户的特征以构建用户画 像,上述手段中用于描述用户属性信息、用户行为信 息的具体指标仅仅是人为设定的用户画像的信息表达 方式,各级指标的设定也是人为设定的画像构建规则, 并非遵循自然规律的技术手段。因而,该申请未采用 遵循自然规律的技术手段解决技术问题,所获得的多 方位描述不同属性的用电客户的行为特征,从而有效 辅助电力公司的业务人员根据用电客户的情况提供差 异化增值服务的效果,不属于技术效果。因此该申请 的解决方案不属于专利法第二条第二款规定的技术方 案,不构成专利保护的客体。

虽然可能也有观点会认为:该申请通过根据数据 库中的字段生成用户的基本属性标签,并非依赖人为 定义的标准来达到发明目的,对用户的基本属性和基 本行为的确定是需要大数据的采集和分析才能实现 的,是技术手段。对于用户具体对应哪种基本行为标 签的确定过程,是需要预设公式对获得的用户数据进 行计算,根据计算结果才确定,并不能通过人为定义 的方式直接确定,其本质是通过计算机程序对获得的 数据按照预设规则进行处理,最终输出计算结果存在 可遵循的自然规律,并不受到人的思维的影响。

对此,笔者认为,虽然权利要求所限定的方案 记载了可以使用数据库等数据处理手段,但是数据库 的使用并不能直接构成技术手段,该申请的解决方案 并不涉及数据库技术中有何技术问题需要解决,而仅 仅是利用数据库的数据存储的固有功能。其次,虽然 该申请也可以通过计算机来运行预设公式计算获得结 果,但利用计算机进行数据处理仍是计算机固有的数 据处理性能,利用计算机进行电力行业用户画像数据 的存储、处理,与计算机运行其他应用程序一样,计 算机作为程序的执行载体,其硬件结构或内部性能不 会发生任何技术上的改变。因而,即便该申请的方案 中记载了数据库等手段,但整体上分析可知,该申请 请求保护的用户画像构建方法仅仅是对于电力行业用 户画像的简单信息表达,并未解决电力行业中的技术 问题,所设定的画像构建规则并非遵循自然规律的技 术手段,无法获得技术效果。因此,仅针对某领域 通过设定画像构建规则而未能解决任何技术问题的申 请,难以获得专利保护。

  1. 案例 2 :一种基于对话交互的画像构建方法 【案情概述】

现有的用户画像方法主要是通过大数据统计分 析对用户画像进行构建,用户的属性标签通过对日志 信息关键字段的提取来获得。通常有两种方式:一种 是,存储用户的日志信息,当用户日志信息达到设定 阈值后,根据静态日志构建用户画像;另一种是,保 存用户日志,在一定时间窗口内遍历所有用户日志, 根据某种权重衰减函数计算得到最新的用户画像。第 一种方式应用的最普遍,然而忽略了用户属性或偏好 随时间改变的性质,使得越到后期对用户画像的刻画 越不准确;第二种方式虽然考虑了时间因素,但推进 时间窗口需要积累用户日志,使得更新缺乏实时性, 而且不同的时间窗口设定会影响用户画像的效果,调 节参数复杂困难。

针对现有技术存在的上述不足,该申请提出了 一种基于对话交互的用户画像的构建方法,通过语义 解析器对用户的输入进行实时解析,并根据解析到的 用户语义对各个属性的权重的加权分布进行更新,从 而生成准确细致的画像。

【权利要求】

  1. 一种基于对话交互的画像构建方法,其特征在 于,通过语义解析器对用户的输入进行实时解析,并 根据解析到的用户语义对各个属性的权重的加权分布 进行更新,从而生成准确细致的画像;

所述的语义解析器,根据任务需求设计用户画 像中的属性标签构建得到,具体步骤包括:

1)建立领域相关数据库或知识库,不同领域的 信息分类存储和分析;

2)对于所有基础属性和每个独立领域,分别构 建语义解析器,最终将各个语义解析器贯通,得到完 整的语义解析器;

所述的属性标签包括基础属性和领域属性;

所述的基础属性包括:姓名、性别、年龄、电话、 家庭住址和公司地址;

所述的领域属性包括:常去目的地、常听的歌和 常拨的号码;

所述的语义解析器采用槽值对的方式表示语义, 其中:槽即为属性标签的名称,值即为该属性标签对 应的值;

所述的用户的输入包括:语音、文字或手势;

所述的实时解析,是指解析语义的过程是实时 的,即每得到一次用户的完整输入时,对该次用户输 入作语义解析;

所述的实时解析除了解析当前对话输入,还需 对上下文对话逻辑进行解析,并且采用语义资源定制 的方式构建语义解析器;

所述的更新,包括更新基础属性的值和领域属 性的值;

在更新基础属性和领域属性的值时,进行权重 和衰减因子处理;

所述的权重和衰减因子处理是指:首先设定时间 窗口 T,在该时间窗口内,时间越近的权重越高,含 有衰减因子的权重计算公式为:wAki = e-p(t0-t), (略);

所述的基础属性的值,通过以下方式实现更新: 设定时间窗口 T1,(略);

所述的领域属性的值,通过以下方式实现更新: 设定时间窗口 T2,(略)。

【案例分析】

权利要求 1 请求保护一种基于对话交互的画像 构建方法,其所要解决的问题是通过语义解析器对用 户的输入进行实时解析,降低参数调节复杂性,这属 于技术问题。为解决上述技术问题,该申请所采用的 手段包括对用户输入的语音、文字、手势进行语义解 析,将语义解析后的属性值的权重计算和分布更新, 而语音、文字、手势等是自然语言和图像识别领域常 用的技术数据。该申请权利要求 1 中不仅提及了用户 输入是语音、文字等,算法各步骤也紧密围绕如何对 输入的内容进行解析,并如何对解析后的属性值对属 性标签进行更新的具体过程,也就是说,该申请记载

的算法特征处理的数据是技术领域中具有确切技术含 义的数据,且权利要求中涉及算法的各个步骤体现出 与所要解决的上述技术问题密切相关,算法的执行能 直接体现出利用自然规律解决上述技术问题的过程, 该申请所获得的相应的效果属于技术效果。因此,该 申请请求保护的解决方案构成专利法第二条第二款规 定的技术方案,属于专利保护的客体。

四、结语

通过对用户画像领域专利申请的国内外申请现 状以及国内外授权情况的对比分析,可以看出,我国 在用户画像领域的专利申请量和申请热度方面具有优 势,但是,依照目前审查规则,对该领域的客体审查 方面还较为严格。

在审查实践中,应该客观分析方案中涉及的算 法特征或商业规则和方法特征,当它们能够整体上使 发明解决技术问题时,应承认其作为技术手段的一部 分,并在创造性评判过程中认可其有可能对发明带来 的技术贡献。不能武断认为算法改进的解决方案就一 概不能获得专利保护,这样会打击创新主体对于人工 智能热点算法的研发热情,不利于人工智能产业落地 和发展,更不利于新领域、新业态创新成果的保护和 应用。

在申请实务中,应该正确理解审查规则和适用, 在撰写用户画像等人工智能领域热点算法改进的发明 专利申请时,应在申请文件中写明算法的具体应用领 域,不涉及具体应用领域的,应写明是否涉及计算机 内部性能的改进,算法处理的对象是否为技术领域中 具有确切技术含义的数据,权利要求记载的方案中, 应写明算法各步骤用于解决某技术问题的具体过程, 而并非仅在权利要求的主题名称或数据处理来源中表 明该申请的应用场景或数据来源。

专家点评

人工智能在产业界落地的过程中,围绕其应用层面的算法相关发明专利申请日渐增多。以协同过滤、社区发现、 知识图谱、用户画像、差分隐私等为代表的算法改进解决方案层出不穷。本文紧密围绕“用户画像”这一热点申请, 通过对比五局专利申请态势和审查结论差异,能够让读者直观感受到我国在专利申请数量上的优势和授权率方面的 劣势,进而通过用户画像领域两件典型示例,为读者解析了为何单纯的画像构建方法难以获得专利保护,而现有规 定中的“具有确切技术含义的数据”在客体判断时如何具体适用。最后,本文在结束语中围绕审查实践和代理实务, 给出了意见和建议,有助于促进专利审查和申请质量共同提升。

审核人:邹斌 国家知识产权局专利局电学发明审查部商业方法处处长