专栏名称: 果汁焗酱油
酱油君私人图书馆:定期更新果汁局公益讲座直播地址、课件及视频资源;不定期更新学习笔记,随心情发布酱油君的碎碎念。
目录
相关文章推荐
中核集团  ·  今日元宵,前方→核工业不夜城! ·  昨天  
中核集团  ·  新春走基层 | 在核岛上蹁跹起舞的他们 ·  2 天前  
51好读  ›  专栏  ›  果汁焗酱油

都告诉你了,PSS很莫名其妙的

果汁焗酱油  · 公众号  ·  · 2020-02-14 11:11

正文

不少胖友看完上期 ✍专利族的泥石流概念 以后,纷纷表示“糊涂了!”。君真的是太难了……emmmm…… 我怀疑有人来砸场子,但是我没有证据。


往事随风,过去的就让它过去吧!


今天要从 专利族 的角度来讨论一下 PSS 系统,被酱油君搞糊涂或者还不清楚专利族是啥的小伙伴们我还是推荐你们把 上期 再复习一下,说不定多看两遍就茅塞顿开了


你们可以,你们能行!

鉴于PSS系统在圈内实在是没什么通称,叫“专利检索及分析系统”的有之,叫“专利检索与服务系统”的有之,叫“外网S系统”的有之。 先来明确一下: 本文所说的PSS,全称叫做Patent Search and Analysis,也就是我们从果汁局官网进去后的专利检索及分析系统,之所以叫PSS,是因为它的官网地址是 http://pss-system.cnipa.gov.cn/

上期 中, 提到了WIPO定义的6种同族:简单专利族、复杂专利族、扩展专利族、国内专利族、内部专利族和仿专利族。当然了,这6种定义并不是为了玩什么花样,而是有着十分现实的意义☟☟:

在不同的专利检索系统中,如果系统采用不同的专利族定义,得到的检索结果数量会大不相同。

目前,在主流的检索系统中,专利族有三种形式:

1. 以Espacenet为代表的简单专利族
简单专利族的呈现形式为: 专利族成员优先权完全一致。 业界传闻,欧专局的Espacenet系统检索结果页面中显示的“ Also published as ”中的信息就是根据简单专利族的定义给出的。 但是这个地方酱油君要打个问号,因为根据酱油君的检索,并不是这样,“ Also published as ”给出的不完全是简单专利族。

咱们可以举一个专利界的经典例子,NL8901402、NL9000338、UA73532C2和CA2475414A1这四篇文献。为防止把你们绕晕,我们姑且依次简称为ABCD吧!看Original Document的著录项目,它们的优先权关系是:A没有优先权,B的优先权是A,C和D这两篇文献的优先权均同为A和B。BUT,你去查C,费解的是它的 Also published as 里只有A这一篇文献。这是少了的情况。

有的小伙伴说,你这个孤例不能代表什么,再说这个文献那么老。那OK,再来一个, CN108024365A 这篇文献,它的优先权申请为CN201610974102和CN201710007820。
CA3042828A1 这篇文献,它的优先权申请为CN201610974102、CN710007820以及CN710686460。而 CN108024365A Also published as 里,居然出现了 CA3042828A1 ,怎么看它们的优先权申请也不是“完全一致”啊喂!而且它们不老,都是16、17年的文献哦。这是多了的情况。


一会儿少了,一会儿多了,“ Also published as ”究竟是个什么路数,酱油君也闹不清,反正,反正不完全是简单专利族。


Anyway,简单专利族要求成员优先权完全一致,收录范围最小。 (注:下图是旧版Espacenet截图,新版Espacenet的使用方法马上推出)


2. 以INPADOC为代表的扩展专利族

欧专局的INPADOC是国际专利文档( INternational PAtent DOCumentation )的缩写。INPADOC专利族的呈现形式为: 一个专利族的文献之间至少能通过一个优先权发生关联 当然,这就是扩展专利族的定义了。


还需要注意, INPADOC中还具有少部分的人工专利族。 这是由于早期的文献中包含大量等同专利,但是这些等同专利并没有通过优先权来进行关联,因此,EPO的检索小组通过发明人、申请人、发明主题等找到这些等同专利,并为其分配虚拟优先权号,作为一个专利族。总体来说, INPADOC专利族实际上是扩展同族与早期没有优先权号专利的人工专利族的合集


INPADOC采用扩展专利族,会收录很大范围的文献量,但由于基于优先权理念和同族的意义的放宽,可能引入技术相关但发明内容毫无关联的专利。


3. 以DWPI为代表的人工专利族

DWPI,德温特世界专利索引数据库( Derwent World Patents Index )。德温特的专利族由两部分组成:


第一部分的构成与简单专利族类似,但在1992年第16周以前,如果A文献与已经记录在德温特系统中的B文献具有同样的最近优先权,A文献被定义为相同专利。1992年第16周以后,A文献的所有优先权必须准确地与专利族中其他专利文献的所有优先权匹配,才被划归到专利族。


第二部分是将没有优先权数据的等同专利通过人工改写归为一条记录。这种专利与基本专利的申请人相同并且发明主题也相同,但由于是在原始申请之后的12个月之后申请,而不能享受优先权,不满足优先权完全匹配的条件。德温特注重依赖发明内容之间的关联度,它的人工改写理念是“一记录一发明”。


“一记录一发明”这种人工改写理念,极大地造福了专利的情报分析和信息利用,因为有这样不重不漏的数据源,可以充分提高专利情报分析、专利信息利用的有效性和准确性。因此,DWPI也在咱们专利界树足了“靠谱”的形象,收到IPer的欢迎。


理论上,DWPI同族的范围要大于简单同族,而小于INPADOC专利族。


目前,很多专利检索系统都意识到了简单专利族和INPADOC专利族的局限性: 简单专利族的收录范围过窄,而扩展专利族又过于宽泛。


因此,国内许多商用专利检索分析系统都在向DWPI的人工专利族方向发展,但是,它们目前尚无法完全实现德温特的人工改写模式,而是通过优化算法和机器学习等方式来优化自身的同族合并功能, 主要原理包括两种

①基于INPADOC同族数据进行优化
采用这种优化原理的平台主要有Incopat、智慧芽、万象云等,主要思路是 去除INPADOC同族中与发明内容明显无关的专利 。它们通常在工具的界面同时提供“简单同族”、“INPADOC”同族和“优化后的同族”三种类型的同族功能供用户选择。

当然了,鉴于每家平台采用的算法和逻辑不一样,如果你去检索几个专利族,大概率在不同平台得到的结果数也不会一样。


②基于“内容相似度”优化同族关系
采用这种优化原理的平台主要是Patentics,它同样采用了“INPADOC同族”的数据,主要思路是 引入一个“最早优先权日”的参数,仅将INPADOC同族数据中的最早优先权日相同的文献作为一个同族

此外,Patentics还提供了一种叫做“相似度排序”的功能,可以反映同族文献之间在发明内容上的相似关系。但是,目前Patentics只是提供了这个功能,并未利用“相似度”理念对INPADOC同族的数据进行优化。日后,如果采用发明内容相似度对其进行优化,那大概是极好的,可以很大程度上减少无关专利的引入,提供同族合并功能的质量,使得同族分析更加准确。



然并卵,“向DWPI的人工专利族学习”这种事,……,而国内目前正在做这件事的商用机构又都是小本生意。同族或者说专利族这种“高端”服务,无一不是要收费、要会员的。作为知产界的小P民,一年好几万的会员费用,怎么可能拿得出来,每每此时,只好扼腕叹息,问君能有几多愁,恰似一江春水向东流。


我们举几个小例子,简单了解一下果汁局的PSS系统、Espacenet的“ Also Published As ”栏目和INPADOC得到的专利族结果差异。这样做的目的嘛,很简单,酱油君只想告诉大家:
PSS的专利族检索功能,可能也许不咋靠谱!


例子1: 公告号CN106454800B 北京小米移动软件有限公司

这是一篇关于手机身份验证的已授权发明专利。首先我们在PSS系统中检索这篇文献,检索结果页显示有4个同族,然后点入同族文献信息页,发现有6条结果。哈?到底是4个还是6个?

在同族文献信息页仔细数一数,PSS系统列出了以下6篇文献 (包括CN106454800B本身)

而从申请号来看,这6篇文献其实就是3个申请。

那我们到EPO的Espacenet上再看一下,有多少同族呢?在“Also Published As”一栏,可以看到有5篇文献,加上CN106454800B本尊,一共是6篇文献。


再查一查INPADOC,只有3篇:

所以,如果不把同一申请的不同公布阶段的版本合并计算,数量应该是6;如果把同一申请的不同公布阶段的版本合并计算,数量也应该是3。


那么现在问题来了, PSS系统检索结果页上的“同族4”是怎么出来的呢?莫名其妙ing。



例子2: CN108040360A 北京小米移动软件有限公司

这一个例子也是小米的,关于屏幕显示控制。如果你从上一个例子中学到的是“不要看检索结果页的同族数量,要看同族文献信息页的同族数量”,那你就大错特错了。


比如,我们在PSS系统中检索CN108040360A这篇文献,检索结果页显示有4个同族,然后点入同族文献信息页,发现有4条结果——嗯,这次数量倒是对上了。







请到「今天看啥」查看全文