在知识产权领域,专利的新颖性和创造性是评估其价值的关键因素。为了确定这些特性,专家需要深入比较专利文本和现有的技术文献,这是一个既复杂又耗时的过程。
现在,随着智慧芽垂直领域大模型的出现,上述任务将变得更加高效和精确。智慧芽垂直领域大模型(以下简称“智慧芽大模型”)通过X-embedding技术,能够理解和分析专利文献及其审查文件,从而提升专利对比能力。
一、训练数据的构建:多元化的文本来源
智慧芽垂直领域大模型的训练数据集是一个多元化的文本库,它不仅包括了专利文献,还涵盖了论文、书籍、代码和百科等多种类型的文本。在专利数据方面,智慧芽收集了专利的标题、摘要、权利要求、说明书文本,以及专利分类号信息和审查文件文本。这些数据经过智慧芽资深专家的精心设计和清洗,确保了训练数据集的质量和准确性,为模型提供了坚实的学习基础。
二、X-embedding语料:专利对比的核心
X-embedding语料是智慧芽垂直领域大模型进行专利对比分析的核心,它主要分为以下两类:
1. 审查意见通知书与关联专利信息的拼接文本:这种拼接文本将专利的详细信息与其审查意见通知书结合起来,为模型提供了一个完整的分析逻辑框架。通过这种方式,模型能够学习到专利的可专利性,并理解审查过程中的逻辑和依据。
2. 从审查文件中提取的X关系文本对:智慧芽的X关系文本对囊括了专利的各个文本层级,例如:段落级别的文本对、技术特征级别的文本对,它们揭示了不同专利之间的相似性和差异性。通过分析这些文本对,智慧芽大模型能够识别出专利文献中的关键技术特征,并评估不同专利之间的影响关系。
三、实现专利对比能力:从段落到技术特征的深入分析
智慧芽垂直领域大模型通过分析X-embedding语料,学会了如何从多件专利中提取出最接近的技术特征,并分析它们之间的新颖性和创造性。这就像是给模型提供了一把钥匙,让它能够打开专利对比的大门,深入理解专利文献的细微差别。
四、模型效果:智慧芽大模型的演示回答
智慧芽垂直领域大模型的演示回答效果显示,它不仅具备了专利对比分析的能力,还能提取影响技术特征。这意味着,智慧芽大模型能够自动分析专利之间的相似性和差异性,为用户节省了大量的时间和精力。通过这种自动化的对比分析,用户可以更快地获得关于专利新颖性和创造性的见解,从而作出更明智的决策。
五、实验数据样例:深入理解X-embedding技术
让我们通过一个具体的实验数据样例,深入了解X-embedding技术如何工作。
以专利CN112691417A为例,其审查意见通知书中提到了影响其可专利性的对比文件。这些信息被用来构建训练数据,使智慧芽垂直领域大模型能够学习到如何进行专利对比。
在这份审查意见通知书中,可以看到专利CN112691417A的权利要求1被认为不具备创造性,因为它与对比文件1(CN102380256A)公开的内容相似。通过将这些信息与专利CN112691417A的详细信息拼接,智慧芽大模型学会了如何识别和分析专利文献中的技术特征,以及它们如何影响专利的可专利性。
· X-embedding训练数据样例
1. 审查意见通知书+关联专利信息的拼接文本:
Patent under Examination(PN: CN112691417A): Claims: ... Public Patent 1 (PN: CN102380256A) Claims: ... Description: [0001] 技术领域 ... [0002] 本发明涉及 ... [0003] 背景技术 ... File Wrapper: 第一次审查意见通知书申请号:2020104381332 本申请涉及一种可逆洗浮床式反向污水处理系统及其处理方法。 经审查,现提出如下的审查意见:1、权利要求1不具备专利法第二十二条第三款规定的创造性权利要求1要求保护一种可逆洗浮床式反向污水处理系统。......
2. X影响关系层级文本组:
Paragraph of Patent under Examination(PN: CN112691417A): 1.一种可逆洗浮床式反向污水处理系统,用于将污水过滤处理成为净水,其特征在于,包含: ... Paragraph of Public Patent(PN: CN102380256A): 本实施例中,图1所示,该方法是在系统内装填有轻质颗粒介质滤料,从而形成滤料层即过滤区1,在滤料层上设置穿孔板2,... Sentence 1 of Patent under Examination(PN: CN112691417A): 多个轻质过滤砂,其填充在所述污水过滤室中,并通过水的浮力往上聚集在所述污水过滤室的上方; Sentence 1 of Public Patent(PN: CN102380256A): 该方法是在系统内装填有轻质颗粒介质滤料,从而形成滤料层即过滤区1,在滤料层上设置穿孔板2,... Feature 1 of Patent under Examination(PN: CN112691417A): 轻质过滤砂 Feature 1 of Public Patent(PN: CN102380256A): 轻质颗粒介质滤料 Sentence 2 of Patent under Examination(PN: CN112691417A): 一污泥排放装置,其设置在所述污水过滤槽的底部并连通于所述污水过滤室用于排出底部沉积污泥。 Sentence 2 of Public Patent(PN: CN102380256A): 系统底部装有排渣管8;已经投加净水剂并经过初步混凝的污水,从进水管7进入系统内,... Feature 2 of Patent under Examination(PN: CN112691417A): 污泥排放装置 Feature 2 of Public Patent(PN: CN102380256A): 排渣管
六、结论
通过X-embedding技术,智慧芽垂直领域大模型不仅提高了专利对比的效率,还提高了其准确性。这为知识产权领域的专业人士提供了一个强大的工具,能够帮助他们更好地理解和评估专利的新颖性和创造性。随着技术的不断进步,智慧芽将持续推动知识产权领域AI技术应用的创新和发展。