引言：日前，智慧芽联合创始人关典接受了全球知名华文媒体《联合早报》的专访，深入阐释了智慧芽垂直领域大模型的初衷与未来发展计划。

微信图片_20240516102040.png

以下是报道全文

文 | 李娅宁

智慧芽，一家由大学生创业项目起步的公司，获得软银（SoftBank）、腾讯等投资机构的青睐，发展成为估值超过10亿美元的独角兽，在生成式AI席卷全球的时代，它又急流勇进投身其中。

成立17年，以专利数据库起家，成为覆盖专利、生物医药、科创的数据服务平台，从一棵嫩芽到枝繁叶茂，智慧芽走过了很多重要节点。三年前，智慧芽刚完成3亿美元的E轮融资，跻身独角兽之列；如今，公司投资数百万元打造行业内首个AI大语言模型（Large Language Model, 简称LLM），加入生成式AI浪潮。

但智慧芽联合创始人关典接受《联合早报》访问时强调：“大模型是一种手段，而非目的。”

她也说，智慧芽做大模型的初衷，不追求酷炫的技术突破，而是服务于现有业务，让当前的科技创新平台更强大高效。

她举了利用大模型自动生成专利技术交底书（Technology Disclosure Form）的例子。通常，专业人士有一个技术创新的点子，大到工厂设备的控制系统、小到食品饮料的包装技术，想要申请专利，都需要先准备一份详细介绍发明创造技术方案的书面材料——技术交底书，才能请专利代理人撰写申请文件。

“以前，技术人员可能需要两三周去写交底书，现在，你只要把构思写下来，大模型就能一键生成。”

此外，大模型还可以根据交底书一键搜索相似专利、排查侵权风险、对专利进行估值等，大幅提升企业申请专利的效率。

纯粹为客户需求服务

关典强调，垂直行业的公司做大模型，并不是要与OpenAI、谷歌这些做通用大模型的公司去竞争，也不是争一个噱头，而是为了服务于客户的需求，这些需求是市面上已有的开放模型很难满足的。

首先是准确性的要求。

关典指出，智慧芽在专利、论文、科技信息领域已经有10多年的数据积累，而且这些数据并非杂乱无章，而是经过专家10多年做分类、打标签，数据质量本身非常好。因此，相对于ChatGPT等开放模型，智慧芽的大模型在这个特定领域的表现更为准确和深入。

另外，自研大模型也是出于客户对安全性和即时性的需要。“技术专利大都是敏感信息，如果用ChatGPT的接口，客户会担心信息泄露的风险。而且，大家都知道，ChatGPT训练的数据不是即时的，近半年的数据它可能没有，但我们自己可以做到每天更新数据。”

回顾17年的发展历程，关典表示，公司早在2014年就开始投入到“上一代的AI”如自然语言处理和图像识别技术。正是有了数年的技术积淀，因此当生成式AI时代来临时，公司才能快速建立一套质量较高的大模型。

这波浪潮确实让许多公司看到了变革的机遇，纷纷涌入其中。她认为，创业公司或者小型公司做通用大模型不太现实，在资源上无法与巨头竞争，但做特定行业领域的大模型却仍有很多空间和机会。

在任何领域，创新都是不能停下的

目前，智慧芽有50多位技术人员全职从事大模型，加上本身就“奢侈”的算力成本，公司对大模型押注很高。对于任何一家公司，高投入过后，商业回报是避不开的话题。

关典说，目前还没有具体的数字来衡量商业化效果，但大模型带来的价值是肯定的。“因为有了这些能力，我们跟竞争对手拉开了差距，客户可能更愿意选择我们的服务，愿意为我们的产品付更多费用。这是我认为的商业价值。”

她还说：“你不做的话，别的公司就会做，那你可能就会出局。在任何领域，创新都是不能停下的。”

《联合早报》专访：智慧芽大模型的初衷是服务客户

纯粹为客户需求服务

在任何领域，创新都是不能停下的

400-694-4481