AI技术专利研究系列:Cortica,计算机视觉领域的佼佼者
TiPLab司马缸砸缸
2018-02-07

作为一个初创型的科技公司,合适的知识产权战略应当是充分认识到企业自身特点及需求的前提下,能够动态地掌控外部商业环境的变化,并结合当前阶段企业发展需要,灵活调整知识产权策略以适应企业动态的商业目标,Cortica便是如此。

计算机视觉领域的一股清流

计算机视觉是人工智能领域的重要组成部分,机器学习和神经网络技术在计算机视觉领域得到了充分的发挥和应用,无论巨头公司还是创业公司都各自在这个领域找到了适合自己的发力点,甚至取得了令人瞩目的成绩。

作为计算机视觉领域的佼佼者,Cortica是由以色列理工学院(Technion – Israel Institute of Technology)教授Josh Zeevi以及两位毕业生Igal Raichelgauz和Karina Odinaev(二人之前都曾服务于以色列国防军8200精英情报部门)于2007年成立,这是一个由神经科学家和数据工程师组成的跨学科团队,总部位于以色列特拉维夫。

Cortica的创始人兼CEO Igal认为:通常的机器学习技术遵循自上而下的方法,系统对训练的严重依赖使它们变成复杂的机器,这不是真正智能的机器。而人类大部分学习都是在没有监督的情况下进行的,要拥有与人类相匹敌的智力,机器必须模仿人类自下而上的学习和理解的方式,即在没有训练、参数或数据集的情况下,机器的算法和结构将能够引入数据,处理数据,并通过自己的方式来理解它。换言之,智能机器是能够进行理解和学习的,它们可以通过归纳、结合语境和利用自己的创造力来学习。

基于这样的信念,Cortica公司通过模拟人脑皮层神经网络所展示出的神经生理功能,开发一种生物计算技术,即模拟人脑中发生的神经元活动,让计算机以人类的方式学习,像婴儿一样观察他们的环境,慢慢开始掌握更多的概念和技能,并且随着时间的推移越来越复杂化。Cortica已经建立了这样一个能够从人类层面理解视觉信息的自主学习系统。

Cortica的专利策略

The Architecture计算模型

为了解决采用通用神经网络架构进行现实世界信号分析(比如人类语音识别,图像处理,文本和图像内容识别等)需要高度复杂的架构设计的问题。Cortica公司的创始人Josh Zeevi、Igal Raichelgauz和Karina Odinaev以共同发明人(Cortica公司一半以上的专利发明都有这三位核心人员的参与)的身份于2006年10月26日提出了一个PCT专利申请WO2007049282A2:

“A COMPUTING DEVICE, A SYSTEM AND A METHOD FOR PARALLEL PROCESSING OF DATA STREAMS”

该专利最早要求了一项以色列专利IL171577的优先权(2005年10月26日),在后续的国家阶段,该专利分别在欧洲和美国获得了授权,即专利EP1949311B1和专利US8655801B2、US9646006B2。该专利提供的方案能够主动且高速地处理在低信噪比下捕获的自然含糊并有噪声的数据,这是一种使用多个计算核来对数据流进行异步并行处理、且可以在运行期间自适应地重新配置的计算模型(The Architecture)。

该计算模型为Cortica期望的自主学习机器提供了实现的可能,在该篇专利中Cortica披露了其基于液体状态机(LSM, Liquid State Machine)的计算架构。

建立庞大的商业应用专利家族

Cortica围绕无监督学习算法搭建的计算模型,以及该模型的商业应用拓展,在长达10年的时间跨度内培养了一个庞大的专利家族,截止成文前,该专利家族囊括了183项发明专利,申请国家主要集中在欧美地区,该专利家族集中在大规模基于内容聚类的应用实施领域

涉及的技术包括:内容跟踪、视频滤波分类、多媒体分类生成、视频指纹、语音、音频分类、目标识别、视频搜索和其他应用程序需要基于内容的签名生成和大容量等匹配、Web和其他大型数据库等。

Cortica于2007年成立后,迅速启动了“The Architecture”这一技术在商业应用中的探索,作为对“The Architecture”(即专利WO2007049282A2披露的计算模型)的商业考虑,Cortica尝试将其技术运用到图像识别领域,其中一种商业模式就是在相关的图片或视频中嵌入广告。随着这一技术在商业中推进,Cortica在2007年8月21日提交了一件以色列专利IL185414,后又以该案的优先权申请了PCT专利WO2009026433A1:

“SIGNATURE GENERATION FOR MULTIMEDIA DEEP-CONTENT-CLASSIFICATION BY A LARGE-SCALE MATCHING SYSTEM AND METHOD THEREOF”

该专利是Cortica首次提及基于内容的聚类、识别、分类和高容量多媒体数据的实时搜索技术。从该专利说明书中披露的信息来看,Cortica公司希望拓展的领域包括视频、语音、文本、图像等信息的识别和处理

融资和新产品上市都加快了Cortica的专利部署

在图片或视频中嵌入广告这一商业模式很快获得了投资机构的青睐,而Cortica持续的专利资产积累又给投资机构足够的信心,Cortica从2012年8月份始持续两年里获得了三轮总额超过3000万美金的投资,其中李嘉诚旗下风投Horizons Ventures(维港投资)连续在ABC三轮跟投了Cortica。

资金的充盈促使Cortica于2013年推出他们宣称花费了相当长时间研发和测试的Image2Text®产品,同时宣布他们已经围绕该产品申请了超过50项的专利。Image2Text®产品指向的目标客户是广告商、网站、以及内容发行商,通过使用Image2Text®广告商可以在相关的图片或视频里内嵌入广告进而达到广告投放的精准率。

Image2Text®的一个重要技术就是可以根据给定的图像生成自然语言描述

根据Cortica创始人Igal的介绍,实现其产品Image2Text®主要经历了两个关键步骤:第一步解决“表现”的问题,第二步从生物学的角度实现机器学习,简而言之就是把分解的信息转化成“数字世界”的关键字以作为数据分析的参考变量,然后通过无监督学习的方式学习互联网上大量的图片或数据来实现高正确率的识别。

其实Cortica在2012年获得A轮的700万美金的风险投资(该轮由Horizons Ventures和全球顶尖的电视节目制作公司Endemol Group的前主席兼首席执行官Ynon Kreiz共同投资)之后,就明显增加了专利申请的频率,专利关注的问题也从早期基础算法和通用性技术(比如签名技术、概念理解和推理、以及非结构化数据处理等技术)逐渐转变为具体场景的应用,比如:

基于对用户兴趣的分析创建用户的配置文件(US20130227023A1);

基于签名分析来识别多媒体内容中有吸引力的广告区域(US9286623B2);

识别相关的多媒体内容项中所含的食物物质的营养数据(S20140093844A1);

基于为用户设置的特性来确定用户感兴趣的搜索结果(US9489431B2);

语音翻译(US9477658B2);

使用瞳孔测量来确定用户的兴趣点以定向广告(US2015161213A1);

根据用户的面部表示来确定用户的兴趣点(US20160321256A1);

生成定制的增强现实环境(US20160371890A1);

识别电子交易数据之间的关联(US20170270194A1);

基于多媒体内容的分析来诊断患者(US9747420B2);等等。

专利部署与技术的商业应用拓展同步

继2016年底又一次3000万美金的融资后,2017年,Cortica正在进入无人驾驶领域,并开设了一个汽车分部。Cortica期望基于他们的无监督学习技术对动态的图像有深刻的理解和精准的识别能力,令汽车驾驶系统自动地处理数据,认识驾驶环境以更好地适应新的路况。

Cortica计划研发的系统帮助制造商和开发人员,从传感器获取所有数据,处理那些图像,把这些图像按照已定义的元数据来归类和打标记,进而可以帮助自动驾驶系统发现行驶中遇到的障碍物和路标,以提高自动驾驶的安全性和智能程度。同年,Cortica也陆续公开了一些基于动态图像来确定驾驶决策的相关专利US20170262453A1、US20170270109A1、US20170286432A1及US20170270107A1等。

初创公司如何配置自己的专利资产?

作为一个初创型的科技公司,合适的知识产权战略应当是充分认识到企业自身特点及需求的前提下,能够动态地掌控外部商业环境的变化,并结合当前阶段企业发展需要,灵活调整专知识产权策略以适应企业动态的商业目标,Cortica便是如此。

我们能够将他们专利的申请情况映射到他们的发展轨迹。Cortica是一家相当重视专利的公司,他们也善于利用专利进行融资以及产品与市场的推广。从公开的专利文本中可以看出:

1.具体到单件专利的文本质量及权项设计等方面,Cortica在保持研发与专利申请节奏同步的同时,也很注重专利的申请质量:包括专利组合之间的关联性、申请地区的延伸。

2.同时,Cortica充分利用了美国专利临时申请的制度优势:其诸多专利的首次申请均是以临时申请的方式提出的,然后再以继续申请或部分继续申请的方式加以完善其专利文本,且大多专利的申请文本中普遍引用在先申请的相关专利。

目前,Cortica正在视觉搜索领域进一步拓展其商业版图,与此相关的专利也陆续披露出来,仅2017年(截止成文前)公开的就有35项发明专利。但Cortica在中国的专利公开还很少,作为AI领域的重要市场,以及近两年蜂拥而至的中国创业者将是Cortica不得不面对的。当然,我们也不应言之过早,因为Cortica毕竟还有许多的PCT申请在国际阶段仍未落地。

* 以上文字仅为促进讨论和交流,不构成法律意见或咨询建议。