“如果不在百度,可能就不是我了。”

在百度十大科技前沿发明颁出这一天,入围者这样说。

一个人这样说多半是谦虚,但他们中的一半人都这样说——而且还是量子位现场问到的所有人,或许就在反映着什么。

但仍然有诸多相关的谜团待解。

一个产业化公司搞啥发明?有什么用?如何开始的?又会往哪里去?以及最重要的:这些发明含金量几何?

百度十大科技前沿发明

百度可能是中国最重视技术创新和专利保护的公司。

特别是进入AI技术创新周期后,每年的AI专利进展都会成为关注的对象。但今年有所不同,这次在专利积累之上,推出的百度十大科技前沿发明更成为关注的焦点。

这十大发明,基本都是数字技术、智能技术上的突破和积累。

与AI生成和创造相关的如:跨模态通用可控AIGC、知识增强大模型、数字人智能化生产。

与“AI司机”自动驾驶相关的如:无人车传感器融合处理系统、面向自动驾驶的车路协同关键技术、自动驾驶多模态行人运动预测。

还有深度学习通用异构参数服务器架构、基于AI的生物计算平台PaddleHelix、智慧城市全要素双总线技术,以及全平台量子软硬一体,也基本是AI驱动的时代级技术革新。

整体来看,都是目前全球技术创新竞速中的最前沿阵地。具体到所处的赛道,百度的发明项目进展不仅展现着原创性,也展现出领先性。

比如AIGC,国外有微软加持的OpenAI出品的GPT、DALLE,谷歌的Imagen,都是文和图生成方面的各自代表性工作。

但百度的通用可控AIGC,实现了能力上的集大成和效果上的可控。百度的AIGC不仅在全球首次实现了语言和视觉大一统的理解与生成,而且单一模型一经出炉就登顶了视觉和语言榜,横扫VQA、VCR、aNLI三大国际权威榜单。

又比如量子计算方面,在硬件打造和量子优越性争夺之外,百度还新增开辟出了产业化加速路线,通过基于“乾始”研发的全球首个全平台量子软硬一体化解决方案“量羲”,提供私有化部署、云服务、硬件接入等一系列服务,简化量子硬件部署到量子服务的全流程,实现不同量子芯片的“即插即用”。

还有自动驾驶,在百度TOP发明中十中有三,不仅秀的是该领域上的技术实力,而且也已经通过落地,在订单数、里程数和落地城市数量上实现技术驱动下的全球领先——目前全球最大的自动驾驶出行平台,是百度旗下的萝卜快跑。

与发明形成呼应和反差的,是背后的发明者。

或许你对百度在技术上的影响力和吸引力并不陌生,也多少听过百度内部以技术声名在外的专家、大牛和大神。但在这次十大科技前沿发明和专利发明人中,不少人低调十足,基本没有过对外亮相。

他们有各自具体性的一面,有人应届毕业就来了,有人在其他同样以技术标签知名的公司待过,还有人之前履历都在学术界。

然而共性一面是工龄司龄都不短,基本对外处于隐身无闻状态,并且被问到发明背后的关键时表述不同但指向一致:

如果不在百度,几乎不会成为这项技术的发明人。

“不在百度成不了发明人”

上述异口同声的共同归因,需要结合发明的源起才能更好理解。

比如跨模态通用可控AIGC、知识增强大模型、数字人智能化生产,都可以理解为在百度过往技术和业务基础上生长出的新能力。

跨模态通用可控AIGC的发明人之一严萧,中科院计算所博士,正高级工程师,毕业不久就加入了百度,迅速成长为百度主任架构师,并且在业内公认的百度NLP沃土上斩获50多项授权发明专利,相关成果被广泛用于搜索、推荐、输入法和云服务等业务场景中。

严萧说,近一年以来,AIGC确实成了风口,大小玩家也都进入了赛道,但AIGC底层的统一模型,百度早就在预研和攻坚了。在GPT-3和DALL·E打响名气之时,百度内部已经在紧锣密鼓的推进包含文章、图片都在内的语言视觉大一统模型,并且完成了第一代版本发布。

“你可以借助开源很快做出点什么,但做不到随心所欲,我们希望它能像人一样想生成什么风格就生成那个风格”,严萧回忆,百度团队从一开始就铆足劲“北坡登珠峰”,在AIGC方向上实现通用且可控,因为这样才能在效果上实现工业化落地应用。

整个AIGC的立项很快,一方面是百度在这个方向上有积累也有人才,NLP和搜索等技术都具备领先性,把需要的人才横向抽调出来,就搭建好了班底架构;

另一方面,百度还具备技术落地的业务场景,AIGC相关的模型,从撰写资讯、文章到生成图片,都能在百家号、搜索、输入法和云业务中落地、迭代、再训练、再迭代,日臻进化。

所以在时势和英雄的命题上,严萧很坚定:如果他不在百度,几乎不会成为如此领先技术的一个发明人。