商汤上海总部(图片来源:钛媒体App编辑拍摄)
随着ChatGPT为代表的预训练大模型带来新一轮人工智能(AI)热潮爆发,继百度、阿里、360之后,又一家大厂推出GPT大模型产品。
钛媒体App获悉,4月10日,AI 公司商汤科技正式发布全新“日日新SenseNova”大模型体系,以及自研的中文语言大模型应用平台“商量”(SenseChat),参数量达千亿,可实现文本生成、图像生成、多模态内容生成等能力与场景应用。
商汤科技董事长兼CEO徐立表示,上述这些生成式人工智能(AIGC)产品将在医疗、短视频、教育、营销以及开发等产业领域应用落地。
商汤科技联合创始人、首席科学家王晓刚表示,目前已经有一些合作伙伴和客户开始内测其产品。未来,商汤版的GPT主要面向企业端(B2B)业务。此外,商汤“日日新SenseNova”大模型体系已全面支持了智能汽车、智慧生活、智慧商业、智慧城市等业务板块,而且商汤将向客户提供涵盖图片生成、自然语言对话、视觉推理和标注服务等API接口。
事实上,自2022年12月开始,美国OpenAI公司推出的 AI 产品ChatGPT以及背后的GPT大模型,已经引发了一场 AI 新浪潮。
但 AI 技术的终极目标 通用人工智能(AGI)可不是谁都能获得的。《奇点临近》作者雷·库兹韦尔曾表示,直到2029 年,人类才有超过50%的概率开发出AGI。而作为 AI 技术积累最深厚的中国公司,如今商汤抓住了大模型这波新浪潮,以期在未来几年内实现重大突破,从而迈向 AI 领域这颗皇冠上的明珠——AGI的前沿研发与商业化进程。
GPT大模型热潮来袭如今,火爆全网的 AI 聊天大模型应用ChatGPT访问量已飙升至8.89亿次,它也是历史上最快达到1亿月活的应用,而且整个热潮已蔓延至微软、谷歌等很多大厂开始关注大模型。过去40天,大模型集中爆发,GPT-4、微软Microsoft 365 Copilot、Midjourney V5、Google PaLM API、英伟达新显卡接连出场。
尤其是微软,将GPT-4接入Word、Excel、PowerPoint等Microsoft 365 Office办公套件中,即推出一款新的 AI 驱动的产品Copilot(副驾驶),像助手一样用 AI 帮助人们生成文档、电子邮件、PPT等,从而让 AI 接入了生产力。此外,创造出ChatGPT的美国OpenAI公司还推出插件功能,实现了“App Store时刻”,让生成式 AI 真正变革了人类的生产力。
徐立曾表示,AI 的核心是解决“工业红线”问题,而商汤SenseCore AI 大装置相当于粒子对撞机,成为业内稀缺的大模型专用基础设施,可以解决 AI 软件所需算力支撑挑战——类似光刻机,解决芯片的“工业红线”。因此,如今基于“大模型 大算力”,商汤拥有了 AGI 时代的“光刻机”,成为 AGI 和大模型时代的基础设施服务领导者,对整个行业具有重要的应用价值和战略意义。
“需要好的顶层设计,很好地把原材料设计成一个体系,商汤能朝着 AGI 的目标努力。除了大装置和基础设施以外,还要能从算法、框架上,把整个系统设计好。”王晓刚表示。
王晓刚称,如今,商汤研发想要做的事情就是怎么样去用好这些新技术。它带来的新范式包括人机共智,一起去创造新智慧。核心在于怎样用好我们的这个大模型,能够去形成正向的反馈,而不是一味地说“很害怕被颠覆了”。
千亿商汤大模型有何新亮点?最近几天,国内科技大厂的GPT AI 大模型密集呈现,从百度的文心一言,到阿里通义、华为盘古和京东言犀,引发国内企业的大模型“逐鹿潮”。
相对于其他大模型产品,商汤此次推出的千亿大模型真正服务于To B(企业)端客户,而非一个被网络调戏的工具。钛媒体App梳理了四大亮点和优势,从体系、语言大模型平台,到应用场景和行业落地,打通大模型产业闭环。
首先是国内首个大模型体系。
4月10日,商汤科技正式发布商汤“日日新SenseNova”大模型体系,基于数据、模型训练以及部署的三位一体的飞轮,提供自然语言生成、图片生成、感知模型预标注、模型研发等多种能力,并持续更新多模态大模型,同时结合决策智能大模型,是实现AGI的重要起点。
“秒画”带来个性化文生图能力(来源:商汤)
而另一种“琼宇”、“格物” 3D内容生成平台,是商汤科技基于神经辐射场技术(NeRF)的3D内容生成平台,分别是指琼宇大空间3D内容生成应用、格物小物体3D内容生成应用,可基于 3D 内容生成技术实现对空间和物体的复刻与交互。传统人工建模10000人/天的建模任务,通过“琼宇”只需要2天即可完成(算力为1200 TFLOPS)。
商汤表示,上述两套平台生成的各类3D内容都够进行再编辑再创作,通过海量高精度数字资产的生产,满足影视创作、建筑设计、商品营销、数字孪生管理等各类对可交互3D实景内容有强烈需求的应用场景。
最后一个亮点就是独特的行业赋能。商汤让大模型对外提供API接口,以及多元化、多种大模型即服务(MaaS)。
具体来说,在“一平台四支柱”的战略体系下,商汤“日日新SenseNova”大模型体系已全面支持了智能汽车、智慧生活、智慧商业、智慧城市等业务板块,打通了多个领域、行业的应用闭环。
而且,基于“日日新SenseNova”大模型体系,商汤将向客户提供涵盖图片生成、自然语言对话、视觉推理和标注服务等API接口。客户可根据实际应用需求,灵活调用商汤大模型的各项AI技术能力,低门槛、低成本、高效率地实现AI技术在实际业务环节中的部署,或进行二次开发,创造更多价值。
此外,基于商汤AI大装置和大模型体系,商汤将面向客户提供涵盖自动化数据标注、大模型推理部署、大模型并行训练、大模型增量训练、开发者效率提升等多种大模型即服务(Model-as-a-Service),包括自动化数据标注、大模型推理部署、大模型并行训练和大模型增量训练服务、开发者效率提升等。
“这绝对不只是说训练一个参数量非常大的模型,它是一个体系化的大工程。”王晓刚表示。
王晓刚提及,“涌现”这个现象的出现意味着大模型会不断给你惊喜,大模型能有新能力。而商汤在大模型训练本身,以及know-how任务理解都有这样的技术实力。结合自身的特点,具有通用性的商汤大模型,能够真正去帮助客户解决需求和问题。
“未来,我们也是希望能够依靠社区的力量把我们的这些模型进行调教,不只有原始模型,还有各种各样的这样的一些模型存在,能够更好的往前推进。”王晓刚坦言称。
大模型只是起点,奔向 AGI 之路才是重点对于整个 AI 技术进程来说,大模型绝对不是 AI 发展的终点,而只是起点。
1950年,才华横溢的计算机科学家艾伦·图灵提出了一个他称之为“模仿游戏”的思想实验。面试官通过打字机与两个对象交谈,知道一个是人,另一个是机器。图灵建议,如果一台机器能够始终让面试官相信它是人类,我们就可以说它有能力思考。这就是著名的“图灵测试”。
后来的70年间,整个 AI 行业都为之努力,希望打造通过“图灵测试评估”能力的 AI 技术。如今,AI 算法、算力、数据“三驾马车”同步突破,AI 技术已经蓄能完毕,所有人终于可以大展身手了。
作为中国 AI 领域竞争与发展的核心玩家,商汤拥有 AI 行业全栈性研发能力。
商汤科技联合创始人、大装置事业群副总裁陈宇恒表示,所谓的通用人工智能新的创新范式,可以极高的体现商汤现有的一些 AI 产品的模式和能力。从大的方向上,商汤作为人工智能的头部的企业,未来肯定还是要去挑战更大的模型。因为现在很明显的趋势就是,每一代的大模型 AI 和算力有很大的相关性。
“下一代人工智能比上一代,比如说 GPT-4 比 GPT-3可能是百倍级的算力的需求,甚至它的参数量是十倍以上的需求,对应也需要更多的数据去完成训练。所以要不断地去接近所谓的通用人工智能或者 AGI 的路线上,肯定是要把基础的超大模型越做越大。这是未来 2 到 3 年,整个无论从学术界还是从工业界,还是从我们自己的对 AI 的理解上,都是比较明确的方向。”陈宇恒表示。
此前,商汤科技发布了2022财年报告。
财报显示,2022年,商汤研发支出达38亿元人民币(扣除以股份为基础的薪酬开支),同比增长24%,2018年至今累计研发投入达128.47亿元;人均每年研发模型数相较于2021年进一步提高了90%,累计生产的商用模型数提高了93%,至6.7万个。
当中国大力发展 AI 技术的重要时机下,商汤大量投入技术研发,不断推进数字化、智能化、产业化升级,符合科技创新下的时代特征,如今,商汤高强度的研发投入正在开花结果,在国内大模型军备赛中实现了第一梯队的飞跃,成为行业极稀缺的“头雁”。
英伟达CEO黄仁勋曾表示,当下“我们正处于 Al 的iPhone时刻”。而商汤,也正在迎来属于自己的“iPhone 时刻”。
“AI是生产‘生产力工具’的工具,它将开启软件开发新范式,把我们带入‘新二八定律’的时代,80%的工作由机器完成,20%的工作由人来做。”徐立认为,持续的大规模技术投入带来创新,再有商业模式发展,这是一条罕有人走的路。商汤始终坚信 AI 技术变革带来增量价值,必将推动普惠和公平的智能时代到来。(本文首发钛媒体App,作者|林志佳)
相关文章
猜你喜欢