阿里通义千问为企业打造专属大模型
而阿里那边也放出了一个重磅消息,阿里版 Copilot即将上线!而且比微软做得更好,阿里的所有产品,都将接入到大数据平台上,从生活到娱乐,应有尽有。
阿里的最终目的,并不是为了开发出属于自己的人工智能应用,而是为了帮助其他企业开发出属于他们自己的人工智能应用。
那么,如何将大数据应用到现实中,又如何将其赋能到千行百业中去?
BloombergGPT这个最近风靡一时的500亿个参数的大型金融模型,就是一个很好的例子。
首先,彭博社研究小组从40多年的金融数据中提取信息,创造出一套拥有3630亿条的数据集。
在此基础上,我们将结合现有的3450亿 token数据,构建出一个规模超过7000亿 token的训练语料库。
最终,在此基础上,研究小组开发出了我们刚才提到的“金融版的 ChatGPT”,即 BloombergGPT。
结果表明,布洛姆伯格GPT模型在财务问题上的表现比目前已有的类似规模的开放模型要好得多,而在一般的 NLP测试上的表现甚至更好。
很明显,这是彭博社研究小组根据特定领域数据制作出来的专有的、自定义的大型模型,不仅仅是在财务方面,而且对他们的商业也有很好的帮助。
国内大多数中小公司都没有能力自建一个动辄需要上千卡甚至上万卡的大模型基础设施,即便是对于很多头部企业来说,从0到1不断地训练和优化大模型也是不经济的,因为各行各业都需要一个成本足够低的 AI基础设施。
而今,阿里又走了一步,推出了“通义千问”,为各行业打造了专属的定制大模型。让他们能够在通义千问的基础上,发挥出最大的作用,同时还能根据不同的情况,进行相应的优化。
最后,每一家公司都将拥有一块专门用于阿里云的大型空间。
在这里,不仅可以调用通义千问的所有功能,还可以根据企业自身的行业知识与应用场景,训练出属于自己的大型企业模型,例如:智能客服,智能导购员,智能语音助理,智能文案助理,人工智能设计师,无人驾驶模型等等。
作为服务的模型
为了让企业不用再重复制造轮子,阿里于去年十一月首次提出了“模式即服务”的概念。也就是说,模型是人工智能技术发展和应用的主要载体,是最好的公民。
阿里云智能首席技术官周靖人认为,一方面,软件即服务是人工智能未来发展的一个重要方向,如果能够很好地实现,将会极大地推动人工智能行业的发展。另一方面,软件即服务对于基础设施建设,尤其是与云计算等基础设施的深度融合,为服务提供了新的机遇。
在这一点上,阿里云已经打造出了国内唯一一个能够支持上万亿个参数的“飞天计算基础架构”。具体地说,系统的三个层次可以提供:
·智能软件服务
阿里云智能为用户提供了通用大模型,以及基于通用大模型的企业大模型,以及国内第一个“模型即服务”的魔搭社区。
到目前为止,魔搭已经聚集了800多种高质量的开放源代码模型,用户超过百万,累计下载量超过一千六百万,成为国内最大的模型社区。
·智能计算 PaaS服务
针对需要自建模型的用户,阿里云智能将提供面向万卡的分布式单任务训练平台,并提供全链路的人工智能开发工具和大数据服务。除此之外,在这个平台上,人工智能的推理效率可以提升6倍,训练效率可以提升10倍。
·智能计算基础设施服务
在基础层,阿里云智能可支持十万卡级 GPU的单机规模、支持万亿级模型在线训练的计算集群、支持万卡级人工智能集群的 RDMA网络架构等。
峰会上,阿里云宣布将联合 OPPO安第斯智能云,共同构建 OPPO大数据基础架构,并邀请了吉利汽车,智己汽车,奇瑞新能源,毫末智行,太古可口可乐,波司登,掌阅科技,以及其他众多企业,与阿里云进行合作,共同探索与创新。