智谱AI张帆:大模型时代如何构建企业竞争力?

财经 (7) 2024-07-28 10:56:20

  2024中国企业未来之星年会于7月26日-28日在上海举行。 智谱AI COO张帆出席并演讲。

  大模型时代如何构建企业的竞争力?张帆指出,要选择合适的基座模型,与之搭配相适应的组织,并且重新定义在新的生产工具下的数据资产,并且找到业务场景与之融合,变成一个增正向的飞轮,让每一轮飞轮都变成数据资产,沉淀一部分。

  “在选择基座模型的时候要算大账,算整体支出和业务的整体成本,组织并不是技术越强越好,也不是人越多越好,如何恰如其分的选择在模型上层应用需要的技术,我觉得很重要”,他强调。

  他还指出,以往的数据资产全部都是建立在结构化体系上的,但结构化注定只是少量数据,并且由于上下文的缺失损失了部分信息,在今天大模型的背景下,更广泛的数据、非结构化的数据都会变成资产,极大地扩充资产边界,为资产带来了全新的定义。

  “在此之后,在数据之上如何把数据转化为业务场景,大模型并不是简单的对话,它应该是润物细无声的贯穿整个服务体系,并且在每一次的循环当中把这些能力沉淀下来,成为我们的核心竞争力”,他说。

  以下为演讲实录:

  张帆:非常高兴今天有机会和大家做交流。我想讲应用上的探索,就是应用的落地和在座企业家有什么关系,应该如何利用这个时代。

  大家肯定比较熟悉,ChatGPT从发布之后非常快的时间,只用了两个月,全球用户过亿。在这历史上从来没有这么现象级的产品,TikTok都用了9个月的时间。而且绝大多数人对大模型的理解,并不是概念,而是我们感受到了应用,所以大模型天然就是已经可以落地的技术,不需要等待,就可以用。

  我们看到了IDC、Gartner等预测机构对大模型都非常有信心,预测2026年会有80%的企业会应用大模型,目前看起来一定也不激进,而且今天看到几乎所有的企业或多或少都在应用,无论是个人还是企业。这次和以往有什么不一样。

  AI从诞生到今天差不多七八十年了,为什么这次让大家高度共识、这么热情的应用这个技术?简单向大家介绍一下,不讲太远的。从移动互联网时代来看也就是所谓的0.5时代,10年左右我们已经在应用AI了,只不过当时在搜索以及视频网站的推荐都在应用,只是那时候的AI每个都是独立应用,一个单词做一个实现,选一个数据训练一个模型,任何一个错误都可能导致白做。做发票识别,如果发票格式变化了,就白做了。那时候AI是高门槛技术,只有互联网大厂才能应用。

  到了13年、14年,我们看到一个变化,就是神经网络的突破,一下子把算法层统一了,大家都用一个算法,某种程度上带来了AI的第一次普惠,让AI的成本和门槛比原来下降一个数量级,就激发了大家的应用,就是从互联网大厂开始转移到产业和行业里,这也是大家真正把它和产业结合了,今天所有企业或多或少都会使用,包括人脸识别、客服等等。

  2.0时代是什么?大模型把一切都统一了,算法到模型,到任务,全都统一了,包括未来的多模态,它会进一步带来普惠,相信大家都有感受,应用场景更多。另一方面,它把产品和门槛下降了两个数量级,让AI变成了一个基础技术,不再是高端技术。

  如果企业内部做一个文档或者简历抽取,如果不花两三个高阶工程师做半年很难有不错的效果,而两三个工程师的半年就是两三百万,成本非常高。但是,今天利用大模型可以用一个不同编程的运营或者产品经理,花一个礼拜的时间就可以达到以前一样好甚至更好的效果,所以AI变成了所有人都可以使用的基础生产要素。它变成基础生产要素以后,所有的上层建筑都会重构,我们的协作方式、组织方式、用户体验、商业模式都会变化,这是在今天带来的巨大变化。

  说一下智谱AI,我们是2019年成立的公司,成立之初就把机器像人一样思考作为我们的使命,也是AGI的另一种表述。成立之初,我们就专注于大模型的研究,发布了完全自主知识产权,我们不叫GPT,叫GLM,2022年已经开源了千亿基座模型、代码大模型,2023年开源了更多的模型,多模态模型等其他专项模型,今天GLM已经更新到第四代了。

  今天我们有了非常完备的模型矩阵,语言模型既有1.5B、3B的端侧模型,而且端侧模型已经有跑在了汽车上,在汽车端侧8295芯片上就可以跑一个模型,而且完全跑通了,包括AIGC、手机、NAS,我们也开源了9B,目前为止全球累计下载量已经超过了1600万,我们的Flash、Air等不同size的模型帮助大家组合不同的应用。代码有代码模型,多模态模型就是文生图、图生视频等等模型,我们还有专项大模型,专项UI或者是评测等等,所以我们有完全对标OpenAI的模型矩阵,我们开源了19个模型。

  今年1月份发布之后,GLM-4基本上达到了GPT4的平替了,我们考虑的是中文,我们的128K比OpenAI长3倍,也就是比它宽3倍。我们还开源了9B模型,它也是唯一一个可以直接跑到百万窗口,而且完全开源了,大家都可以应用。

  还有多模态的模型能力,简单讲讲它有什么用。大家可以看一下这和以往的CV有什么不一样,第一张图上面有三个小房子,问大模型,它会说有四个,因为旁边有半个房子,所以它推理旁边还有第四个房子,以前只是图生图,但现在它已经可以基于图做推理,这就是带来的深度应用。

  下面偏哲学的图片,就是妈妈带一个机器人,图片是“GPT也不过如此”,它是有隐讳含义的图,但它依然可以理解,就是暗示人工智能已经达到了人的水平,但人类并没有惊讶。我们把大模型的应用场景和天花板拉得更高,非常复杂的表格可以不做任何针对性训练,就可以直接输出markdown,降低了AI的门槛。

  昨天我们发布了文生视频的大模型,昨天上午发布了,很多人进行试用之后有很好的反馈。

  [多媒体演示]

  这是完全由大模型生成的,人只是把生成的东西做了一点简单的剪辑,拼到了一起,整个内容都是由机器生成的。昨天我们也看到了很多有做了非常有意思的视频发到朋友圈。它当然有很多不完美,但这只是第一个版本,相信大模型迭代的速度,它会非常快的进步和进化。

  我们也提供了致力于通过AGI,我们打造全新一代的MaaS平台,让大家可以随时微调我们的千亿模型,让每个人都用自己的私有模型,比我们开源的成本低出数十倍,门槛非常低。我们适配了国内端侧模型,还适配了国内40个厂家的信创芯片,应用上更加自由。

  今天大模型已经开始落地在各种各样的地方,无论是消费、指导、游戏、医疗、教育、文旅等等,今年我们已经看到了很多深入企业内部,带来了直接的价值。

  看几个例子。在汽车领域,从文本模型到文生图模型、图像理解模型做成了一个组合,如果再分层,有部分在端侧,有部分在云侧,做了部分的矩阵组合。在车里的文本模型可以解决原来很难解决的问题,比如聊天,siri很容易聊死了,它可以继续聊下去;比如车控,以前只能简单的开窗、关窗,现在可以复杂车控,条件意图以及隐含意图,都可以搞定;还有车书问题,问灯为什么会亮,不用掏出使用手册,它可以直接给出答案。很多小朋友可以在车的后面生成绘本,这就是图文创作。车外景物识别是外部信息和内部信息的感知,比如问前面的车是什么牌、是不是快到了,对内还可以说是不是系了安全带、小朋友是不是爬上去了等等,有很多应用场景。

  还有手机和音响助理,大模型都带来了明显超越传统方法的效果。还有销售助手,在销售企业,销售给客户打电话和智能工牌,把声音录下来之后,转成结构化的需求和结构化的用户画像,客服之间销售摘要,还有销售话术提炼、战败归因、模拟训练,变成一个假的客户让它给销售打分等等。还有撰写文案,可以改性、缩写,生成PPT等等。

  如果各位企业家落地的时候,应该怎么做?谈不上最佳实践,把我们的实践和大家做一些分享。企业判断大模型是否ready,我见过两个极端案例,一个是把它当成许愿池,好像什么都可以搞定。另一个是无时无刻找一些大模型干不成的事,证明它不行。这两个极端都不对,显然我们知道今天的大模型相当于iPhone1.0,上面的应用一定比PC好吗?不一定,但它起码是一个开始,我们可以找到合适化的程度以及试点,找到对应的负责人并且有合理的期待,这是我们的关键。

  从模型的角度应该怎么思考呢?我们发现今天很多人在应用模型的时候切入点就是错的,这不是模型能搞定的事。由于时间关系就不展开了,但是如何把能力转变为软件和工程的体系。

  大模型时代如何构建自己的竞争力,就是四个维度:第一,选择合适的基座模型,与之搭配相适应的组织,并且重新定义在新的生产工具下数据资产,并且找到业务场景与之融合,变成一个增正向的飞轮,让每一轮飞轮都变成数据资产,沉淀一部分。在选择基座模型的时候要算大账,算整体支出和业务的整体成本,组织并不是技术越强越好,也不是人越多越好,如何恰如其分的选择在模型上层应用需要的技术,我觉得很重要。以及过去的数据资产全部都是建立在结构化体系上的,我们做知识图谱和业务系统也好,永远都是要结构化,但结构化注定只是少量数据,并且由于上下文的缺失损失了部分信息,今天大模型背景下,更广泛的数据、非结构化的数据都会变成资产,极大地扩充了资产边界,为资产带来了全新的定义,在此之后,在数据之上如何把数据转化为业务场景,大模型并不是简单的对话,它应该是润物细无声的贯穿整个服务体系,并且在每一次的循环当中把这些能力沉淀下来,成为我们的核心竞争力。

  所以,我们认为其实每个企业家或者个人都应该思考如何借助模型增强我们的竞争力。谢谢大家! 

THE END