龙志中:2024年是人工智能爆发期
专题:2024中国AIGC创(chuàng)新发展论坛
2024年(nián)服贸会专题论坛 之一——“2024中国AIGC创新发展论坛”于9月13日-14日在北京举行。曙光云计算集团(tuán)股份有限公司总裁助理(lǐ)龙志中出席并演讲。
龙(lóng)志中(zhōng)表示,2024年是进入到(dào)了人工智能的爆(bào)发期。今年前8个月(yuè),在(zài)手(shǒu)机移动(dòng)端上,人工智能应用收入与去年相比同比增(zēng)长了51%,预计今年整(zhěng)个收入会达到33亿美元的规模。
龙志中介绍(shào),曙光一直是一家专注做计算的企业,创立之(zhī)初(chū)到现在(zài),一直围绕(rào)着计算(suàn)的核心部件,主(zhǔ)要产品,以及(jí)计算的基础设施建设和(hé)运营(yíng)服务,来打造(zào)核心竞争力。
龙志中表示,曙光致力(lì)于(yú)提供解(jiě)决(jué)方案,以降低(dī)使用人工智能(néng)大(dà)模型在算力方面的门槛。具(jù)体来看,曙光能够(gòu)提供的助(zhù)力有三个方面:第一是人工(gōng)智能相关的核心部件,主要产(chǎn)品,还有关键的(de)基(jī)础设(shè)施,包(bāo)括PUE在1.04以(yǐ)下的全液冷数据中心(xīn)。第二是算力中心的建设(shè)和运(yùn)营。目前(qián)曙光在全(quán)国有(yǒu)二十(shí)多(duō)个大型的算力中心(xīn)、智算中心、先进计算中心,以及五十多个城市云中心,能够为企(qǐ)业、区域 /城市(shì)能够(gòu)提(tí)供澎湃、多(duō)样的算力资源。第三(sān)是(shì)人工智能的生(shēng)态,在(zài)目(mù)前主流(liú)的大模型跟曙光(guāng)的核心部件,主要产品(pǐn)还有算力平台基本上(shàng)都做了适配,并且在算力互联网上(shàng)能够(gòu)提供生态合作伙伴的大模型服务(wù)。通过接入算力互联(lián)网,企业不需要自己去构建(jiàn)算(suàn)力基础设施的平台,甚(shèn)至不需要去部署自己的大模型,可以(yǐ)直接采用(yòng)多样的算力服务和大模型服务。
以下(xià)为演讲实录:
龙志中:各位专家,各位嘉(jiā)宾,大家上(shàng)午好,我是曙(shǔ)光云的龙志中,今天非常荣幸能够跟各(gè)位专家学习(xí)AIGC大模 型、人工(gōng)智能领域最新(xīn)的前沿理论和成果,也有机会跟大家一(yī)起探讨人工智能AIGC对于我(wǒ)们今天以及未来的生活方式、工作模式、创新(xīn)范式所带来的深远影响。也想借这(zhè)个机会跟大家汇(huì)报一 下曙光云在企业开发大模型、应用(yòng)大模型的过程当中,能够为(wèi)大家提(tí)供哪些助力(lì)。
曙光跟今天前面分享(xiǎng)的嘉宾所在的企业有所(suǒ)不同,前面这些企业(yè)更多是在开发大模(mó)型(xíng)或在做大模型应用场景侧的开发,给大家提供的(de)是(shì)大模型本身、大 模型应用,为(wèi)我们的生活(huó)和工作所带来的便(biàn)利。曙光相对来讲更偏底层,我们做的是计算基础设施和算力(lì)服务,也(yě)就是说我们为(wèi)大模型的开发和大模型应(yīng)用提供基础设施(shī)和算力服务,按照大模(mó)型三层架构分类的话,我们是(shì)在上游;从技术架构层次来分的话,我们是在底层。
刚才几位嘉宾都提到,AIGC生(shēng)成式大模型在这(zhè)两年(nián),特别是2022年之后成(chéng)为一个热词,我们看到(dào)的多个榜(bǎng)单里面,特别是在2023年度热词榜单里面AIGC都是排在前几位甚(shèn)至排在首位的。1957年人类就已经(jīng)用(yòng)计算机生(shēng)成了(le)历史上(shàng)第一首机器创作(zuò)的音乐作品。直到2022年11月份,有一个标志性(xìng)的事(shì)件就 是OpenAI的GPT,从那(nà)个时刻开始人类对于人工智能的应用才从传(chuán)统的“知(zhī)识(shí)的分类器”进化到“内容的生成器”。
从2023年开始,我(wǒ)们非常明显地可以看(kàn)到“百模大战”,2023年中国发布的人工智能(néng)大模型是300多个,我们也认为从2023年开(kāi)始AIGC或者人工智能大模型开始渗透(tòu)到(dào)我们的工作(zuò)、生活的各个方面。我昨天(tiān)看 到一个新闻,谷歌的联合创(chuàng)始人谢尔盖退休两(liǎng)年了,现(xiàn)在被AI广阔(kuò)的前景所吸引,重新回到一线敲代(dài)码,他抱怨(yuàn)自(zì)己的(de)员工(gōng)、程序员用人工智能写代码的比例太低了。人工智能除了可以生成图片、生(shēng)成文字,现在能够生成音(yīn)频、视频、影视(shì)作品,能够(gòu)写(xiě)代(dài)码。
同时,很多人之前查资料,查素材、查(chá)数据 的时候用(yòng)搜索引擎。但现(xiàn)在,我相信很多人已经(jīng)在用Kimi、豆包,取代了以(yǐ)前要借助(zhù)百度(dù)、谷歌所要完全的(de)相关搜索,甚(shèn)至知识的提(tí)炼和知识(shí)的整理(lǐ)工作。
2024年是(shì)真正进入到人工智能的爆发期或者叫井喷(pēn)期。今年前8个月,在手机移动端上(shàng)人工智能的应用收入跟去年相比同(tóng)比增(zēng)长(zhǎng)了(le)51%,预计今年整个收入会达到33亿美元的规模。今天(tiān)我们(men)也听到了很(hěn)多人工智能头部厂(chǎng)商的 专家给(gěi)我们带来了(le)最新成(chéng)果,从侧面证明2024年人工(gōng)智能真正的井喷期已经到来了。
从未来发展来看(kàn),Gartner预测,2027年(nián)生成式(shì)人工智能市场规模会超(chāo)1800亿美元,占全球整个AI支出的42%。
我们(men)一直说算力、算法和算料(或者数据)是人工智能发展的三(sān)大要素,从AIGC角度来讲,算力、算法和算料 也是AIGC发展的三大要(yào)素。现在大家(jiā)有一个普(pǔ)遍共(gòng)识,大(dà)模(mó)型意味着大(dà)成本,也就是说大模型是一个非常烧钱的生意,或者说是一个非(fēi)常烧钱的游戏。大(dà)模型厂(chǎng)商(shāng)的整体(tǐ)运营成本,一般来看分(fēn)为三部分,第一部分是用于推理(lǐ)的成本(běn),第二(èr)部分用于训(xùn)练的成本(běn),第三部分是人工成本(běn)(就是程序员、管理人(rén)员、测试人(rén)员)。中国工程院院士郑(zhèng)纬(wěi)民教(jiào)授的测算结果(guǒ)表明,大模型训练中70%的成本是用在算力上,推(tuī)理过程当中这个比例就更高,超过了95%。根据OpenAI2024年的(de)财(cái)务预测,预计2024年总的(de)运营成本会达到85亿(yì)美元(yuán),里面15亿美(měi)金是人工成本(běn),就(jiù)是(shì)工程(chéng)师成本,另外70亿中的(de)30亿是训练(liàn)成本,40亿是推理的成(chéng)本,绝(jué)大部分都是用(yòng)于采购算力。这(zhè)个说明,确实做人工智能大模型、做(zuò)AIGC,算力是我们所有(yǒu)运营成(chéng)本里面占比最大的一块,也是最重要的一(yī)块。所以OpenAI的CEO把OpenAI这(zhè)家龙志中:2024年是人工智能爆发期(jiā)公司定义成了一家硅(guī)谷历(lì)史上最资金密集型(xíng)的(de)一个初创(chuàng)公司。
我们(men)知道现在(zài)进入到数字经济的(de)时代。国家数据(jù)局的刘烈(liè)宏局长(zhǎng)认为算力就是(shì)数字经济时代的(de)新(xīn)质生产力。有一个(gè)指(zhǐ)数就叫“计算(suàn)力指数”,计算(suàn)力指数平均每增长一个(gè)百分点,所带(dài)来(lái)的数字经济和GDP的增长会分别增长3.3%和1.8%。目(mù)前(qián)的算力市场有几个类型:第一类是通用(yòng)算力或者基础(chǔ)算力(lì),第二类是智能算力,第三类(lèi)是高级算力,另外一(yī)种算力(lì)叫 量子算(suàn)力。
从我们看到的调(diào)研机构数据(jù)来看(kàn),2021年的时候,智能算力在整个中国整体(tǐ)算(suàn)力规模里的占比已经超过了50%,达到了51%,并且(qiě)到2030年的时候这个比例还(hái)会持续增加,预计(jì)会占到整个算力规模(mó)的72%。同时,信通院的预测是到2030年的时(shí)候,人(rén)工智能算力需求(qiú)跟18年相比(bǐ)会增加(jiā)390倍。所以(yǐ)我们讲数据、算法和算力是数字经(jīng)济的关键资源,数据或者(zhě)算料成为新的生产资料,算力成为(wèi)了新的生(shēng)产力(lì),或者按照现在的说法成为新质生产力,算(suàn)法(fǎ)成为现在新的生产关(guān)系。
刚(gāng)才我们讲到算力,在(zài)整个人工智能(néng)的发(fā)展(zhǎn)过程当(dāng)中,算力的需求或者(zhě)算力所占用的成(chéng)本应(yīng)该(gāi)是非常高的,超过的50%以上(shàng)。同时我们可以看到(dào),随着大模型(xíng)成为AI领域新的 开发范式,AIGC对于(yú)训练数据的(de)需求也是呈指数级增加的。从ChatGPT到谷歌的switch transformer,模型规模和数据(jù)规模是持续巨量增加的,可以认为是指数级的增加,数据和(hé)参数规模在一年之内增(zēng)长了一百倍之多。同时随着大模型的参数和(hé)所需数据(jù)量激(jī)增,所需要的智能化底座规(guī)模也是会越来越大 ,特别是对于算力的需求更是如此。在小模型时代(dài),更(gèng)多是用(yòng)于图像、语音和(hé)文本分(fēn)析的时代,可能很多时候我们单机(jī)规模就能满足我们一般(bān)的需(xū)求。到了(le)以ChatGPT为代表的文本(běn)大模型时代(dài),参(cān)数(shù)龙志中:2024年是人工智能爆发期规模基本上超过了千亿。所需(xū)要的计算集群或者(zhě)算力底座的(de)规(guī)模 也进入千(qiān)机万卡(kǎ)时代。目前做大(dà)模型竞争,千机万卡基本成为(wèi)了门槛或者是(shì)标配。到了多模态大(dà)模型的时代,比如谷歌的switch Transformer,参(cān)数规模达到(dào)了1.6万亿,这种规模大模型需(xū)要万机十万卡规模的集群来承载(zài)。
现在千机万卡已(yǐ)经成为大模型厂商的(de)一个门(mén)槛(kǎn),一个入(rù)门的(de)入场券,但其实(shí)并不是所有的企(qǐ)业要用到大模型都需要自己去构建这么大规模 的算力底座。AIGC或者(zhě)人工智能这个领域的三层模型是大家公认的一个分层(céng)模式(shì)。根据企业(yè)在这个(gè)领域里的产业分工(gōng),分为上游、中游和下游。上游就是基础设施,包括关核心部(bù)件、主要产(chǎn)品和基础(chǔ)设施的服务,以及预训练模型和数据的供给。中游就是今(jīn)天在座很多(duō)的AIGC头(tóu)部企(qǐ)业,在(zài)做model as a service,做垂(chuí)直化、场景化、个性化的大模型落地。下游就是应用层,面向(xiàng)企业、面向个人来做内容生产、设计、分(fēn)发等大模型场景应(yīng)用。在AIGC的三个层面,所(suǒ)需要的算力(lì)资源规(guī)模、类型、获(huò)取途径是不(bù)一样的。
曙光(guāng)一直是一家专注做计算的企业,创立之初(chū)到现在,一直(zhí)围绕(rào)着(zhe)计算的核心部件,主要产品,以及(jí)计算的(de)基(jī)础设施建设和运营服务,来打造自己的核心竞争力。我们可(kě)以看(kàn)到,目前在(zài)人工智能这个领(lǐng)域所面临的挑(tiāo)战或者困境有(yǒu)几个:一个是算力资(zī)源获取的便利性、普惠(huì)性(xìng)、技术架构(gòu)的开放性、算力(lì)的融合性(xìng)以及能(néng)耗方面的高开销。
曙光也希(xī)望在这(zhè)些领域能够给大家提供解决(jué)方案,来降低使用人工智能大(dà)模型(xíng)在算力方面的(de)一些(xiē)门槛。曙光能(néng)够(gòu)提(tí)供的助(zhù)力有三个方面:第一是人工智能相关的核心部件(jiàn),主(zhǔ)要(yào)产品,还有(yǒu)关键的基础设施,包括PUE在1.04以下的全液冷数据中(zhōng)心 。第二是算(suàn)力中心的建(jiàn)设和运营。目前我们在全国(guó)有二(èr)十多个大型的(de)算(suàn)力中心、智算中心、先进 计算中心,以及五十多个城市云中(zhōng)心,能够为我们(men)的企业、为我们的区域(yù)/城市能够提供澎湃、多 样的算力资源。第三是人工智能的(de)生态,在目前主流的大模型跟曙光的核心部件(jiàn),主要产品还有算力平台基(jī)本上都做了适配,并且在(zài)算力互联网(wǎng)上能够提供生态合(hé)作伙伴的大模型服务(wù)。通(tōng)过接入算(suàn)力互联网,企业不需要自(zì)己去构建算力基础设施的平台(tái),甚至不需要去部(bù)署自己的(de)大模型,可以(yǐ)直接采用多样的算力服务和大模型(xíng)服务。
一些城市要打造数(shù)字基础设施,来服务于数字化(huà)经济发展(zhǎn),为企业数 字化转型提供动力。曙光(guāng)在全国各地建(jiàn)设运营的数(shù)据中心(xīn)有四大类:先进计算中心,云(yún)计算中心、智能计算中心、一体化大数据(jù)中心(xīn)节点。这些算力基础设(shè)施,符合(hé)信(xìn)创要求和标准来构(gòu)建,采(cǎi)用了浸没 式的液冷(lěng)技术将能(néng)耗降到最低。再结合曙光(guāng)本地化专业团队和运营服务,可以为我们区域数字经济发(fā)展和企业(yè)数字化转型提供动力。
有些企业希望在通用大模型或行(xíng)业大模型基础之上构(gòu)建自(zì)己企业(yè)的大模型应用。曙光(guāng)也可以提(tí)供云数智底(dǐ)座,帮助(zhù)企业打(dǎ)造私有的大模(mó)型基础设施。在云数智底座里(lǐ)面不(bù)仅(jǐn)提供AI算力、AI储力的基础(chǔ)设施,还能提供数据平台,数据平(píng)台帮助企(qǐ)业进行数据(jù)的全生命周期管理,同时为大模型应(yīng)用提供优质的和充沛的算料。
人工智能、大模型产业的发展需(xū)要上(shàng)中下游(yóu)的协(xié)同努(nǔ)力,曙(shǔ)光(guāng)也希望能够通过“中国科学院人工(gōng)智能(néng)产学(xué)研(yán)创新联盟”和(hé)“光合组织”,作为技术创新和成果转化的平台,作(zuò)为人工智能(néng)产业链上下游产业协作和共同发展的平台。我们也希望通过我们提(tí)供的可(kě)信、开放、绿色和普惠的计算基(jī)础设施算力服(fú)务,跟在座的企业和业界(jiè)的同仁一起努(nǔ)力,帮助企业在人工智能大模型领域(yù)的技术创新、商业模式创新和应用创新(xīn)方面提供助(zhù)力。也希望跟大家共同努力,共创AI产业崭新的未来,谢(xiè)谢大(dà)家。
新浪声明:所有会议实录均(jūn)为现场(chǎng)速记整(zhěng)理,未经演讲者审阅,新浪网登载此文出于传递(dì)更(gèng)多信息之(zhī)目的,并不意味着赞同其观点或证实其描述。
责(zé)任(rèn)编辑:梁斌 SF055
最新评论
非常不错
测试评论
是吗
真的吗
哇,还是漂亮呢,如果这留言板做的再文艺一些就好了
感觉真的不错啊
妹子好漂亮。。。。。。
呵呵,可以好好意淫了