宁波鄞州城东医院-鄞州五官科医院-宁波耳鼻喉医院宁波鄞州城东医院-鄞州五官科医院-宁波耳鼻喉医院

硅基智能创始人司马华鹏:所有使用AI的人,应该专注到人类特有的东西

硅基智能创始人司马华鹏:所有使用AI的人,应该专注到人类特有的东西

“大(dà)家好,我是(shì)刘强(qiáng)东,今天是不是看起来有些不同?很久(jiǔ)没直播,还有些许(xǔ)紧张(zhāng)……话不多(duō)说,老刘(liú)的数字直播带货现在开始。”4月(yuè)16日(rì),京东创(chuàng)始人刘强东在京东平台开启数字人直播(bō)。

“东哥”数字人直播,迅速引起广泛关(guān)注,数字(zì)人替代真(zhēn)人直(zhí)播的时代来临了吗?

4月18日,数(shù)字人头部(bù)厂商硅基智能创始人司马华鹏接(jiē)受了《每日经(jīng)济新闻 》记者的专访。司马华鹏表示:“刘强(qiáng)东这次数字人直播,对我们行业是(shì)非常(cháng)大的品牌宣传。他使用(数字人直播),说(shuō)明(míng)这个行业得到了一次非常重要的认可。”

对于AI的使用(yòng),司(sī)马华(huá)鹏建议:“未来所有使用AI的人(rén),应(yīng)该专注到人类特(tè)有的东西,比(bǐ)如创意,比(bǐ)如有温度的东西。”

拆解数(shù)字人技术

“数字人刘(liú)强东”是否有硅(guī)基(jī)智能技术的(de)支持?司马华鹏表示:“我们不太方(fāng)便对外公开,但这些技术最早(zǎo)的开创(chuàng)者肯定是我们。我们(men)在整个(gè)(数字人(rén))直播上大概有40多项发明专利,在申(shēn)请的也有几十项。现在行业内有很(hěn)多在使用我(wǒ)们的(de)技术授权,也有很多在使用硅基(jī)智能的API(应用程序(xù)编(biān)程接口)。”

“东哥”数字人究竟是如何打造(zào)出来的(de)?司(sī)马华鹏介绍:“它(数字人)这些内容(róng)是用(yòng)AI渲染(rǎn)出来的。如果现在想做东哥同(tóng)款,你需(xū)要提供几(jǐ)分钟的视频。然(rán)后我们会将其训练成一个数字人模型。这个数字人(rén)模型背后,将由大模型驱动它。定时去上一些产品、定时回复一些客户需求、定(dìng)时作一些记录,这些都是(shì)事先做好的剧本,这些剧本(běn)实质由大(dà)模型驱动,比(bǐ)较接近(jìn)于人类(lèi)的行为和反馈。”

那么,除了上 述AI渲染技术外,数字人 直播还需要哪些技术支持?司(sī)马华鹏称:“我们的大模型是多模态(tài)的(de),是文本(běn)生成、声音生成和数字人(rén)生成的结合。其(qí)实很多人在反馈,他(刘强东(dōng))声音和(hé)节奏感与他原来讲话不太一样。这很可能(néng)克隆的是平时的语(yǔ)速,但是直播(过程中),一个用户停留时长是(shì)比较短的,你必须在很短时间内把大量的信息披(pī)露出来,所以必须把声音放得快一些。”

对于语音合成技术,司马华鹏表示:“我们全部技术都是自己(jǐ)的(de)。从目前端到(dào)端(du硅基智能创始人司马华鹏:所有使用AI的人,应该专注到人类特有的东西ān)的生成(chéng)来讲,(语(yǔ硅基智能创始人司马华鹏:所有使用AI的人,应该专注到人类特有的东西)音合成)已(yǐ)经是一个非常成(chéng)熟的技术。”

数 字人形象、语音合成,都是(shì)外在展现形式,数(shù)字人直播内容仍旧(jiù)离不开文本。对于文本,司马华鹏称:“文本大模型方面,我(wǒ)们基本(běn)上都是原创的技术,最(zuì)近‘炎帝(dì)’大模型刚(gāng)刚通过(guò)网信办(bàn)的备案。”

能否替代真人直播?

目前,大家看 到的直(zhí)播带货,很可能就是数字人。司马华鹏介绍:“我们在2021年开创(chuàng)AIGC直(zhí)播的大方向,(刘强东数字人)基本上是我们2023年产品能够(gòu)呈现(xiàn)出来的效果 ,这样的直播间我们已经卖掉了上万个,京(jīng)东、淘宝、抖音、快手和视频号平(píng)台都有 。”

真人(rén)直播会面临(lín)各种复杂(zá)场(chǎng)景,特别是情感交流,数字人可以做到吗?司马华鹏表示:“我(wǒ)们(men)在看东哥直播的时候,会不(bù)会把他(数字人 )当作真正的东哥来看,这是决定数(shù)字人智能化程度的重要(yào)标志。从开播到现在,行(xíng)业有非常多的评价,大家觉得还是(shì)能看到一些机械的痕迹。”

“这个(数字(zì)人)行业发展 的核心就是‘看不出来(lái)’。”司马华鹏强调。

其(qí)认为(wèi):“我们现在也有大量的直播间,效(xiào)果比这个(刘强东(dōng)数字人)要好很多。如果他这个直播不是在自家平台,而是在其他 平(píng)台,很容易(yì)被机器识别出来,很快(kuài)就会被限(xiàn)流(liú)。”

因此,在司马华鹏(péng)看来,数(shù)字人行业的核心(xīn)是让整个直播间符(fú)合图灵测试。对于数字人行业的(de)发展,其认为(wèi):“(该(gāi)领域)图灵测试1.0是分不清(是人类(lèi)还是AI);图灵测试(shì)2.0则是(shì)双向(xiàng)情感交互;图(tú)灵测试3.0就是‘死(sǐ)生相契’,未来我们与AI之间 ,可能是(shì)Soul Mate(心灵(líng)伴 侣)的关系,它(tā)是你非常重(zhòng)要的助(zhù)手、朋友,也可能是(shì)你亲密的(de)合作伙伴。”

目前(qián),很多问答式大模型主要给受众提(tí)供专业类(lèi)辅助,但(dàn)若诉诸情感,是否兼(jiān)具图像(xiàng)、声音和文本(běn)的多模态大模型更 具优势?对(duì)此,司(sī)马华鹏表示认可。“人类大脑的设计中,90%以(yǐ)上是针对图(tú)形,所以我们说有图有真(zhēn)相。基于文 本,产生的是想象力,(阅(yuè)读文本(běn))的能力确实非常重(zhòng)要,但对大部分人而言,(自(zì)己(jǐ)的(de)大脑)生成(chéng)图片,然后(hòu)再(zài)想象出(chū)一个空间,还原出这个东(dōng)西,是非常累的。因此,多模态或者视(shì)频化交互能力(lì),能(néng)够大大降低(dī)我们之间信息沟通对应的脑力消(xiāo)耗。”

对于未来AI电商的形(xíng)态,司马华鹏认为,未来更大的价值(zhí)是专业性。比如说,假设我们在食品领(lǐng)域有一个很好的AI专家,它(tā)可以从数(shù)据、算法的(de)角度给我们提供很多的专(zhuān)业内容(róng)。这样的专家,它带来的影响力会(huì)超过现(xiàn)有的人类专家,这(zhè)会带来真正的、更好的电商交易。

其进一步解释称:“人类在做很多行为(wèi)的时候,有一定的偏(piān)颇或者偏见,或者带有一定的商业目的。而以(yǐ)数字和算法驱(qū)动的AI专家,会成为 我们的朋友、我们的伙伴,很有可(kě)能成为AI电商未来的主流(liú)。现在这些成本还比较高(gāo),只(zhǐ)是(shì)出现在奢侈品领域。我希望未来每一类(lèi)小产品上,都有这样一个专家顾问,来给(gěi)我们(men)提供非常好的 沟通交流 方式。这是AI电(diàn)商未来非常重要的一部分(fēn)。”

未经允许不得转载:宁波鄞州城东医院-鄞州五官科医院-宁波耳鼻喉医院 硅基智能创始人司马华鹏:所有使用AI的人,应该专注到人类特有的东西

评论

5+2=