说起公司明年赴美SPAC上市的规划,占健带着一丝不真实的兴奋,“之前是打工的,没想到有一天会变成股东。”
3年前,他加入公司,一家以电商之都杭州为原点,辐射江浙沪周边电商企业的真人代播平台。高峰时,公司曾接收过600个应聘主播的本专生,培训三个月,筛掉一半的带薪试用生,筛出合格的主播。
这是一项高成本的试验。在疫情时挑战尤为明显,公司经历了主播通行受阻和集体病倒带来的收益骤减。2023年春节后,占健只见到了30名主播复工。不幸的是,主播们复工不久,就接到裁员通知。取代他们的是一批正风靡直播间的数字人。
一位研究AI十年,已投入数字人领域的从业者说,数字人是在AIGC领域中为数不多明确的事:技术可控——输入信息后,能知道明确的输出结果;算力可控——生成面部表情消耗的算力有限,还有短视频、直播间的垂直落地场景。换句话说,这是一条商业化明确的路。
占健所在的公司已不是疫情时的倒霉蛋,而是冲上天的幸运儿。今年3月,公司转变为一家卖数字人的服务商,提供数字人克隆和代运营服务,并附赠一些如何使用“新式武器”的教学指南。这是他们几年做代播平台积攒的经验。
在占健和公司创始人口中,公司定位为“AIGC数字人中的华为”,明年将赴美借壳上市,成为全球化数字人服务商。占健也成为公司多个合伙人之一。
这样激进的规划,底气来自于数字人的订阅增长速度完全超出他们的预期。转型的5个月,他们克隆了1000个数字人,招聘了近30个城市代理,回款超过3000万,融资数千万。
超预期的事,在这半年的数字人行业中不少见:三年前开始研发AIGC数字人的排头兵硅基智能,去年还只克隆了数万名数字人,今年宣布克隆数字人达到40万。
一名硅基智能数字人的推广人员最近的烦闷是,年初,公司制定了全年业绩目标,他们仅用一个季度就完成了目标,公司重新制定了全年目标,过了一季度,他们又完成了,现在的目标变得更高了。
作为AIGC领域少有的盈利项目,这一领域开始吸引众多追随者。一位AIGC的从业者发现,自己接触的5家AIGC公司,其落地方案都有一致性,即用“文生视频”,生成数字人进直播间为商家卖货。
大厂也布局了——腾讯打造腾讯智能、百度打造智能云曦灵平台、京东打造言犀、华为打造华为云盘古数字人大模型。
创业公司也没有落下。企查查显示,这半年内,新成立与数字人相关的公司数量接近2万家。一位从业者笃定地说,下半年行业更热了,增长至少超过20%。
在这场被AIGC席卷的巨浪中,数字人领域完成了一个小小的目标:落地且造富。
1.造富狂热
搜索“数字人”,你很可能会看到这样的视频:一间宽敞的办公室里,填满工位的不是员工(碳基生物),而是一排排电脑屏幕和在直播间不停歇的数字人(硅基生物)。
置身在这样的场景中,震撼感不会比你见到一个有趣的人更多。但它所带来的变化是明显的,空荡荡的办公通道和办公室里,很少能见到员工,却随处可见正在直播的数字人和显示屏。
数字人技术公司和服务商都会有这样的展示间,它们的作用类似一个放满样机的手机门店。
在空荡荡的房间,在晚上9点见到占健时,他的脸上没有疲惫,对公司的发展历程和规划侃侃而谈。对于上市,他们计划如果明年的营收能做到两千万,就联系海外机构,如果不能达成,就让已上市的投资方收购公司,也能完成股票的兑换。
这是一场梦幻般的反转——从一家在疫情期间艰难度日的企业,转身为一家刚创业就计划上市的AI公司。占健觉得这无疑不是一场造富:过去,客户在平台找主播,一次直播给公司带来的业绩也不过一两万元,而现在,公司重心在拓展城市代理,一个城市代理的收费几十万元。哪怕是卖数字人,销售价也要2.98万元/年,“比代播单更好卖”,占健说。
在与营收挂钩的数字人、城市代理等指标上,数据增长得非常清晰。公司创业5个月,季度增长率超过250%。在一次AIGC的分享会上,只有占健的老板用数据体现了公司在应用中得到的回报——“启动4个月,回款3000万元”。
一个月后再联系占健,他们已经在谈第4轮融资,并为此拉高了营收目标——2000万元提前达成,新目标是5000万元。明年上半年的目标是3000万元。
创始人对此不甚在意,这并不是造富的终点,可能只是一点小信号。营收高,投入也大。上个月,他们才花了1500万元买芯片和服务器,追随市场需求的扩大而追加投入。
“靠自己挣利润,永远不可能做大。”他对公司的规划是做大市场,“必须融资、上市、并购、形成垄断、进军全球”。
数字人公司都有类似的数据,显现这近一年间的财富增长。一家在数字人领域深耕数年的公司,创始人在接受媒体采访时说,今年上半年AIGC数字人业务量超过了过去2年的总和,且已盈利。
硅基智能则制定了看似激进的目标——2024年成为第一家收入百亿元的AI创业公司,2025年实现百亿元利润。他们将生产1亿个包含数字人在内的硅基劳动力。
如果知道了它们的商业模式,可能并不会奇怪。在数字人的数据库达到一定量级后,几乎可以0成本生成,而数字人的数量在极速增长。一家数字人公司现在的销售价格,还是近一年前的4倍。
数字人的衍变方向都追随着钱的方向。
占健所在的数字人服务公司的目标是参加招商会,招下级代理和卖零单,同时用小模型拓宽数字人的应用场景:医美、法律咨询、教育等。
数字人技术公司硅基智能一边出售自己的API接口,将数字人克隆技术开源给商业伙伴,一边用数字人进军出版社、影视剧等领域。硅基智能的商业策略是,在每个领域找到头部的运营商,教会行业如何使用这个新式武器,再赚到这个行业的钱。
比如在电商领域,硅基智能和谦寻控股合作成立合资公司谦语智能,借助头部主播的力量带货数字人;在文娱领域,硅基智能和乐华娱乐达成协议。
数字人为什么在短视频/直播中的应用得以爆发,硅基智能创始人司马华鹏的解释是,在投入产出比上,以一对多交互的短视频/直播切中了黄金交叉线,“用200个A100生产的内容交互1000个人,和交互1个人的价值不一样。”
这还不是数字人的终局。比起用AI做短视频/直播更赚钱的是做AI电影、AI明星,“制造一个王一博和粉丝每天一对一互动。”
这是数字人公司能赚到更多钱的方向。
2.“钱”路不明
找到一条明确的商业化路径并盈利,在一年前的数字人行业还是天方夜谭。这里只有烧钱。
几年前,数字人的叫法更多还是虚拟人。在Meta AI引领元宇宙热潮时,被看作元宇宙原住民的“3D虚拟人”是备受追捧的创业方向,创业公司在全国多达几十万家。
3D虚拟人有两种技术路线,一种是动画类数字人,渲染要求不高,肢体动作和面部表情都表现僵硬,唯一优势是可以规模化;一种是超写实虚拟人,通过高成本的原理动画制作,生成一个更贴紧人、表现力强的虚拟人,代表人物有初代虚拟偶像洛天依。
第二种更人性的超写实3D虚拟人,是有实力有梦想的公司选择的方向。但它的特性,一个字,就是“贵”。
制作一个3D虚拟人,要经历扫描、建模、计算机绑定、动画展示和渲染等环节,按照传统的CG级制作手法,制作一个数字人耗时2-3个月,费用达到100-200万元。
3D虚拟人的制作越精良,花费的成本越高。根据英伟达官方博客,黄仁勋虚拟人在发布会上出镜的14秒视频,共有34位3D美术师和15位软件工程师协同参与,总计近千工时。
而它的商业化场景,又极为局促。这类3D虚拟人往往以IP形式存在,直接面向to C领域。2022年10月31日,柳夜熙凭借“捉妖”题材上线后,好消息是一夜涨粉363万,坏消息是运营费用也成倍增长。据「甲子光年」此前了解,运营一个虚拟人一年要耗费800万元。
3D虚拟人成本太高,人们就把目光投向降一维度的2D数字人,用AI生成。2D的技术路线形象接近真人,且复制快、成本低、运营门槛不高。
硅基智能将每年上亿元的财力投向研发数字人,研发过程屡次让创始人司马华鹏兴奋。生成2D数字人所需要的数据采集成本越来越少,成本肉眼可见地下降:从最初需要30分钟的视频数据,到10分钟的,5分钟,慢慢缩短为一分钟、甚至是一张照片,“这是一条非常好看的曲线。”
成本降低了,但生成效果却越来越好。一次,研发团队将一个调教过后的数字人视频发送给司马华鹏,他看后生气地问负责人,“发一段视频做什么?”对方说,这是AI生成的,这让司马华鹏极为惊讶。
但单纯成本的下降,却并未帮硅基智能打开钱路。
“今天它有多火,就能想象之前曾有多冷”,在今年多次公开露面的司马华鹏在一次媒体群访时感慨。
数字人的生意在开发后的两年都乏善可陈,硅基智能只能通过接定制化和政府订单养活团队。2021年,硅基智能只卖出几千单,2022年,这一数字也只增长到数万。
硅基智能不是没有卖力推广。几十人的推广团队,每天通过抖音后台的广告引擎,联系200多名短视频博主,向她们发放优惠,“给您免费制作一个数字人,可以吗?”
对方不是沉默,就是在了解后拒绝。“这是一个太新的东西”,硅基智能的推广人员说。当时为了推广数字人,硅基智能的定价仅2000元/个,通常附带7折优惠,都少有人问津。
“我们被拒绝过几十万次”,司马华鹏说。而在内部,公司还留有十几万抖音KOL的联系方式。和现在相比,这已是一本旧日的黄历。
3.“刘润时刻”
数字人的本质是,通过视觉采集人们说话时的唇动、表情和面部肌肉细节,传导至AI,让AI充分学习后,衍生出更多表情和动作,成为一个新“人”。数字人就是当前大火的AIGC的一个场景。
这依靠机器视觉的技术成熟,精确捕捉人说话时的唇动和面部细节,以及NLP(自然语言处理技术)能让数字人具有和加深理解用户意图、生成回答、保持话题连贯等对话能力。
其运行原理,与ChatGPT一致,都依靠精湛的算法、强悍的算力和优质庞大的数据库。
在ChatGPT发布前,硅基智能通过了数字人的图灵测试第一阶段:仅通过肉眼,不能分辨真人和数字人的区别。
AIGC带来增进的部分也很明显。硅基智能CTO林会杰告诉「甲子光年」,一年前的硅基数字人在吸收视频素材后,还需要工程师训练一星期左右。现在,当大模型积累了40万人的视频资料,AIGC的生成速度达到分钟级生成,而成本指数级降低。
数据的积累,让数字人更真实、更流畅和更可懂。一名硅基智能的销售说,两年前卖数字人时,还会有客户说不像真人,现在几乎没有了。
AIGC带来的最重要影响,还不是技术上的大跃步,而是打破了将技术推广开的僵局。
启发点在ChatGPT发布前的10月底,商业博主刘润在年度演讲“进化的力量”中展示了自己的数字人,这在硅基内部被称为“刘润时刻”。
随着ChatGPT的发布,刘润的认同像撒开的一把种子,硅基智能很快提高了因为不熟悉市场需求而设置的低价,需求单都飞了过来,“一下就爆了,这个人认同了,它的社群都认同你的产品,还愿意帮你传播”,司马华鹏说。
平台的包容是另一催化剂。在疫情后,抖音加大对本地生活的关注和投入。从业者观察到,平台对于数字人的态度在今年初开始从“一旦直播就立马封号”到“选择性封号”。
最适合运用数字人直播的场景,是“货代人”的本地生活,这为数字人直播间提供了生长的土壤。
在抖音平台增长的数字人数量最快。直到2022年10月份,硅基智能才制造了自己的第一个直播数字人,半年后,司马华鹏在多个场合骄傲地宣布,“每天有5万个硅基数字人在直播,创造数亿元的销售收入”。
由硅基智能提供的一个案例是,2023年春节,杭州一家本地生活公司因为缺少人手,两位运营人员同时运营8个硅基智能数字人直播间,在小长假期间收获了千万流水。
没有关于这个故事更具体的叙述,但2个人运营8个直播间带来的降本增效,在特殊时间节点春节获取的千万营收,成为数字人能在直播间创造财富的故事样本,像风一样传开。
过去不愿意了解的抖音KOL、电商商家和谦寻董事长董海峰都找上门,业务询问电话甚至通过公司官网,打到了公司各个行政部门。
销售们在前两年接触客户时,她们需要讲解数字人的定义、好处和用处,现在不用多费口舌,“对方一上来就问,多少钱、怎么定制、多久交付”。
以往,硅基智能的推广人员在介绍公司时,总会被询问,“硅基是什么?是硅胶吗?”这一通过芯片主要元素“硅”命名的生命体,此前还是陌生名词。一夜间,推广人员觉得有些好笑了——在与客户打交道时,大家开始夸赞硅基智能在取名上,有先见之明。
在杭州,占健第一次感到做数字人被围观,是在刚转型不久的3月。一个深夜,他们配上《午夜凶铃》的音乐,将一个视频传上网:在办公室的地面上,前后摆满了70台显示屏,播放着数字人的直播画面。“办公室没有人,都被数字人取代了”。视频播放了60万次。
此后,占健几乎每天能在数字人播放屏前接待三拨人,最忙的时候,他两只手握着两个手机,一个接完听下一个。
三个月后,占健就嗅到一丝竞争的气息。义乌的代理商开始问他,“你们的数字人有什么优势?”
问价后比价的人也变多了。占健给出的价格是2980元克隆一个数字人,而市场价格已低到300元/个。
4.躺着赚钱?
AI散播的焦虑,让数字人变成一些人的赚钱工具。
见实科技创始人徐志斌在举办AIGC大会前,发出了325份有关AI的问卷,其中90%的人表示愿意掏钱学习AI技术,创始人尤其焦虑AI会颠覆公司的优势。
这种心态被卖数字人的人当作销售痛点。一位数字人行业的从业者在直播间宣传数字人课程时,当有企业问如何改变疫情后线下客流量不足的问题,统一答案都是用一个新武器“AI数字人”,提供一些新鲜感。然后是一套销售话术:“不到一万的价格,可以体验和用上AI,对老板们来说不值一提;老板自己都不用AI,员工怎么会用呢?”
数字人的确是一个在部分场景被验证有价值的工具。
2022年,占健陪跑了一家试图削减直播间开支的插座企业。在店播刚兴起时,这家企业专门聘请了两个包括主播、中控、场控、运营的直播团队,花了上百万打造直播矩阵。直到他们决定尝试用数字人替代部分真人主播。在试播三个月后,占健发现,数字人直播的数据比真人直播少,但在成本差距面前不值一提:数字人的花费不到真人主播的1/10。
后来这家插座企业几乎沿用这样的方式,在占健处投放了几十个数字人直播账号,这些账号每天播放的时间很长,可以拉到40个小时,只要有交易流水,就能保证一定的营收。
另一个案例是,一家文旅景区在进入直播领域时,曾请主播开直播,打造过1亿流量,却没有卖出一张门票,现在投放了一部分预算给数字人,每天都有部分流水。
但是,数字人在直播间的应用价值主要体现在店铺自播,和已有IP的直播间中。数字人只能维持直播的营收模式,通过节省真人主播降低成本,而不能从0-1创造一个有利润的直播间。
在具体的落地实践中,数字人躺着赚钱的神话只有破灭。司马华鹏将其比作,“(大家)以为把机器买回来就能赚钱,(想法)最后落空,是行业最大的痛点”。他认为,AI在直播间发挥作用依靠六大因素:科技、运营、供应链、IP、金融、账号,缺一不可。
一家数字人公司创始人在做分享会时警示代理商,真需求是用数字人降本增效,伪需求是用真人都无法播出结果期望用数字人救场。
在短视频中,AIGC数字人因为通过了图灵测试,而几乎可以做到以假乱真,帮助许多主播解决重复录制的问题。而更需要交互的直播间中,AIGC数字人还不具备真假难辨的交互能力,通过提问题、听主播声音、有没有大幅动作,都判断在直播间带货的是不是数字人。
数字人达成营收的方式是拉长时长,真人主播播6小时,数字人则会播8-12小时,长的时间有40多个小时。长时间的数字人需要微妙地处理平台的录制审核,判断为低质量的数字人,平台不会推流,每1秒基本只有1人观看。
硅基智能CTO林会杰说,一个理想的直播间达成,还需要等到数字人在直播间的状态通过图灵测试后,而这依赖于数字人丰富的表现力和肢体动作的协调,需要很大算力。
除了直播间内部的运营之外,更复杂的情况是外部因素——短视频平台对于劣质内容的把控和查封。5月17日,抖音平台更改了查封策略:要求做数字人直播必须有真人参与。“这就是无人驾驶上车驾驶员不能离开方向盘”,司马华鹏解读。
行业也有一套应对体系。比如谦语智能在做代运营时,会用到配合真人的“阿凡达”模式:在屏幕中的数字人,由一个真人实时提供文案,AIGC生成唇形与表情。如果是由AI生成的文案,可能会循环播放,导致平台判定为录播而封号。
占健有一套躲避平台查封的策略,比如在起号的7-15天的风险期中,做间断式直播,“直播2小时,下线,再开播”,或者给一场直播做10个切片,第一天顺着放,第二天倒着放,第三天打乱顺序放。
哪怕这样,数字人账号被封也是常有的事。在做客户测试时,100个账号的短暂封控率(封控1-3天,无永久封控)在30%左右。能被平台推流而每天产生成交量,30个账号中只有15个。
AI从应用到直播的距离,类似机枪被发明后搁置了几十年,才在战场上大规模使用。一个新式武器从发明到应用广泛间,往往还需要一定时间。
“在赚钱角度是好生意,科技向善角度不是好生意。”司马华鹏说。创造AI不是毁灭人类,一些行业乱象却是在做这样的事。
梅拉妮·米歇尔(Melanie Mitchell)在《AI 3.0》中说,人工智能研究人员佩德罗·多明戈斯所说的那段令人印象深刻的话:“人们担心计算机会变得过于聪明并接管世界,但真正的问题是计算机太愚蠢了,并且它们已经接管了世界。”
司马华鹏分享他们当时做电话机器人的经验,盈利模式和今天的数字人一样可观,无数电话机器人公司涌入这条赛道,最后等到政府发文整治骚扰电话,运营商不批路线给机器人。结局是,“大家把行业干死了”。
那么,数字人呢?
(封面图来自《我,机器人》)
免责声明
本文内容(图片、文章)翻译/转载自国内外资讯/自媒体平台。文中内容不代表本站立场,如有侵权或其它,请联系 admin@eiefun.com,我们会第一时间配合删除。