道德经言:“道生一,一生二,二生三,三生万物。”道即自然规律、宇宙运行规律,衍生出天地、阴阳、男女…….二生三,再衍生为万物。其思想本质是天地万物可以用一个通用的理论来解释,可谓大道至简。
这与时下火热的生成式AI不谋而合,大模型就像“道”,将衍生出万物。
本周,必将成为载入人工智能发展史的一周——史上最强大的多模态大模型GPT-4以及最强大的中文语言大模型“文心一言”均正式发布。
大模型如海啸般奔涌而来,让整个产业界、学术界、投资界都甚为惊叹、激动又惶恐担心错过一次划时代浪潮和机遇。
那么,如何正确看待大模型带来的变革?大模型能否解决AI商业化难题?多模态大模型创业备受关注,又将带来怎样的机遇与挑战?本文一一剖析,试图挖掘最受关注的大模型问题的答案。
大模型评价的三个维度:适用性、准确度和时效性
“ChatGPT的出现是人工智能发展的一个G点(或者说是爆发点),堪比智能手机时代iPhone 3发布,是颠覆时代的新物种。”中欧资本董事长、华为前任副总裁张俊博士对AI商业评论说。
过去人工智能主要以对比识别、决策为主,比如,自动驾驶领域车牌识别、车道线识别、人脸识别等,都是在已有的数据里寻求最优解。但ChatGPT能够创造性生成一些新内容,可以做一些推理,生产全新的内容。
要正确理解大模型,首先要找到评价大模型通用标准。张俊博士认为,“评价一个模型的好坏,可以从处理信息的适用性、准确度和时效性这三个维度来看。”
很多人会把ChatGPT与搜索对比,搜索主要通过关键词推荐一堆内容,几十甚至上百条,但对于读者来说可能无所适从。而ChatGPT能够帮助读者获得更加精准的内容。在适应性上,ChatGPT做到了很优秀的程度。
在准确度上,搜索引擎已经可以做到前10条结果点击率超过95%,前3条结果点击率高达80%-85%。而ChatGPT在准确度上显然做了一个妥协,它的准确度不如搜索引擎,如果满分是10分,ChatGPT搜索结果可能只能打6分。
时效性方面,ChatGPT可能只能打0分,因为它的模型是以年为单位训练,不适合处理时效性强的信息。
综合来看,ChatGPT既有它的强项,也有短板。它其实是一个强适应性、弱准确度、弱时效性的一个大模型。
基于这三个特点,应用场景的界定就比较清楚了,它不适合从0到1,更适合从1到N;它不适合代替用户寻找正确答案,更适合在搜索之后做二次加工处理,比如做个总结、分类、纠错、写代码等。
大模型能治好AI商业化通病吗?
总结来看,人工智能技术商业化落地的链条如下:确定要求->收集数据->做模型算法设计->训练调优->部署应用->运营维护。
一直以来,无论微软还是百度等AI公司,均面临人工智能落地通病和难以逾越的鸿沟——落地场景碎片化严重,同时模型研发仍处于手工作坊式阶段,人力研发和应用计算成本高。
目前来看,OpenAI为行业探索出了一条新路径,即通过网络结构来自动搜索的技术路线,一种可以降低专业人员设计门槛的思路。
为应对各种各样的场景需求,研发人员需要设计专网和专用的个性化定制的神经元网络模型,而且它模型训练过程中又要求研究人员具有充分的网络结构和场景任务的专业知识。
更重要的是,ChatGPT不依赖于重复的对比和基于数据的统计决策,而是能够产生新内容,是全新范式的生成式AI。这也是让产业界、投资界引起轰动的原因。
从技术上来讲,它不仅是大模型的训练,而且是加入了监督学习的训练。如果把AI比作一个小孩,传统训练算法是给它读很多书,做一些训练,但这种小孩学习的程度和创造性就很差很慢。
而ChatGPT就像大人监督小孩学习,根据小孩学的情况、反馈出来的信息,再给他有针对性的监督他去重新读这本书。这就大大提升了学习效率,训练的成本也大幅降低
应用场景也将随着算力、算法、模型的落地,会不断演进。未来,像美团、大众点评、小红书、拼多多这些公司,它们可能会以全新的形态出现。而多模态大模型作为一个底层技术基、数字底座,其应用场景可以无所不在。
“人工智能将会把所有的业态重做一遍,我们核心还是要抓住多模态、大模型、通用人工智能这个平台的关键技术和核心能力,这些核心关键技术和核心能力将成为下一代互联网的数字底座。”张俊博士说。
多模态大模型创业如何抓住机遇?
自GPT-4发布之后,多模态大模型赛道已然成为资本市场关注热点。
今日(3月19日),由李开复亲自带队筹组的Project AI 2.0公司刚刚宣布成立。李开复在朋友圈表示:“我正在亲自筹组的 Project AI 2.0,是一个致力打造 AI 2.0全新平台和 AI-first 生产力应用的全球化公司。”近期,诸多多模态大模型公司初露头角,国内首家多模态AI大模型创业公司MiniMax首款产品Glow已近500万用户; 迈微医疗布局多模态能量平台和关键技术,获得数千万元Pre-A轮融资; 拓元智慧连续完成两轮融资,首款AIGC产品商业化落地……
张俊博士认为,多模态创业公司首先要抓住三大关键技术:
- 多模态理解和生成多任务的统一建模,这是三大关键技术最重要的一个;
- 面向国产化软硬件的高效训练和部署;
- 多模态预训练模型架构的设计与优化。
三大关键技术是多模态公司落地商业化应用应该抓住的核心,它的核心能力体现为6个方面:
- 多模态统一表示和语义的关联;
- 多模态的内容转化与生成;
- 运行预训练模型的网络框架设计;
- 标注受限的自监督模型的学习;
- 模型适配和分布式训练;
- 模型轻量化与推理的加速。
对于创业公司,掌握了三大关键技术和6大核心能力,就可以在应用场景里去套这些技术路径,进而找到各种各样的一些应用。比如图像分析、双语翻译、语音识别等等,应用场景是无穷无尽的。
另外,小公司在人力资源、算力、资本等方面不占优势,应避开OpenAI主流赛道,比如说在准确性、实时性上解决一些Open AI还没有解决的问题,但又有自身的独特算法和前瞻性,再往前走一步。
“资本其实就是希望找到某一个细分赛道的领军企业或者是专精特新,比如说涉足大模型的大厂已经很多了,百度、微软、华为、阿里、商汤等都有自己的大模型,大公司有大公司的强项,人力物力雄厚,但小公司可以做一些细分领域,小公司船小灵活、可以不断去尝试。”张俊博士说。
“如果说一个大模型初创公司,能够在GPT-4基础上,瞄准一个细分领域再往前走一步,就应该可以建立一个护城河,你有了这么一个护城河,VC就愿意投你。”
回顾互联网创业早期,国外有亚马逊、Facebook、推特等巨头公司,但国内仍然诞生了BAT等互联网巨头公司,因为存在本地化优势,所以“本地化”也是大模型创业公司可以考虑的一大方向。
其实,国内大模型赛道玩家很少,行业处于非常早期。据了解,国内做语言大模型团队,包括互联网大厂、华为这些公司可能不超过10个团队,如果加上多模态领域,全国可以投的标的也不超过几十个。
大模型虽然是一个热门赛道,但投资机构和普通创业者能够抓住的机会不多,特别考验 VC的合伙人的综合能力,不但要有资本洞察力,还要有产业经验理解技术。
更大的挑战还是需要高水平的团队,必须是资深的从业者,搭建高人才密度的技术创新团队,同时又有比较强的 AI工程化能力。据媒体爆料,OpenAI的团队人数不过300,但大部分来自MIT、斯坦福、加州伯克利、清华等全球顶尖高校学府。
一位业内人士评价称:目前大模型赛道过热,99%都在忽悠,就像几年前的元宇宙,泡沫非常大。近期,某互联网大佬跳出来说5000万美金搞大模型创业,可能买GPU算力都不够。
结语
作为人工智能行业近10年观察者,愈来愈发觉人工智能与中国经典哲学思想殊途同归,其重要特点即“通用”,一条理论解释万物。或许,宇宙万物背后也源自一个大模型。
自然科学将学科细分,如数学、物理学、化学、医学、生物学等,人工智能又把这些理论融合、统一,AI 本身是一门跨学科、融合学科的行业,而大模型的终极目标就是要万法归一。
如今,AI大模型行业正处于浑然天成、万物初始的阶段。只有看清与巨头之间的差距,瞄准细分领域,再加上人才集聚以及资本的合力,才能走出一条“道”。
免责声明
本文内容(图片、文章)翻译/转载自国内外资讯/自媒体平台。文中内容不代表本站立场,如有侵权或其它,请联系 admin@eiefun.com,我们会第一时间配合删除。