图片来源@视觉中国
(资料图片仅供参考)
自ChatGPT问世后,国内互联网和科技领域迎来了久违的“狂欢”。
BAT级别的巨头引领潮流,京东、360、网易紧随其后,商汤科技、科大讯飞、出门问问等AI企业纷纷入场,李开复、王慧文、王小川等大佬“另立门户”,还有清华大学、复旦大学等顶尖高校下属科研院所加入其中,似乎人人都在为AIGC“发狂”。
国外风投数据分析公司PitchBook数据显示,2023上半年全球AI领域共计发生融资1387件,筹集融资金额255亿美元,平均融资金额达2605万美元。
这在资本收紧的当下可谓表现独树一帜。
在狂飙激进的AIGC大潮中,字节跳动是相对低调的那个。上半年,国内几乎所有大厂都争先推出自家AI大模型产品,但字节却鲜有发声。直到近日,字节旗下AI对话产品“豆包”日前才开启测试,比ChatGPT晚了近八个月。
现在,用户进入豆包官网直接注册使用或通过官网提供的二维码下载App即可使用这款产品。
据悉,“豆包”的前身正是字节内部代号为“Grace”的AI项目。在体验中可以发现,“豆包”已经可以生成歌词、小说、文案等文本内容,还可以提供数学计算、翻译、英文写作等功能。
在互联网巨头拥抱AIGC的路上,字节跳动并不是最积极的。
同为互联网大厂,百度自研的文心一言早在今年3月底就已率先落地;4月11日,阿里打造的通义千问紧随其后揭晓。而就在阿里发布通义千问的前一天,王小川直接官宣下场成立百川智能,多位搜狗团队老员工带资加入。
相比之下,同为一线大厂的字节,推出通用大模型的步调就慢了很多。
8月6日,才有媒体曝光字节旗下的AI对话类产品Grace进入测试阶段。此时距离百度发布文心一言已经过去了4个月。
在Grace之前,业内一度认为字节之所以迟迟不下场,是在“憋大招”。“彼时大家认为字节会推出针对各行业的综合解决方案,就像6月腾讯一口气抛出10大行业超过50个解决方案的路线一样。毕竟字节有资金、人才、算力和数据,这些核心能力能帮助字节打通现有的视频、直播、游戏、影视、娱乐等多个业务,也能将经验复制给参与其中的中小企业。”AI行业投资人顾峰涛称。
事实上,字节跳动确实也是朝着这个外界预想的方向前进的,今年6月字节跳动发布大模型服务平台“火山方舟”,集成了多家AI科技公司及科研院所的大模型,目标是向企业提供全方位的平台服务。
简单来说,“火山方舟”最终服务的是模型应用方。火山引擎通过与大模型的生产方合作,为开发者和企业提供模型训练、推理、评测、精调等全方位的平台服务(MaaS,即Model-as-a-Service)。
火山引擎总裁谭待表示:“在模型生产端,火山引擎已经通过优秀的算力系统和机器学习平台证明了自己,也成为众多大模型企业的首选,而在模型应用端,面对多模型生态和企业‘1+N’应用模式,我们同样需要提供更好的产品和方案,解决这里面计算、安全和成本等通用问题。”
豆包(网页版)操作界面
直到豆包问世,字节跳动的AIGC产品策略完成了由B端向C端的转变。
在与豆包对话中可以发现,“豆包”介绍自己时会说“我是字节跳动公司训练的AI豆包,可以回答各种问题,并通过生成文本来完成各种任务,例如写作故事、对话、摘要等。如果您有任何问题,请随时告诉我,我将尽力回答。”
至于豆包为什么以独立APP的形式测试,而不是将其内置到今日头条、抖音等亿级日活的APP上,顾峰涛认为“可能是字节跳动想打造出一个新的IP级产品”。
而且从此前字节系产品的发展历程来看,都与AI有着较高的适配度,如果将豆包作为一个创作工具来看,应该能帮助不少内容创作者。毕竟AI文案、AI脚本、AI绘图、甚至AI剪辑视频等等应用场景我们在今年都已经见到了,这些功能完全可以帮助内容创作者在今日头条、抖音、西瓜视频等平台上提高效率。
一位接近字节跳动的人士透露,豆包这款C端产品上线其实是为了补齐字节在大模型领域的棋盘,现在看来字节已经有了B端+C端、模型层+应用层的完整布局。
资料显示,在模型层,字节的积累主要集中在机器翻译、智能语音、视频图像和多模态四个领领域;在算力层,火山引擎在发布了自研DPU等系列云产品,并正式推出智能推荐-高速训练引擎,支持100GB至10TB以上超大模型的高效训练;在平台层,火山引擎发布了机器学习平台升级版,在数据管理、资源管理、流程和模型三大领域具备核心优势;在应用层,前面提到的火山方舟和现在的豆包能提供智能创作、智能体验以及智能营销等服务,辅助在字节的内容和娱乐体系内推动客户业务增长。
至此,字节系的AIGC“圈子”已初具雏形。
在OpenAI和宾夕法尼亚大学共同撰写的一篇研究中指出,80%的美国劳动力至少有10%的任务受到GPT迭代的影响。研究人员发现,大约19%的工人将看到至少50%的任务受到影响。他们认为GPT模型是通用技术,如发明蒸汽机或印刷机一样意义重大。
据艾瑞咨询预测,2023年中国AIGC产业规模约为143亿元,2028年产业规模预计将达到7202亿元,到2030年将突破万亿规模,达到11441亿元。
图源:艾瑞咨询
但纵观国内涉足AI大模型赛道的玩家,如果按照已落地的产品行业属性来分,主要分为“互联网派”和“AI科技派”这两大流派。此外还有以高校和科研院所为代表的“学院派”和创业团队组成的“创业派”。
所谓“互联网派”,指的是目前已经有具体产品的互联网大厂,其中以百度、阿里、腾讯、网易、京东这5家为代表,此外还有360、金山、知乎、有道、昆仑万维等。而“AI科技派”主要以华为、商汤科技、科大讯飞、出门问问、毫末智行等AI企业为主。
各巨头都倾向于自建大模型,直接导致行业一起步就直接进入了“百模大战”的局面。而各家大模型同质化太强,应用场景上高度雷同,正式进入市场后非但没有发挥各自优势,反而引发了“内斗”。
浦银国际在研报中指出,未来大模型之战或趋于分化,并从“通用”迈入“垂类”。
从行业演进的趋势来看,只有少数巨头才适合做通用大模型,因其需要具备巨大资金投入,丰富的数据资源以及相应的大模型应用场景,如百度的搜索、腾讯的社交媒体、阿里的电商业务等。
但从当下来看,大部分企业前期以内部应用为主,后续主要向B端企业拓展服务,预计少数企业将在C端市场形成规模。目前,百度文心一言、华为盘古大模型、中国科学院紫东太初大模型均在B端垂类市场积累了标杆应用案例,腾讯混元大模型、阿里通义大模型则更多聚焦公司自身业务。
展望未来,“大模型+工具平台+生态”的模式会成为一种趋势,这也符合目前阿里、字节等所走的路线。火山方舟更多是为字节体系自用,豆包作为工具平台补齐了C端用户的需求,再加上字节体系内数据、算法、算力等优势,字节的生态模型也已完备。
只是面对众多竞争者,字节跳动能否胜出还有待观察。
民生证券相关研报指出,目前表面上大模型百花齐放,不再稀缺,是因为开源基础以及大公司本身的算力储备与资金实力,单纯发布一个大模型门槛,没有市场想象那么高。但是能够拥有高质量数据场景,才能持续迭代,性能逐步逼近ChatGPT的大模型,预计最终仍是“凤毛麟角”。市场会逐步凝聚共识:得数据者得天下,数据成为大模型差异化竞争的关键。
由于宏观环境的影响,2022年互联网公司普遍开启“过冬”模式,在“节流”之外,“开源”成为互联网公司的默认选择。
从互联网大厂陆续公布的财报来看,大厂们的“打法”已经改变,科技、To B和出海已成为互联网平台经济的“新三样”,三者或单独发展或以融合的形式出现。
AI技术的兴起,让众多互联网大厂看到了解决自身危机的“良药”。2023年腾讯股东大会上,腾讯CEO马化腾回应有关ChatGPT和AI相关的提问时称,“我们最开始以为(AI)是互联网十年不遇的机会,但是越想越觉得,这是几百年不遇的、类似发明电的工业革命一样的机遇。”
图源:艾瑞咨询
的确,AIGC风潮刮起后,互联网企业如获至宝,似乎纷纷找到了新的科技演进方向。
再加上AIGC本身就可以帮助企业实现开源节流,就进一步激发了企业入局的热情。艾瑞咨询《2023年中国AIGC产业全景报告》指出,“AIGC融入既有应用降本效果明显,营收增长主要依靠服务新场景”。
至于AIGC的发展需要的数据、算力和算法三大关键要素,国内这些互联网大厂无一不有着深厚积淀。
而其中与内容和营销相关的企业则最早看到了应用场景和变现的可能性。
以字节跳动的业务为例,AIGC可以帮助公司构建更高效的内容生产线,带来海量内容供给,面向不同消费者生成不同内容,达成更好触达转化效果;自然语言交互终端+大模型原生应用,消费者可以和品牌随时随地互动,达到优化广告营销的目的;未来AIGC塑造的数字内容生产与交互新范式,还能帮助吸引、留存更多用户,实现用户规模的扩张。
不过问题在于AIGC的研发需要花费大量资金和资源,可以预见的是未来很长一段时间里竞争主角仍将以大厂为主。即便字节并不“缺钱”,但是无论是面对BAT这样的巨头,还是商汤、科大讯飞、出门问问这些AI赛道能手,字节想要快速超越都绝非易事。