作为国内公认的最具创造力的科技公司,字节跳动在AI领域的布局初看似乎略显迟缓。然而,一旦确定方向,其行进步伐之激进无出其右。
在当前大模型竞争的赛道上,日均处理5000亿tokens的使用量是一个极为显著的标志,它意味着该大模型已跻身行业前列。在自然语言处理领域,tokens作为文本的最小单位,无论是单词、标点还是子词单元,5000亿tokens/天的处理量都意味着模型每天需处理的数据量极为庞大,相当于数百万篇长文或数千万至数亿条社交媒体帖子的日均处理量。
近期,中国大模型创业公司MiniMax宣布单日处理量超3万亿tokens,此消息一出,行业震动。但随着大模型竞赛进入下半场,tokens处理量已不再是衡量大模型价值的唯一标准,行业竞争的焦点已转向应用落地。
字节跳动,这个素有“卷王”之称的企业,尽管涉足大模型领域不足两年,却已在行业内崭露头角。11月的AI大模型月活跃排行榜上,豆包App以5998万MAU紧随OpenAI的ChatGPT之后,位列全球第二,国内第一。其海外版Cici也以1267万MAU排在第22位。从2月仅173万的月活跃用户量,到如今的显著增长,豆包大模型已成为国内头部大模型中备受瞩目且商业化前景广阔的重量级选手。受此影响,豆包大模型概念股在二级市场上备受投资者追捧,短短一个月内便在AI赛道中脱颖而出,成为领涨板。
从上半场的低调蓄力,到下半场的全力出击,字节跳动所构建的大模型帝国正在持续扩张。那么,作为大模型战场的“后来者”,字节跳动是如何实现这一逆袭的呢?
从“迟到者”到“破局者”的转变始于2023年8月18日,字节跳动旗下AI对话产品Grace更名为“豆包”。在百模大战的密集发布中,这条看似不起眼的消息悄然开启了字节大模型的新篇章。
相较于其他大厂,字节跳动在大模型领域的反应确实稍显迟缓。字节跳动CEO梁汝波在2024年年度全员会上也反思了这一点,表示公司直至2023年才开始深入探讨GPT,而业内优秀的大模型创业公司多在2018年至2021年便已创立。
回顾历史,百度早在2019年就依托其“人工智能研究中心”的技术沉淀,率先在国内推出文心大模型,成为大模型领域的关键里程碑。随后,阿里巴巴的“达摩院”与腾讯的“腾讯研究院”相继成立,加速了自研大模型的进程。2021年,阿里发布了全球首个10万亿参数的多模态大模型;同期,腾讯也连续推出多个千亿至万亿参数级别的大模型。
当国产大模型在2023年呈爆发之势时,字节跳动才姗姗来迟。然而,这并不意味着字节跳动轻视AI技术。早在2012年,字节就自研了第一版推荐引擎,并在2016年成立了AI Lab。但随着AI Lab核心人员的相继离职,字节在AI领域的探索逐渐放缓。直到ChatGPT的横空出世,字节才意识到自身在大语言模型领域的发展滞后,并促使梁汝波在2024年初的全员会上进行深刻反思。
为了赶上这场AI技术革命,字节跳动迅速调整战略布局,采取了一系列措施:大规模招募AI人才、成立专门的AI部门Flow、整合内部资源、实施赛马机制等,以加速豆包大模型的研发进程。
今年3月,豆包的下载量和月活跃用户开始双双攀升。至11月,这种势头仍在延续。虽然ChatGPT以超3亿月活遥遥领先,但豆包的崛起速度远超其竞争对手。国内的Kimi、文小言、通义千问在用户规模上均被豆包超越,豆包的月活用户量甚至超过了这三者之和。
从C端的豆包App用户到B端的千行百业,豆包大模型不仅使用量大,应用场景也极为丰富。据火山引擎总裁谭待介绍,目前豆包大模型日均处理文本1200亿tokens,生成3000万张图片。
仅用了一年多时间,字节跳动就取得了令所有AI应用创业者羡慕的成绩,完成了从“迟到者”到“破局者”的快速蜕变。
其增长密码在于:在C端卷用户、在B端卷价格、与竞争对手卷算力。字节跳动对豆包采取了“饱和式”攻击,在各个领域都上演了“后来者居上”的戏码。
据统计,今年以来,字节跳动在C端对豆包的投流费用已超10亿元。这种高强度的市场投放让豆包在社交媒体、搜索引擎和短视频平台上迅速占领用户视觉入口,形成了强烈的品牌记忆点。
在B端市场,豆包则打响了一场极具杀伤力的“价格战”。在今年5月的火山引擎FORCE原动力大会上,豆包Pro32k模型的正式定价为1千Tokens0.8厘,比行业价格降低99.3%;豆包Pro128k模型的正式定价为1千Tokens5厘钱,较行业价格降低了95.8%。更形象地说,根据火山引擎公布的价格计算,一元钱就能买到豆包主力模型的125万Tokens,大约是200万个汉字,相当于三本《三国演义》的篇幅。
字节跳动没有像其他公司那样在发布大模型时公布各种测评和榜单,而是走实用主义路线,希望用一个打破行业地板的价格赢得用户、尤其是企业用户的认可。
此外,大模型之争也是算力之争、人才之争。在这一背景下,字节跳动还得益于稳定且持久的资源注入。在资金上,字节跳动在AI上的投入巨大,仅2024年的资本开支就达到800亿元,接近百度、阿里、腾讯三家的总和。据了解,2025年字节跳动的资本开支将进一步达到1600亿元,旨在打造自主可控的大规模数据中心集群,其中约900亿元将用于AI算力的采购,700亿元用于IDC基建以及网络设备。
在AI人才储备上,公司创始人张一鸣亲自挂帅,从阿里巴巴集团以及零一万物、智谱等竞争对手公司大力招揽AI人才,并在内部多次强调追求“通用人工智能”的目标。
正因如此,字节跳动才能在这场AI应用的激烈混战中突出重围,凭借豆包大模型的稳定性、可靠性以及强大的应用开发能力,逐渐构筑起自身独有的竞争优势,在AI领域崭露头角。
然而,豆包大模型只是字节跳动大模型应用的一个侧面。随着大模型的逐渐成熟,抖音、火山引擎、巨量引擎等业务部门也都开始加入AI探索。
截至目前,字节跳动已经推出了豆包大模型家族、火山方舟以及一系列前沿的AI应用与云基础设施产品。豆包大模型家族已扩展至9大产品线,涵盖通用、角色扮演、语音合成、声音复刻、文生图、语音识别、向量化及Function call等多种模型,全方位满足用户与企业的多样化需求。
火山方舟的应用场景聚焦于B端,包括智能外呼、数字人、数据助理等,可以降低企业使用大模型的成本和技术门槛。目前已经与汽车、手机、金融、食品饮料等领域的龙头企业展开了密切合作,如吉利汽车、长城汽车、OPPO、vivo、小米、华硕、招商银行、海底捞等。
在豆包大模型的赋能下,还诞生了AI智能体开发平台扣子(中国版)和Coze(海外版)、图片生成产品星绘、类似Character.AI的角色对话产品猫箱(原叫话炉)和小黄蕉、AI教育产品豆包爱学(原河马爱学)、出海搜题产品Gauthmath等多款AI软件和互联网应用。
从大模型产品、基础AI开发到AI社交,再到AIGC创作,字节跳动已构建起一个全面的AI产品生态体系。
在移动互联网时代,字节跳动就有“App工厂”之称,相继打造了今日头条和抖音两个爆款产品,成为最赚钱的中国互联网公司之一。在大模型时代,字节跳动无疑希望再造一个新的增长奇迹——名为“AI工厂”,从中寻找第三个超级应用的可能性。
除了AI软件,字节跳动同样不愿放弃将大模型与硬件相结合。在万物互联的趋势下,硬件是软件落地的载体,也是用户流量通向生态的通道。今年5月的火山引擎FORCE原动力大会上,字节跳动对外展示了3款由外部合作方开发的AI硬件产品:机器狗、学习机和学习机器人。
中秋期间,字节跳动又推出了AI陪伴玩偶显眼包,作为火山引擎的特别礼品分发给客户。与普通玩偶不同的是,显眼包搭载了FoloToy的大模型AI机芯Magicbox(魔匣),可以呈现豆包大模型和扣子的能力。用户只需通过简单的指令就可以与显眼包进行互动。
尽管字节跳动不愿承认显眼包是一款正式的产品,但将AI装进玩具里的这一次尝试无疑是一次新的头脑风暴。
值得注意的是,在硬件方面的探索对于字节跳动来说已是驾轻就熟。从2018年收购锤子科技坚果手机团队和部分专利使用权,并发布坚果手机、TNT显示器以及音箱等周边产品,到2020年聚焦教育硬件赛道、启动“大力教育”品牌并发布智能学习灯、教育平板、词典笔等多款产品,再到2021年收购国内VR出货量第一的厂商PICO,字节跳动在硬件领域的布局从未停止。
然而,强敌环伺的硬件市场以及“双减”政策的影响,使得字节跳动在硬件领域的探索并未取得显著成效。目前,大力教育官网仅剩智能学习灯一款产品;PICO去年多次裁员,如今仅保留少部分硬件团队。