11 月 13 日早上,一则对于阿里巴巴决定肯求仲裁"通义大模子前职工周畅违抗竞业合同"的音书速即在 AI 圈传播开来,而当天中午就有媒体得到阿里里面东谈主士的证据:情况属实。 早在 2020 年,周畅就驱动在阿里达摩院带领团队测验名为 M6 的多模态模子,2023 年 ChatGPT 爆火后,他地方的团队在 M6 基础上研发了"通义千问"大模子,该模子如今已成为广大通义系列 AI 居品的时期底座。可以说他即是现谢宇宙上最懂阿里大模子的东谈主,但这个东谈主现在跳槽到了字节向上,对于阿里来说这无
11 月 13 日早上,一则对于阿里巴巴决定肯求仲裁"通义大模子前职工周畅违抗竞业合同"的音书速即在 AI 圈传播开来,而当天中午就有媒体得到阿里里面东谈主士的证据:情况属实。
早在 2020 年,周畅就驱动在阿里达摩院带领团队测验名为 M6 的多模态模子,2023 年 ChatGPT 爆火后,他地方的团队在 M6 基础上研发了"通义千问"大模子,该模子如今已成为广大通义系列 AI 居品的时期底座。可以说他即是现谢宇宙上最懂阿里大模子的东谈主,但这个东谈主现在跳槽到了字节向上,对于阿里来说这无异于扫地外出。
7 月中旬,最先曝出来的音书是周畅行将辞职创业,然则 10 月底,他就仍是加入了字节向上。"辞职创业即是个幌子,即是怕被竞业,"在一家办事字节的猎头公司职责的沈曼告诉《第一财经》杂志,"但此次瞒不住了,来字节的不啻周畅一个东谈主,他手下面的团队还有十多个东谈主也随着跳槽了。"
此外,最近几个月加入字节大模子团队的要道东谈主才还包括零一万物前算法副总裁黄文灏,面壁智能原中枢成员、序智科技独创东谈主秦禹嘉。
这家中国最年青也最激进的时期公司一直以领有雄壮的招聘团队著称,HR 部门巅峰时有 5000 多名职工,其中绝大部分东谈主独一的职责即是招聘,再辅以同等范畴的外包猎头体系,共同组成了一座史无先例的抢东谈主工场。其他体量邻近的时期公司在招聘团队范畴上与它有着约一个数目级的差距,这意味着只消字节决定入场,每家竞对公司齐将濒临东谈主才流失的风险。
但字节曾是"笨拙"的。CEO 梁汝波在 2024 年事首的全员会上反想谈,公司"直到 2023 年才驱动征询 GPT,而业内作念得比较好的大模子创业公司齐是在 2018 年至 2021 年创立的"。百度 2023 年 10 月告示已在百度搜索、文库、舆图等各式掌握中全部植入了 AI 才调时,豆包 App 刚上线不久,这亦然那时字节独逐一款 AI 原生掌握。
字节提速,从抢东谈主驱动
从 2023 年年中驱动,这座工场 AI 标的的抢东谈主需求就莫得断过。"主义主淌若阿里通义团队、百度文心和飞桨团队,以及包括月之暗面、智谱在内的‘ AI 六小龙’,等等,"沈曼说,"国内有模子研发训戒的东谈主才基数较少,是以职责时时时可以径直定位到团队以致个东谈主。"字节对于基础模子研发关系东谈主才的招聘是莫得限额上限的,对于主义团队的候选东谈主在薪资上开出的数字相等可不雅,时时可以看到基于原薪资双倍的涨薪幅度。
凭据沈曼的训戒,字节各个部门起先要向招聘团队提议招东谈主需求,但公司开放给各部门招聘东谈主才级别的权限并不相易。字节职级一共分 10 级,从最低的 1-1 到最高的 5-2,数字越大,职级越高。其中 2-1(工程师)到 3-1(高等时期众人)是里面占比最大的。在业务维稳期,会有巨额 2-1 和 2-2 的招聘需求。在业务需要"开疆拓境的阶段"会放出 3-2、4-1 以及更高的需求。一般来说,唯独盈利部门 3-1 以上的需求会更多,但是在大模子研发东谈主才的招聘上,字节格外大方。《第一财经》杂志通过多方信源了解到,字节给周畅提供了一份真实无法断绝的合同:4-2 的职级和 8 位数的年包工资,按阿里的职级体系换算粗陋是连跳两级且薪资翻好几倍。与他沿路来的原团队成员,字节也齐给了 4-1、3-2(对标阿里级别 P10、P9)的职级。"你也可以把周畅这单合同看作一份豪杰帖,字节是在告诉扫数东谈主,它适意给,而且给得起。"沈曼说。
对于字节来说,抢东谈主早已是公司开辟新业务时习用的妙技。字节独创东谈主张一鸣曾屡次在公开场合提到"东谈主才密度"的看法,在他看来,只消保证东谈主才密度越过业务复杂度,那么在灵验的激勉步调下业务的成效是水到渠成的。
张一鸣本东谈主即是这套表面最至意的践行者,字节旗下当天头条、抖音等信息流居品所倚恃的中枢时期,即保举、告白、搜索算法(简称"引申搜")的研发班底其实就来自于百度。2014 年至 2015 年,张一鸣以高薪从百度网页搜索部接踵挖来了那时的副总监杨震原、主任架构师朱文佳,以及一批机器学习算法工程师。现如今,杨震原已是字节向上副总裁兼火山引擎业务负责东谈主,朱文佳则担任过当天头条 CEO 及 TikTok 居品时期负责,2023 年事首更是成立了代号为" Seed "的神秘团队,专注于大模子底层时期的研发。
其实比从外面抢东谈主更早少许发生的,是字节里面的"抢东谈主",或者按官方的说法:团队重组。
神秘和特殊是乐雁对 Seed 团队的最早印象。2023 年事首,他发现在字节机器学习平台的算力使用榜前排出现了一些新名字。依照过往训戒来看,名次靠前的齐是现时字节里面最受怜爱、得到最多资源歪斜的团队,而前几名的算力使用量时时能占那时总算力的一半。一些音书通达的共事称这个新成立的团队很可能在作念基础模子的研发,他们的职责区还有第二谈门禁。
乐雁 2020 年才行动算法工程师加入字节,但他对这家公司活泼多变的责罚作风并不生疏,从每个东谈主到每个部门,一切齐在名为遵守的指导棒下快速出动、安置、再出动、再安置。
AI Lab 在公司里面式微后,字节 AI 研究的要点更始到掌握机器学习(Applied Machine Learning,AML),也被称作机器学习中台部门,该部门一方面负责传统居品的引申搜算法研发,另一方面被条款拓展新业务,包括搭建字节的算力集群并测验大模子。其中的要道东谈主物包括原机器学习系统负责东谈主朱亦博,他 2023 年辞职后参与创办了" AI 六小龙"之一的阶跃星辰;大谈话模子研发时期众人杨红霞 2023 年事首加入字节,曾在阿里达摩院担任 M6 大模子的时期负责东谈主,也即是周畅曾经的率领,不外 2024 年 5 月她已离开字节。
在 2023 年事首成立 Seed 团队是字节在 AI 业务上的又一次调换,该团队主要班底来自搜索、AML、AI Lab 等部门中的大模子关系东谈主才。不仅如斯,乐雁称这个团队同期还在从其他部门物色东谈主才,以晋升这个新兴业务的"东谈主才密度"。
沈曼推测,如今 Seed 团队的东谈主数应该仍是越过了 150 东谈主,这还只是只是字节研发基础模子的团队。2023 年年底,字节又成立了一个名为 Flow 的团队,负责基于大模子的 AI 原生掌握的研发,豆包即是其效果之一,该团队的东谈主员增长更快,面前有近 300 东谈主。除此以外,字节每个业务部门齐被条款想考若何将大模子落地到关系业务场景里。
追念 AI 中枢
字节正在从上至下地重建它的中枢——东谈主工智能。
早在 2016 年,张一鸣就在公司内建立了 AI Lab,力邀微软亚洲研究院前常务副院长马维英、华为诺亚方舟实验室原主任李航、天然谈话处理时期众人李磊等多位科学家加入,建立了包括计较机视觉(CV)、天然谈话处理(NLP)、语音和音频处理、音乐、机器学习等多个子团队,真实笼罩那时东谈主工智能触及的扫数前沿鸿沟。同期,这个实验室在北京、上海、深圳、新加坡、好意思国、欧洲等地齐设有办公室。马维英被委任为 AI Lab 负责东谈主,径直向张一鸣申诉。

AI Lab 的建立高傲了张一鸣在新时期时期的洪志。彼时的字节还不是"大厂",它创立仅 4 年,唯独当天头条一个爆款掌握,无论公司阅历照旧业务体量齐无法与阿里巴巴、百度、腾讯等巨头比拟。那段时期,百度和腾讯已先后大手笔成立了我方的东谈主工智能实验室,在寰球继承东谈主才,其中百度还招募到了微软前寰球引申副总裁陆奇加入。字节是那一轮 AI Lab 建立波涛中鲜见的初创公司,而且它作出这一决定的时辰比阿里巴巴早,后者直到 2017 年 5 月才告示成立达摩 院。
字节自后的发展数十倍、百倍地呈文了这一时期的时期投 入。
AI Lab 成立的归并年 9 月,抖音出身。那时,2011 年就成立的快手通过"农村包围城市"策略已收货巨额三四线城市用户,行动刚出身的同类掌握,抖音试图从一二线城市毒害,将"音乐""年青""潮水"确立为主打作风,而援救这些作风所需要的功能——变脸、换装、好意思颜以致尬舞,齐依赖于东谈主工智能时期。以"尬舞"为例,它使用字节 AI Lab 的"东谈主体要道点检测"时期,可以让用户在镜头前舞蹈时了解我方的姿态是否和主义姿态准确匹配。2017 年,抖音上线了基于该时期的"尬舞机"功能,App 版块更新后的第二天,抖音就冲到了掌握商店免费榜的第别称。
东谈主工智能时期不啻加握了抖音,也使字节驱动成为真实的 App 工场、寰球化公司。2018 年,张一鸣在已往举办的首届数字中国建立峰会上发表题为《时期出海,建立寰球创作与交流平台》的主题演讲时暗意,"东谈主工智能时期是字节向上在寰球市集取得上风地位的要道"。无论是综联合讯类的居品 TopBuzz、News Republic,照旧短视频类的居品 TikTok、musical.ly、Vigo Video、BuzzVideo,这些居品天然有着不同名字,内核齐是归并套东谈主工智能时期决策——保举算法,张一鸣称它为寰球用户提供了一致的居品体验。
然则当抖音、TikTok 等中枢掌握取得具有十足上风的市齐集位、驱动步入"流量若何交易化"的阶段,AI Lab 在字节的位置松动了。目的性迹象是 AI Lab 负责东谈主马维英的申诉对象从张一鸣变为那时的抖音负责东谈主张楠,这意味着 AI Lab 不再是个集团级的前瞻性名堂,变成了办事于抖音这一掌握的时期团队。
马维英于 2020 年年中告示离开字节向上,追念学界加入清华大学智能产业研究院。同在该实验室担任总监的李磊和王长虎也于次年下野,其中李磊像马维英一样重返了学界,王长虎则于 2023 年参加视频生成模子鸿沟的创业。
随着中枢团队成员的离开,字节 AI Lab 体系驱动被进一步弱化和拆分。按照乐雁的说,他 2020 年加入 AI Lab 时这个部门照旧字节向上 AI 研究的中枢部门,团队范畴上百东谈主。但次年,AI Lab 重组,各个组被拆分到不同的业务线,比如图像视觉的一部分东谈主就被鉴识到交易化团队下,为公司一些业务提供时期中台援救,如抖音的手势、肢体识别等 AI 功能。此次重组后,扫数这个词 AI Lab 只剩下不到 50 东谈主,主要作念一些偏学术标的的研究,比如机器东谈主等,原先的视觉模子、天然谈话处理等标的齐已不存 在。
张一鸣很早就意志到了 AI 在内容分发上的巨大后劲,不外他可能没特地志到 AI 在内容出产上的后劲更大,大到可能颠覆其基于内容分发时期构建的居品方法和竞争上风。面前,业内已有不少创业名堂齐在基于生成式 AI 构建新一代内容社区,其中既包括可能取代小红书的翰墨、图文社区,也包括可能颠覆抖音、TikTok 的短视频社区。如果字节不行提供相似或更好水平的内容出产时期,用户很可能会更始至其他平台。毕竟社区的内容起先是为创作家提供创作器用,其次才是抒发渠谈,Instagram、小红书、抖音的崛起,一再说明了这少许。
公开贵寓高傲,早在 2017 年马维英就公开抒发过:"在内容分发上 AI 算法仍是作念得很好了,但许多信息的需求不是靠搜索 3 个网页就可以自傲 …… 咱们但愿 AI 大要在创作端开释出东谈主更多的创意。" AI Lab 总监李航曾经在 2022 年发表论文征询基于 Transformer 的"序列到序列模子",Transformer 恰是自后令 GPT 系列模子大火的新 AI 架构。李航在那篇论文中提到了 Google 的 BERT,还提到了 OpenAI 的 GPT。已往 11 月的临了一天,OpenAI 发布了基于 Transformer 的 ChatGPT。到了 2024 年事首,字节 CEO 梁汝波在全员会上反想公司对大模子反映"笨拙""直到 2023 年才驱动征询 GPT "。
2023 年贫瘠成立的 Seed 团队,某种进程上承担了 AI Lab 最初成速即被赋予的扮装:长入和收拢脚下最前沿的东谈主工智能时期,让字节向上不要掉队,以致能引颈行业。
补课、烧钱与豪阔式抨击
字节向上自 2023 年以来的状态与其说在试图重现"鼎力出古迹"的神奇功效,不如说是一种记念被落下的补课。
不仅在东谈主才端抢东谈主,掌握端也在抢用户。据《第一财经》杂志统计,字节面前还在泛泛运营的 AI 掌握有粗陋 20 款,其中绝大部分是在 2024 年以后发布的。而在模子层,2023 年只负责发布了谈话模子的字节,在 2024 年接踵补全了图像、语音、音乐、视频、3D 等不同模态的生成式 AI 模子。在这一轮生成式 AI 波涛中起步最晚的字节,仍是成为面前领有最全生成式 AI 模子、最多 AI 掌握的时期公司。

字节再一次祭出了看家本事:里面跑马,外部"小步快跑、敏捷迭代",以及烧钱。
乐雁对《第一财经》杂志说,现在 Seed 和 Flow 是字节明面上的生成式模子与掌握部门,但当公司高层齐将眼神投向这个鸿沟时,每个有 AI 研发才调的团队齐在尝试研发出更好的模子或居品,争夺更多的资源与升职的契机。"就比如 Seed 最近同期发了两款视频模子(SeaWeed 和 PixelDance),这两个模子其实是不同小组作念出来的,临了齐放出来说明这两个模子照实在才调上各有千秋,"他说,"如果其中某个团队的模子哪怕稍弱少许,那根柢就不会被外面看到,字节一直齐是这种跑马模式。"
面对外部,字节则接纳了一贯的"豪阔式抨击"。以 Coze 为例,它对应的是 AI 智能体最热点的掌握场景之一,它允许用户我方创建定制化的聊天机器东谈主,而况这个机器东谈主能将各式功能节点(如插件、模子、代码)按照一定的规矩和逻辑关系衔接起来,创建出复杂的业务经由,以已毕特定的任务或功能。
口语 Agent 垄断东谈主古德白本年事首就一直在尝试基于 AI 职责流作念营销器用,他告诉《第一财经》杂志,Coze 真实每天齐在更新版块,这需要巨额资源参加和团队配置,字节雇用了巨脱落包公司完成临了的居品测试,"创业公司很难应付这样的豪阔式抨击。"古德白说。而且 Coze 推出时径直接纳"模子免费使用"策略,导致国内最早落地 AI 职责流功能的另一个平台 FastGPT 速即千里寂,Coze 则自后居上。
字节亦然本年年中国内大模子价钱战的发起者。2024 年 5 月,火山引擎 FORCE 原能源大会上,字节向上在负责发布豆包大模子的同期向模子的 B 端价钱挥起屠刀,豆包通用模子 pro-32k 版的推理输入价钱仅为 0.0008 元 / 千 tokens,比行业均价低 99.3%。这意味着客户花一元钱就能让豆包模子处理 200 万个汉字,荒谬于 3 本《三国演义》——那时花一样的钱只可向 GPT-4 输入不到 4000 字,以致不够一篇短篇演义。面对字节发起的价钱战,竞争敌手不得不快速跟进。阿里云将其通义千问主力模子的价钱下调 97%;百度以致径直告示文心两款轻量级模子免 费。
面向 C 端用户的 AI 掌握上,字节烧起钱来更是绝不手软,费钱投流买量成为它已毕居品冷启动最径爽气速的表情。据告白谍报分析平台 AppGrowing 统计,豆包智能助手 4 月、5 月的投放金额接近 1800 万元,比及 6 月上旬,投放金额飙升至 1.24 亿 元。

与此同期,字节还适度了豆包的竞对居品在抖音平台的告白投放。其中受影响最大的即是智能助手 Kimi,这个由" AI 六小龙"之一月之暗面推出的居品,在豆包下场前曾经依靠在抖音、哔哩哔哩等平台的投放快速起量,但一位" AI 六小龙"的职工说,豆包不仅复制了这个成效旅途,还依靠其母公司字节向上的力量,适度了包括 Kimi 在内的敌手在抖音内的告白推送。
隔断即是,本年 3 月,Kimi 依靠酬酢平台的告白投放越过百度旗下的同类居品"文小言"(原文心一言),成为月活最高的原生生成式 AI 掌握。4 个月后,Kimi 被豆包超越。一个月内,豆包的月活用户数目从 904 万蓦地高潮至 5127 万,把告白投放没那么激进的 Kimi 和文小言远远甩在背面。" AI 居品榜"的数据高傲,10 月豆包的名次以近 7000 万月活用户在中国 AI 居品中断崖式率先,同为智能助手的 Kimi 与文小言分别唯独约 3900 万和 3400 万月活。
用费钱的表情买用户的资本面前还不算高。一位熟谙 Kimi 投放策略的东谈主士对《第一财经》杂志说:"面前 Kimi、豆包的用户留存率还很健康,单个用户获取资本唯独十几元,这是荒谬合算的数字,锻真金不怕火阶段互联网居品的用户获取资本齐在好几百 元。"
但这些用户有莫得诚意度即是另外一趟事了。以视频生成鸿沟为例,本年 7 月,Luma AI 发布的最新模子 Dream Machine 4 天内获取了 1000 多万用户,这些东谈主最早是 Runway 的用户,自后 Pika 发布时曾经涌入 Pika。而且,告白投流能带来的边缘效益也在减少。详细 Similarweb 发布的投流数据和 App Growing 发布的用户数据,不久前阶跃星辰的智能助手跃问也在猖獗投放,花了近 7000 万元,但适度本年 10 月只转动来不到 2 万个新用户。
与字节的激进酿成对比的是国内其他大厂和初创公司们的严慎。
除了字节,其他中国时期公司对生成式 AI 的关注齐在消退——以积极的视角看,这个鸿沟正在变得感性。最早押注 AI 的李彦宏在刚刚召开的第三季度总监会上暗意,"百度不碰 Sora 类的视频生成",而况在文小言的引申上弃取"镇静"而非"激进";阿里不再执着于斥地 all in one 的 AI 超等掌握,而是将更多元气心灵放在 AI 云办事上;短视频巨头快手于今莫得推出过谈话模子掌握,而是聚合在视频模子的斥地与掌握上。多位东谈主士向《第一财经》杂志证实,随着国内模子在才调上贴近 GPT-4,以及 GPT-5 的一再蔓延,多家公司尤其资源有限的初创公司对于参加测验下一代基础模子(通称"预测验")变得严慎。以致有投资东谈主称暂停"预测验"的 AI 六小龙不啻两家。
一位业内东谈主士告诉《第一财经》杂志,独角兽们弃取暂缓预测验下一代大谈话模子的原因之一,是即便预测验一个比现存模子好 1 代以致 1.5 代、超越 GPT-4 的模子,其推理才调仍然够不上让末端掌握从随同鸿沟进入出产力鸿沟的居品需求。GPT-4o 面前在出产力鸿沟的掌握景况仍是说明了这少许。凭据阶跃星辰独创东谈主姜大昕在阿里云栖大会上提到的数据,GPT-4 达到万亿级参数后,再去晋升参数目,边缘收益是着落的。
字节却莫得延缓的迹象。沈曼对《第一财经》杂志高傲,预测验东谈主才是字节面前最急要的东谈主才类型。最近字节成立了一个叫"大模子研究院"的机构,从名字看,它可能承担比基于现存算法测验模子更为前沿的任务。最初的市集传言称,从阿里云挖来周畅即是让他负责这个团队。不外也有音书称,为消散竞业合同,周畅被派去了新加坡赴任,职责标的是具身智能,研究机器东谈主在物理宇宙中摆脱行径需要的"宇宙模子"(world model)。AI Lab 在字节式微,其仍然被张一鸣敬重并重点参加的临了一个研究标的即是机器东谈主,这些机器东谈主被合计可以办事于字节的电商践约需求。
豆包面前还莫得盈利,据 Acecamp 上一份众人访谈纪要,字节向上对于大模子的财务政策是"推理层不亏",即模子测验阶段所需要的研发参加、芯片算力参加、东谈主员资本方面可以承受策略性损失,而模子参加掌握后每次调用的资本需要裁减。豆包面前对于 B 端用户按照 API 调用收费,平均每 1 亿个 tokens 调用收费约为 80 元至 200 元,豆包能从这种调用中获取 8%-10% 的毛利。尚未向 C 端用户收费。访谈纪要称,从 2023 年至 2024 年,字节向上通过"模子蒸馏",将模子尺寸从 300B 降到了 80B 傍边,大幅裁减了算力支拨。
面前,豆包还莫得向 C 端用户收费,一大原因仍然是居品不够,一朝驱动登科度户就可能流失。纪要提供的数据称,每个豆包用户每天神用该掌握的平均时长唯独 10 到 11 分钟,而且这个时长是屡次使用后的积聚数字,如果平摊到每次使用时长,数字就会裁减为 2 分钟,即用户每次绽开豆包基本只会进行 3 到 4 轮对话就会结尾。"如果 2 分钟内未能自傲需求,他们可能会切换到其他掌握,而不一定是其他 AI 器用。举例,用户可能会绽开微信、小红书等掌握。"纪要中称。
豆包仍是是面前国内用户量最大的原生 AI 了。然则字节对此有个更激进的主义,即本年年底已毕 1 亿月活。
日后看,字节的豪阔式参加中一定有不少比例是销耗的,但脚下的实验景况是,它不得不为新时期时期的到来作念足准备。行动字节一直以来——从酬酢媒体到元天地——的策略对标对象,Meta 也在以上百亿好意思元的范畴参加 AI,MetaCEO 扎克伯克在最近一次与英伟达 CEO 黄仁勋的对谈中诠释为什么这样作念时说:"今天你在 Instagram 上看到的大部天职容是凭据你的敬爱匹配给你的 …… 在异日,我合计这些内容会由创作家使用 AI 器用创造,或者由 AI 详细生 成。"
字节的财务景况在广大大厂中还算可以。据科技媒体 The Information 报谈,2024 年上半年字节向上的营收约为 730 亿好意思元(约合 5280 亿元东谈主民币),这一数字仍是远远越过腾讯同期 3206 亿元的营收,接近 Meta。而字节面前的估值唯独 Meta 的 1/5。若有资金需要,它还比其他公司齐多一个可不雅的融资渠谈:上市。不外它的造血业务——告白和电商的增速已在快速放缓。本年前三季度,字节中国区单季度告白同比增速从 40% 傍边跌至 17% 以内,已有两个季度未能达成既定主义。与此同期,抖音电商的销售额增速也已从岁首的越过 60% 跌至 9 月的不到 20%。锻真金不怕火业务的增速一朝变成个位数,字节大要援救新业务的现款流就会受限。
不外对一个试图进行枢纽转型的公司来说体育游戏app平台,上市并不是个好弃取——上市之前转型成效的公司多见,上市后成效的则未几。对字节而言,造血才调决定一切。