管理我想要、想要、想要的人工智能的难题。文丨陈嘉慧关艺文何陈明陈满池编辑丨陈满池林俊阳递交辞呈,引发一系列后续。阿里巴巴多位高管连夜召开紧急会谈。第二天(3月4日),Kwen召开了全体员工会议。昨天(3月5日)上午,吴永明先生向全体员工发邮件通知,林俊阳先生的辞职已获批准。昨天下午,林俊彦回到阿里巴巴北京办公室,与几位团队成员进行了一对一的交流。 《晚点晚报》独家获悉,3月4日凌晨,阿里巴巴管理层主要讨论了两件事,林俊彦的离职会给公司带来什么影响?他们一致认为,这种行为是不可接受的,公司组织需要维护该系统。据了解,林先生递交辞呈时,阿里巴巴并没有不回应他的辞职请求。 “他无法访问该系统,并且反对公司的系统,”阿里巴巴一位官员表示。这里所说的“制度”是指阿里巴巴的每个人都是员工,升迁由公司决定。如果你有投诉,你可以正常沟通,但如果没有沟通,你就无法在社交媒体上公开发言,也无法开创先例。林俊阳在阿里巴巴工作了七年,这是他的第一份工作。林俊博突然出人意料的离职背后,是所有深度参与AI竞赛的大公司都将面临的管理问题。一方面,推动人工智能发展的是开拓精神、超个性和最高效率,另一方面是大企业的总体目标和对业务协作的重视。当时,阿里巴巴内部两方关系紧张。林俊阳提交申请后48小时辞职,这让阿里和他自己都感到惊讶。 “我已经没有脸去引导大家了。”3月3日下午,林俊彦在拥有100余名Qwen会员的钉钉群中发文。不到24小时,Qwen团长林俊阳和何老师继续着“双关酱布道者”的日常活动。他们加班加点地发布Qwen的新车型和技术报告,一早就在社交媒体上宣传新推出的Qwen 3.5小车型系列,并播放马斯克先生的相关新闻。评论。 3月3日下午的一次沟通,改变了林俊彦的轨迹。突然强烈的分手欲望可能会让你感到惊讶。当天下午,阿里云首席技术官(CTO)周敬仁和林俊阳召开线上会议,向Quen通报了调整的可能性。阿里巴巴传统上每年3月底进行年度业绩回顾和结构调整河这种沟通可能为一个月后的改变铺平道路。当时提到的调整方向是将Qwen团队从涵盖各种训练流程和方式的垂直整合体系拆分为训练前、训练后、文字、图像、音频等横向团队。“下午开会的时候,林俊彦已经很兴奋了。”一位负责人透露。那天下午还发生了另外一件事。 3月3日,是余博文作为Qwen培训后总监工作的最后一天。在人力资源部召集的团队培训后“欢送会”上,团队首先了解到2026年1月加入阿里巴巴的周浩先生在Qwen培训后正在参与会员管理。周浩此前曾担任 DeepMind 的高级研究员,领导了 Gemini 3.0 的多步强化学习。据了解,林俊阳并不知道周浩这周加入公司。周浩向阿里云CTO汇报d 统一实验室主任周敬仁。据阿里巴巴官方透露,周浩在加入公司之前之所以没有与Quen的团队同步,是因为外国人才的引进是敏感且高度机密的。当天下午,周静和林俊阳交流完后,林俊阳就给Qwen钉钉群发了一条消息,称“我已经没有脸带领大家了”,并表示自己只能离开。目前,整个事件仍在阿里巴巴内部进行。 3月4日凌晨,林俊彦的社交媒体更新,他直接向外界表达了离开的意向。 13 小时后,3 月 4 日下午 1:00阿里巴巴召开了Qwen团队全体大会。阿里巴巴首席执行官吴永明、CPO姜芳和阿里云首席技术官(CTO)周敬仁出席了会议。杭州队参加线下会议,北京队和上海队参加视频会议。 “这个米阿里巴巴CEO吴永明表示:“原定全体成员参加的会议,后来提前了一些。”股东大会持续了大约一个半小时。会议开始时,吴永明重申了集团对人工智能的全面战略支持,大部分时间都留给了团队提问和回答问题。Qwen团队成员关心的主要问题是: – 林俊退休后是否还有调整的空间?在几位Quen成员表达了对林俊阳的重视后,蒋凡回应道,个人不能通过牺牲甚至非理性来神化和保留。然后他问团队:那么你们希望付出什么代价来留住俊阳?没有人回答这个问题。–团队会做出调整吗?周浩先生为什么不提前告诉大家他会参加?周敬仁回答说周浩不会代替某人加入。自从当时e战队正在忙着Qwen 3.5的训练,周浩并没有提前通知大家他的加入,所以暂时没有联系。 – Qwen 对于团队资源不足的问题,吴永明表示,他是中国寻求算力最积极的CEO,有些问题可能没有及时向他汇报。团队还反映,Qwen 3 编码能力不足与缺乏训练环境和其他需要CPU资源和基础设施人员支持的资源有关。周敬仁重点关注资源问题和难题。他表示,基础设施支撑不足有“历史原因”。在股东大会上,吴永明还承诺每六个月或一个月与Qwen团队或Qwen核心人员举行一次会议,这一点很及时。解决需求或问题。蒋芳表示,任何人都可以在钉钉上直接给吴永明、蒋芳、周敬仁发私信反馈意见。下午 2 点.米当天,林俊彦在朋友圈发文:“Qwen兄弟,继续按原计划工作,没问题。”市政厅第二天,3月5日上午,吴永民给Qw全体员工发了一封邮件,通知他们自己已经接受林俊阳的辞职。该电子邮件还指出,阿里巴巴将继续坚持其开源模式战略。周敬仁将继续领导同义词实验室。吴永明、周敬仁和阿里巴巴集团CTO吴泽明(范宇)将共同协调集团资源,支持基础模型建设。林俊博的辞职引发外界一系列反应。谷歌 DeepMind 开发者体验主管鼓励 Qwen 成员在社交媒体上加入我们,“如果你想找到一个新家来构建伟大的模型并为开源社区做出贡献。” Omar Sanseviero 此前曾在 Hugging Face 工作,目前担任 Google DeepMind 开发者体验总监。当林俊阳宣布辞职后,其他公司的一些顶级招聘人员彻夜不眠,一一向他们认识的 Qwen 团队成员发送工作机会。有猎头想联系林俊彦,列出哪些公司有适合他的职位。许多投资者向 Qwen 的高级员工索取联系信息。他们相信会有更多的人退休,有人能够创业。随着公司开始实现更广泛的组织目标,自 2023 年以来,小型 chiAI 已成为阿里巴巴的战略重点。新任舵手吴永明于同年11月出席其作为CEO的首次财务会议,并40次提及人工智能。过去,阿里巴巴集团内部有多个团队在尝试人工智能。比如,桃田曾经有20个AI团队。 2022年底至2023年初,达摩院大部分团队将重组为Dogi Lab,多个AI单元也将被整合。 Janhis的典型环境,Qwen是一个小a以及相对独立的团队。它诞生于这次AI热潮之前达摩院智能计算研究院的M6项目。当时,周景仁担任智能计算研究所所长,而2019年加入阿里巴巴的林俊香,最先做的是2021年3月发布的M6大模型。到2023年初,多吉研究所的M6和NLP团队已经建立了以前赛马的大型模型,并且都拥有500到1000个GPU计算资源。起初。年中,Dogi Lab主要从M6团队聚集了IT人才和资源。这次变动之前Qwen的核心成员林俊阳、刘大一恒、于博文、惠斌源等人此时组成了团队。其中,刘大一恒、余博文、惠斌原本属于NLP团队。作为同益实验室的总经理,周敬仁给了Qwen团队一个相对独立的空间。很多在Qwen工作过的人都表示:“谢谢景仁给予我的帮助。”同时,吴永明和周敬仁都支持Qen团队的开源理念,这是一个必须得到高层认可的重要战略决策。Qwen目前有100多名成员,整个Byte Model研发团队有600多人。相对独立的另一个方面是,阿里云和阿里巴巴集团整体的AI设计并不是完全基于这在内部团队中产生了一定程度的挫败感,“计算能力如此宝贵,为什么我们要大量对外提供?”字节跳动在 2024 年年中明确决定不再投资任何大型模型初创公司,而是将资源集中在一个初始团队上,以支持 Byte 自己的 Pouf 和其他 AI 产品。 “高强度志愿工作条件。”2024年起,阿里的Qwen系列大型车型全球影响力持续提升。如今,其变体数量已达 80,000 个,甚至超过了其前身 Meta Llama 系列。很多知名公司,比如Cursor,都是基于Qwen系列模型做调优和后期训练的。 Qwen的开源多模系列也是很多中国嵌入式智能公司选择的基础型号。 DeepSeek 和字节跳动还计划在一些研究项目中使用更小的 Qwen 模型。周敬仁于2025年成为阿里合伙人,进入阿里最高集体决策机构。林俊阳于2025年成为阿里最年轻的P10高管。阿里巴巴管理层认为,同益实验室为确保Qwen模式的领先地位付出了努力,但“这并不容易”。然而,也正是在2025年,影响力更大的Qwen开始有了更多的期待,小团队最初的目标开始与阿里巴巴集团整体的AI战略出现背离。阿里巴巴集团选择看好2025年下半年AI云的业务增长和AI超级应用空间的激烈竞争。从2024年到2025年,阿里云的收入增速将会增加。我会继续,但与基础模型的协同作用并不直接。增长主要得益于从阿里巴巴投资的几家大型模型公司获得算力,以及更多行业使用人工智能应用驱动的云服务。 2025年9月,阿里巴巴集团决定重点推广钱文应用。这需要基础模型和应用程序团队之间的密切协作。我们发现Qwen团队并没有太重视对Qwen应用的支持。而负责钱文应用的智能信息事业群也有自己的模型研究团队。一些阿里巴巴官员认为Qwen团队没有为其他云业务或Qwen应用程序提供足够的支持p。 Qwen 希望继续训练更强大、更高效的模型。为了满足原生混合多模态的技术趋势,Qwen 扩展到全语言的更多模式,并先后推出了 Qwen-image 和 Qwen-audio。这与统一万象(主要致力于多模态生成)和百灵(主要致力于音频建模)重叠,两者都属于统一实验室。 Qwen 自 2025 年中期以来也开始招聘基础设施人才。有Qwen团队成员表示,当Qwen在训练大规模版本的下一代核心模型时,阿里云PAI团队发现很难提供足够的基础设施支持。这让为阿里云创收的PAI团队陷入了尴尬的境地。如果你不在内部运营中利用它,就很难在竞争激烈的市场中展示你的实力。同期,Qwen 3和Qwen 3.5系列的训练流程从2025至今遇到了挫折,一些基本熟练度指标并不显着。 Qwen每一代最大的旗舰吧。约翰,Qwen 3.5 Max原本计划在假期前发布。除夕夜开售的Qwen 3.5 Plus车型,也被阿里巴巴高管认为是“半空调产品”。小团队的独特性和对技术领先的追求、集团对更多战略成果的期待、竞争日趋激烈的外部环境、模式训练的重叠一波三折、意想不到的人员冲击正在掀起风暴。林俊彦:“不落俗套”的大型模特团队负责人。在中国几家大公司的基础模型团队的领导者中,林俊阳占有特殊的地位。他没有接受过典型意义上的“科学”训练。他的学士学位是文科,硕士学位是技术性和跨学科的线性场。林俊彦的硕士导师、北京大学外国语学院副教授昂山素季曾这样评价他:“人文社科的学生也能从事跨学科研究,而且能出类拔萃。”林俊彦出生于1993年,大学期间在国际关系学院学习英语文学,同时学习日语、俄语、德语、法语。他的同学称他为“多语言学者”。大学期间,我担任全国模拟联合国会议的主任。当年接受校园媒体采访时,他表示,俱乐部领导的核心是,无论会员负责什么工作,“理念是最重要的”。他们还强调了活动场地的紧凑设计,认为这将有助于模拟联合国团队之间的沟通,提高协作效率,减少精力浪费。毕业后大学毕业后,林俊彦考入北京大学外国语学院,师从北京大学计算语言学研究所副教授昂山素季、孙旭,攻读计算语言学硕士学位。研究生期间共发表第一作者或共同作者论文11篇,并担任研究项目负责人。计算语言学使用可计算语言、语言结构建模和语言使用的方法。研究人员需要了解语言本身,以及算法、数据,还需要掌握建模能力。在大规模语言模型时代,该方向已成为研究人才的重要来源之一。 2025年初,我们分析了数十位DeepSeek研究人员的简历,发现其中八人来自北京大学计算语言学研究所。获得硕士学位后2019年获得博士学位后,林俊阳加入了为期两年的阿里巴巴达摩院,担任算法高级工程师,研究自然语言处理。当时,大型车型的技术路线正在快速成型。 Transformer架构提出两年后,OpenAI的GPT系列模型开始超出预期。一年后,达摩院的两个团队开始大规模研究语言模型。一个是由资深自然语言处理专家黄飞领导的AliceMind项目。另一个是M6项目,包括杨红霞、周昌、林俊阳等人,向周敬仁汇报。最终,M6 能力更强,成为 Tongyi Labs 的 Qwen 系列机型的基础。杨红霞将于2022年从阿里巴巴达摩院退休。成立统一实验室后,林俊阳负责Qwen模型的开源工作,并向周畅汇报。也是在这个阶段,或者说逐渐从一个专注于研究和内部合作的角色,逐渐为外界所关注。他经常活跃在国内外社交媒体上,推广Qwen系列模型,讲解模型更新,回应开发者反馈,提升社区意识。随着Qwen系列车型的不断完善和影响力的不断扩大,以及随着周畅卸任后承担起更加核心的地位,林俊彦逐渐成为了Qwen在科技界积极且有说服力的推动者。 “他不是那种记仇、生气的负责人,”一位接近林俊博的消息人士说。许多公司的顶尖建模研究人员都用这个词来形容我们的部门负责人。此前提到的达达斯人士表示,他们认为,在有限的条件下,首要的工作不是力求完美,而是把事情落实好,先得到结果,然后再做。谈论优化和迭代。他认为人们不需要熟悉创建软件的细节。在他看来,更重要的是理解底层的“物理逻辑”——理解事物为何如此运作——并知道如何把握大而放小。为此,林俊阳喜欢设定明确的“目标”,帮助团队做到最好,尽可能减少不确定性。 “我们不能让团队‘陷入虚空’。”AI管理的问题是必要的、必要的。公司专注于战略执行:组织、流程、集体目标以及我们的目标。处于人工智能前沿的研究人员是我们这个时代最聪明、最积极、最有创造力和最雄心勃勃的人之一。公司应该在多大程度上允许个人意愿? AI研发团队是否应该打造自己的完整闭环?以研发为中心的团队应如何支持商业化和产品竞争的未来阶段?瑟尔这些难题没有标准答案。针对近期 Opera enAI 老将 Jerry Turek 的辞职,他表示:“OpenAI 不再有进行高风险研究的空间。” “所有主要的人工智能公司都面临着多重压力:他们需要推动用户增长,支付昂贵的 GPU 成本,并瞄准模型中的第一。”风波过后,一些高管内部建议,高管未来应该对个人社交媒体账户有更多的控制权,少一些“造神”。 “我们现在是一个开放的时代,但如果发现出了问题,管理层会怎么办?”一位接近阿里巴巴的消息人士表示。 “组织要前进,事物要发展,难道就不能调整一下吗?调整一下就用这个方法,哪里都不合理。”一位阿里巴巴相关人士表示。在极端情况下,阿里提出了个人意志应该服从组织需要的结论。在过去,林俊彦有一个阿里巴巴主动为他准备的表达平台,标签是“阿里巴巴最年轻的P10”。蚂蚁在研发人员心目中的印象发生了变化。该组织还保留了很多。它以其开源精神和技术理想而具有灵活性。林书豪辞职到在社交媒体公开发表声明只用了半天时间,没有给阿里巴巴管理层留下继续沟通和反应的空间。他有一个想法,让 Qwen 建立自己的闭环,并希望将有限的资源集中在构建模型上。此外,如果没有这种对中心目标的执着和专注,科文可能很难尽早证明自己。但随着团队的壮大,阿里巴巴集团将需要一个核心模型团队来扮演更多角色,而随着AI竞争进入新阶段,Qwen团队将需要重新调整目标,调整与公司及其他团队的关系。这是面临的一个严重问题企业组织和人工智能技术的年轻领导者。一位接近阿里巴巴高级技术人员的人士表示:“Qwen不能被认为是阿里巴巴的边缘公司。相反,它在早期获得了大量投资,并且比一些阿里云公司获得了更高的优先级。到了后期,由于初期投资集中带来的大公司的权利意识和政治意识,Qwen表现出淡化业务并“自己建造一切”的倾向。“如果可以的话,”他说,“如果这样的话,场景中就不会发生这种情况。”连日来的暴力冲突,从某种意义上说,是阿里巴巴自己按下的启动键。对于大公司来说,控制力始终是突破点。标题图片来源:Cut
特别提示:以上内容(包括图片、视频,如有)由自有媒体平台“网易账号”用户上传发布。本平台仅提供存储服务冰信息传递。
请注意:以上内容(包括照片和视频,如有)由仅提供数据存储服务的社交媒体平台网易号用户上传和发布。