第三财经网 2024-11-17 15:40 996
又有一名令人期待的大佬级选手加入了“百模大战”!11月6日,知名投资人、创新工场董事长兼CEO李开复创办的AI 2.0公司“零一万物”发布了首款开源大模型——Yi系列大模型。
热烈而焦灼的“百模大战”持续已有半年时间,期间“百舸争流”,各个备受瞩目的玩家均已推出了自家的大模型,并已有多家公司的大模型通过了《生成式人工智能服务管理暂行办法》备案,面向全社会开放服务。随着李开复携Yi系列大模型“姗姗来迟”,“百模大战”又迎来了全新的变数。
对标OpenAI的Yi系列大模型有何过人之处?
“零一万物坚定进军全球第一梯队目标,从招的第一个人、写的第一行代码、设计的第一个模型开始,就一直抱着成为‘World's No.1’的初衷和决心。我们组成了一支有潜力对标 OpenAI、Google等一线大厂的团队,经历了近半年的厚积薄发,以稳定的节奏和全球齐平的研究工程能力,交出了第一张极具全球竞争力的耀眼成绩单。Yi-34B可以说不负众望,一鸣惊人。”在Yi系列大模型全球首发日,李开复这样说道。
据了解,Yi系列大模型的首个公开版本有两款,即Yi-6B(数据参数量为60亿)、Yi-34B(数据参数量为340亿)。二者的主要区别是,Yi-6B适合个人及研究用途,Yi-34B则具备了智能涌现的能力,能应用于多元的场景,并满足开源社区的需求。
其中,被李开复形容为“不负众望”和“一鸣惊人”的Yi-34B在Hugging Face英文测试公开单Pretrained预训练开源模型排名中,以70.72分登顶全球第一,超过了LLaMA-70B和Falcon-180B。值得注意的是,Yi-34B的参数量要远远小于LLaMA-70B和Falcon-180B,却实现了以百亿级参数量超越千亿级参数量的“壮举”。
除此以外,Yi系列大模型的其他亮点包括支持中英双语,在中文能力方面领先于所有的开源大模型,而且拥有超长的上下文窗口,可以生成更为丰富、连贯和准确的文本。如果以ChatGPT为参照,或许能更直观地展现Yi-34B的实力——GPT-4上下文窗口目前可支持约2.5万汉字的超长文本输入,Yi-34B则可以处理约40万汉字超长文本输入。这一能力,也让Yi-34B顺利拿下全球最长上下文窗口的宝座。
Hugging Face是目前全球最受欢迎的大模型、数据集开源社区,在大模型的能力测试中具有较强的行业权威性。在Pretrained预训练开源模型排名中,Yi-34B的各项性能表现十分优秀,在某些指标上更是遥遥领先,可以说是已经进入到全球开源最强基础模型之列。
如今,开发者在开源大模型的使用中拥有了更多的选择。据了解,目前Yi系列模型已在Hugging Face、ModelScope、GitHub三大全球开源社区平台正式上线,同时开放商用申请。同时,据李开复介绍,零一万物在完成 Yi-34B 预训练的同时,已经启动了下一个千亿参数模型的训练。
创业半年的大模型公司“零一万物”有何来头?
Yi系列大模型的发布也让其背后的大模型创业公司“零一万物”再次站在了聚光灯下。
天眼查APP显示,“零一万物”全称为北京零一万物科技有限公司,成立于2023年5月16日,是一家以从事互联网和相关服务为主的企业。零一万物注册资本为10万元人民币,于2023年完成出资设立,投资方为创新工场。目前,公司的法定代表人为马杰,两大股东分别是李先刚和由李开复任董事长的创新工场(北京)企业管理股份有限公司,其中李先刚持股比例为99%,创新工厂则持股1%。
记者注意到,由李开复领衔的这一大模型创业团队可谓卧虎藏龙,阵容豪华,基本都有国内外顶级大厂的工作经历。李开复自不用说,他先后担任微软全球副总裁、谷歌全球副总裁兼大中华区总裁,并在2009年创立了天使投资和企业孵化平台创新工场;李先刚则曾先后在百度、滴滴等互联网大厂担任过首席算法工程师,博士毕业于北京大学;马杰曾担任百度副总裁,曾是百度“希壤”业务的负责人。
除此以外,零一万物的几个技术副总裁来头都不小。其中,AI Alignment(人工智能对齐)的负责人是Google Bard/Assistant早期的核心成员,主导或参与了大模型在多轮对话、个人助理等多个方向的研究和工程落地;Pretrain(预训练)的负责人黄文灏曾先后在微软亚洲研究院和智源研究院任职;AI Infra(人工智能架构)的负责人戴宗宏则是前华为云AI CTO及技术创新部长、前阿里达摩院AI Infra总监。如此“高配”的团队,也让零一万物拥有了业内少有的“技术天团”。
虽然零一万物的Yi大模型“赶了个晚集”,但李开复在人工智能和大模型方面的布局早在半年以前就开始了。今年3月,李开复就对外宣布入局大模型,亲自筹办人工智能公司,并称“这是一家由技术愿景驱动、拥有卓越中国工程底蕴的创新企业”。三个月后,“零一万物”正式上线。对于公司的命名,李开复表示,零一即01,代表的是数字世界,从零到一,乃至宇宙万物,寓意“零一智能,万物赋能”的雄心。
“零一万物”们背后的投资机构都有谁?
零一万物发布Yi系列大模型的同时,也完成了新一轮融资。据悉,新一轮融资由阿里云领投,目前零一万物的估值已超过10亿美元,成为又一个AI独角兽。
今年以来,AI大模型成为了最热门的投资赛道之一。虽然今年一级市场比较低迷,但投资人们对这一赛道青睐有加,多家AI创业公司仍然获得了可观的融资。
10月20日,北京智谱华章科技有限公司(以下简称“智谱AI”)宣布,已完成新一轮融资。投资方阵容相当豪华,包括社保基金中关村自主创新基金(君联资本为基金管理人)、美团、蚂蚁、阿里、腾讯、小米、金山、顺为、红杉、高瓴等多家知名VC机构和产业资本,君联资本在内的部分老股东此次也参与了跟投。智谱AI的创始团队也非常高端,核心团队脱胎于清华KEG实验室,CEO张鹏设计和研发的跨语言知识图谱系统XLORE,在国际上颇受好评。技术顾问是清华计算机系教授唐杰等人,清华计算机系副教授黄民烈也一直与技术团队合作紧密。
10月17日,由前搜狗公司CEO王小川创立的百川智能宣布完成A1轮战略融资,融资金额3亿美元。投资机构中除了有阿里、腾讯、小米等科技巨头以外,深创投、基石资本、心资本等投资机构也参投了本轮融资。王小川的创业团队也具备极高专业度,王小川本人毕业于清华大学计算机系,团队成员则由来自搜狗、谷歌、腾讯、百度、华为、微软、字节等知名科技公司的AI顶尖人才组成。
除此以外,还有清华系大模型公司月之暗面也获得了来自红杉资本、今日资本、砺思资本等知名投资机构近20亿元的融资。月之暗面由清华大学交叉信息学院、智源青年科学家杨植麟教授领衔,联合创始人周昕宇和吴育昕均出身清华,并吸纳了来自Google、Meta、Amazon等全球顶尖科技公司的人才加入创业团队。
然而,虽然赛道看似热热闹闹,但大模型创业项目目前呈现两极分化趋势,热闹只属于少数人,更多的创业者未能叩响资本的大门。证券时报记者梳理发现,大模型领域顶尖人才扎堆,“名校出身”、“技术傍身”几乎成为了创业团队的标配,也更容易获得投资人的青睐。
有深度关注该赛道的投资人表示,真正懂大模型的人才仍相对稀缺。只有在AI领域具备极高专业度并且在资本圈富有号召力的团队,才有机会胜出。这些都意味着,大模型创业不是万众创业而是场小众创业。谁将在这场科技盛宴中分得更多羹?这个问题随着李开复的加入有了更多的不确定性,也让大模型创业有了更多的看点。
热门文章