搜狗创始人王小川,携旧部在2023年高调“卷土重来”。
一年过后,背负着年底前“做出国内最好的大模型”的KPI,王小川交了一份初期答卷。
2024年春节期间,王小川发布了自己的龙年愿景,他表示:“与互联网时代的应用相比,大模型时代的应用将是一个新物种。以前我们更多的是造工具,但现在,我们造的新物种,更像一个人类的伙伴,人类对伙伴的要求,不会要求它像工具一样精确,更希望让它与人类合作。”
▲(王小川)
2024年1月29日,王小川创办的大模型公司百川智能,发布了超千亿参数的大语言模型Baichuan 3。百川方面强调,在多个权威通用能力评测中,Baichuan 3都展现了出色的能力,尤其在中文任务上更是超越了GPT-4。
百川智能也在一年之间估值就超10亿美元,成为国内估值增长最快的大模型创业之一。对王小川来说,当初因搜狗卖身腾讯,而没能做成的事终于在这里得到了延续。
王小川“不甘心”。正如他在创办百川智能时所说:“搜狗未尽的使命,在机器掌握了语言后终于可以实现了。”
01、完成“搜狗未竟的使命”
事情还得回到2023年4月,沉寂两年的王小川,在位于清华大学东门外十字路口的搜狐网络大厦,召开了一场媒体见面会,宣布与前搜狗COO茹立云联合成立大模型创业公司百川智能,并拿到了5000万美元的启动资金。
搜狐网络大厦曾是搜狗的大本营,王小川可谓“旧地重游”。当时,这里汇聚了AI创业的群星,美团联合创始人王慧文成立的大模型公司——光年之外,办公地点就选在这里;估值目前已超百亿元的智谱AI,也在楼里安营扎寨。巧合的是,这三家公司的管理者,都是师出清华的同门。
正当不少人以为王小川要就此上演“归来记”时,他却笑言“不跟他们在这里卷”,最终带队转战到了搜狐对面的大厦,双方一路之隔。
毕竟,王小川虽然起家于搜狐,但这里也留下了他的遗憾。现在,他要来完成自己的技术理想了。
在2023年ChatGPT刚刚变得火热时,王小川就按捺不住,激动地发了一条朋友圈:“OpenAI的胜利,是技术理想主义的胜利。”
互联网圈一直津津乐道的,是当年“天才少年”王小川在搜狐十几个月就干出了搜狗搜索,后来拿出了“浏览器+输入法+搜索”的“三级火箭”方法论,并在马云、马化腾、周鸿祎、张朝阳等大佬中游走,一番合纵连横,推动搜狗独立在纽交所上市的故事。
但实际上,王小川一直念兹在兹的是一个基于AI的技术梦。
在他看来,搜索引擎的意义重大。它是能够改变人们互动方式、进而改变互联网世界的力量。而人工智能和搜索,是天然联系在一起的,搜索引擎本身就能对海量的数据进行处理和匹配,这就是AI。
王小川是个执着的人。每次搜狗的发布会,他都在侃侃而谈技术。2016年他就说,搜索的未来是人工智能时代的明珠。那时有人问他搜狗为什么要转型做AI,他当时不好发作,但直到一年后他提起来,还愤愤不平地说,自己听完“一肚子火”。
2017年初,搜狗的问答机器人汪仔登上了《一站到底》的舞台。不过这些在综艺上的宣传噱头都是表象,搜狗真正要做的,是想将搜索升级到对话系统、问答系统和翻译系统。王小川相信,加大投入后,搜狗会推出颠覆性的产品。
2017年11月,搜狗登陆美股,上市当日市值突破50亿美元。王小川意气风发,他在内部信里说,接下来“唯一的悬念是搜狗能否在搜索领域实现颠覆,能否在人工智能领域引领重大的创新”。
但接下来的四年,搜狗并没能讲出一个激动人心的AI故事。归根结底,无论是搜索还是AI,都需要极大的投入,但当时的搜狗,“三级火箭”的流量红利已经吃得差不多了,从2018年之后公司营收增长开始放缓,增长率从2017年的38%下降至2019年的4%,在2020年营收更是首次出现同比下滑。
与此同时,门户网站的光辉时期已过,处于艰难求生境地的搜狐,自然也无法给予搜狗资金支持。
搜狐创始人张朝阳动起了卖掉搜狗的心思。2013年投资了搜狗的腾讯,也在2020年提出全资收购搜狗。思考了380多天后,王小川忍痛放手,在2021年10月15日宣布卸任搜狗CEO。
这对搜狗获取腾讯流量是件好事。但对于王小川当初的技术理想来说,却未尝不是一种失败。他离开搜狐,也拒绝加入腾讯,独归江湖。
转折点在2023年来临。王小川在媒体报道中表示,他在2023年1月用了ChatGPT之后,突然感觉到“变天了”。这种大语言模型能够用最自然的方法,根据提问作出回答,“不得了,通用人工智能时代已经到来了。”
当年的搜狗为了问答,也做了百亿参数模型,但即便使上了十八般武艺,也没能实现今天大模型的效果。一旦有了大模型的加持,在搜索增强方面,将大有所为。
王小川回忆,当时就有身边的朋友对他说,“你特别适合做大模型”。因为,这正好需要用到搜索、输入法等相关的AI能力。
这话对王小川来说,也不知是激励还是辛酸。王小川说,当时他回想了一下,自己过去干了20多年搜索,却从来没人和他说过:“小川,你适合做搜索。”
于是,王小川重出江湖,要实现他的AI“初心”,弥补搜狗的遗憾。
百川智能旗下,重新聚集的就是原来“搜狗系”人马。除了茹立云之外,前搜狗CMO洪涛、前搜狗搜索总经理陈炜鹏也已回归。当初在搜狗时,王小川和茹立云、洪涛、前搜狗CTO杨洪涛曾并称为“四大天王”,现在,其中的三位已经再度聚首。
截至去年10月,百川智能员工已超170人,公司技术联合创始人陈炜鹏曾表示,搜狗之前各个业务线最优秀的干将如今已基本集结完毕。王小川也说,搜狗老班底互相之间有信任,会更优先归队。
在大模型如何发挥价值上,王小川也再度强调了“搜索”,他提出“搜索增强”的解决方案。搜索增强可以将大模型的能力与搜索引擎相结合,给大模型“投喂”更精准、更深入的搜索结果,有助于减少错误答案,即所谓的“幻觉”现象。
“从国内来看,搜索增强是大模型走向实用的第一步,甚至是最关键的一步,没有搜索增强的大模型在企业里是没法落地的。”王小川在新年愿景里,也再次强调了这一点。
“我最动心的是,能和一群有理想的人,用极致的技术驱动创造出颠覆性的智能产品。”在百川智能成立时的公开信中,王小川如是写道。
02、创业急转弯
众所周知,王小川和百度董事长、CEO李彦宏一直“不来电”。创业之后,王小川再度调侃了李彦宏和百度的文心一言,随后百度回嘴说,“王小川脱离一线太久,确实跟我们不在一个宇宙,自然对国内人工智能技术的发展缺乏了解。”
这句话戳中了王小川的“痛点”。第二天凌晨他就发布一条微博怼了回去:“什么样的平行宇宙里,才能做到让一个脱离一线15年的人,去怼一个脱离一线1.5年的人。”一时间,空气里充满了火药味。
▲(2005年,推出搜狗搜索的王小川成为搜狐最年轻的副总裁)
但这确实也是很多人所关注的一点:毕竟,王小川已经离开科技行业一年多了,这段时间里,他做什么去了?
王小川其实一直在创业,只不过他的经历,在不少人眼里,和人工智能以及大模型,离得有点儿远。
在离开搜狗时,王小川说,之后将关注生命科学和医学,“为大众健康做贡献”。
彼时,医疗健康产业正站上风口。在2020年时,我国大健康产业规模已经突破10万亿元,根据“健康中国”战略,到2030年产业总规模将达到16万亿。然后,他在2021年出手投资了肠道医疗技术开发商“热心肠研究院”;以及专注于口腔人工智能医疗的公司DeepCare羽医甘蓝,该公司通过深度学习,推出了口腔影像AI分析系统。
从2021年到2022年,王小川连续注册了三家名字带“五季”的公司,包括北京五季科技有限公司、北京五季健康咨询有限公司和五季医学科技有限公司。后来有市场传闻称,当时王小川是准备做智能硬件,打造一款治疗打鼾的智能枕头;但在2023年初,王小川用了2周时间,就做出了决定,放下这个创业项目,去做大模型。
根据天眼查信息,茹立云也曾在五季医学科技有限公司持股。去年9月,茹立云退出股东行列,全身心跟随王小川创业。而“留守”在这家公司的另一位自然人股东,就是搜狗“四大天王”的最后一位杨洪涛。
从医疗健康到大模型,王小川在创业路上,猛然打了个急转弯。
作为从互联网创业时代走过的“老兵”,王小川灵敏地嗅到了“技术变革”的气息。过去,从搜索到人工智能,搜狗一直处于百度的下风,王小川也没有摆脱李彦宏的“阴影”。现在,他终于看到了一次率领团队、再度挑战旧秩序的机会,这是他必须抓住的契机。
但之前创业的公司也尚未见眉目,再度转向人工智能,在外界看来,王小川似乎是一直在追逐风口。
王小川自己并不这么认为。他在后来接受媒体采访时表示,自己当年读研期间做的课题,就是跟基因测序拼接算法相关的。因此,他也好奇“如何用数学模型去刻画生命”,而人工智能的发展,同样也是激发了他的想法,想用深度学习的方法去理解生命科学。
尽管有了这一番解释,但AI技术实际上还远没有走到如此地步。即使是大语言模型,解决的还是人和机器如何对话的问题。
除此之外,业界最想了解的问题就是:大模型创业“前无古人”,在搜狗之后,王小川这次要怎么讲、以及能不能讲好一个全新的AI故事?
03、百川智能,一路急奔
在创业之初,王小川和其他创业者一样,都集中在研发通用大模型上。其中的逻辑也很简单:既然OpenAI是这么起家的,那么国内也一定要有自己的底座大模型。但大模型赛道已逐渐变得拥挤:到去年10月时,国内已涌现了238个大模型;自2023年8月第一批国产大模型通过备案起,截至今年2月,已经有40余款大模型获批对外开放。
“百模大战”中,百川智能做得究竟怎么样?为了打一场和搜狗不同的“翻身仗”,占领先机,王小川带领百川一路跑得非常“急”。
依靠搜狗时积累的工程能力、王小川的清华技术背景和大佬人脉,百川智能已经成为国内在2023年诞生的为数不多大模型“独角兽公司”之一。根据去年10月百川智能公开的信息,其年内累计融资已达3.5亿美元。《晚点LatePost》估计,当前其估值约达18亿美元。此外的三家估值超10亿美元的公司分别是通用大模型公司MiniMax、智谱AI和李开复的零一万物,它们共同成为大模型创企中杀出的“黑马”。
成立后半年内,百川智能接连发布了baichuan-7B/13B、Baichuan2-7B/13B四款开源可免费商用大模型及两款闭源大模型;平均每28天就会发布一款新的大模型。
最引人注目的是,百川智能对“引领开源”的强调。“Baichuan2-7B以70亿参数,在英文评测级上能与130亿参数的LLaMA2(Meta AI正式发布的新一代开源大模型)持平。”王小川在去年9月发布该产品时表示,“我们现在可以获得比LLaMA更友好且能力更强的开源模型,能够帮助扶持中国整个生态的发展。”
这也直接把国内大模型竞争“卷”向了一个新的高度。越来越多的通用大模型开源,参数也越来越大。去年年中,阿里云也加入战团,成为首家开源的国内大厂。去年12月,阿里云又宣布开源通义千问720亿参数模型Qwen-72B。
但大模型能否如手机的安卓系统一样,上演一出开源“逆袭”的故事,还是个未知数。
2023年11月、12月相对沉寂的百川智能,在今年1月底又突然发布了超千亿参数大模型Baichuan 3。超千亿参数模型在训练过程中对高质量数据,训练稳定性、训练效率的要求都高出几个量级,而从Baichuan大模型1.0的发布到如今3.0,百川只用了9个月时间。王小川给自己的“KPI”压力之大,可见一斑。
王小川在创业时的交流会上,就给公司构建起了初步的目标:年底前预计会发布对标GPT-3.5的大模型,并有信心“做到国内最好”,还要做到搜索增强、多模态的增强。
Baichuan 3显然目标是全面对标GPT-3.5、追赶GPT-4的。百川智能没有透露模型参数量,相比之下,GPT-3.5是1750亿参数。百川方面表示,在多个权威通用能力评测如CMMLU、GAOKAO和AGI-Eval中,Baichuan 3都展现了出色的能力;而在CMMLU、GAOKAO、HumanEval和MBPP等多个中文评测榜单上,更是超越了GPT-4。
在创业时,王小川曾称,百川智能将同时发展通用和垂类模型,尤其是在医疗等知识层面重点增强。可以看到,王小川在商业模式上,当时也有了自己的思考,先在具体场景里做优化、积累行业用户,构建生态,先把模式跑通。在行业选择上,王小川则是万变不离其宗,除了搜索老本行,他投资多年的医疗领域有了用武之地,进入了首选名单。
对于Baichuan 3,百川方面也强调了其在医疗领域内的能力。Baichuan3的医疗数据集Token数超千亿,医疗能力逼近GPT-4。在对逻辑推理能力及专业性要求极高的MCMLE、MedExam、CMExam等权威医疗评测上的中文效果,Baichuan 3同样超过了GPT-4,是中文医疗任务表现最佳的大模型。
赶在新年前面世的超千亿大模型,可以说是王小川和百川智能给自己年初的目标,做的一个“年终总结”。
但这份成绩显然还有待继续提高。毕竟,目前也没有一款大模型可以成为公认的“国内最好”。就在不久前的1月16日,智谱AI也发布全国产的新一代基座大模型GLM-4,整体性能已逼近GPT-4。最引人注目的是,智谱AI还发布了定制化的个人GLM大模GLMs和GLMStore,全面对标OpenAI的GPT商店。
同时,对于大模型,资本的热情已在渐渐消退。“下一阶段,估计很少有人再会投这种基座大模型了,而是会把注意力放到各行业的应用上去。”一位投资人告诉「市界」。大模型融资创业的窗口也接近关闭,一位大模型创业者吐槽说,自己一段时间密集见了30多家投资机构,却没有人出手投资。
资本热度已经逐渐减退,而大众感兴趣的“颠覆时刻”,似乎还没有真正意义上到来。通用大模型纷纷开放后,下一步又将“卷”些什么?同时,市场也迫切希望,能够早日看到大模型们清晰的商业化路径。
市场曾有声音判断,2024年将是AI应用迎来爆发。“AI原生时代,我们需要100万量级的AI原生应用,但是不需要100个大模型。”李彦宏也在近期表示。
王小川不止一次在公开场合提到过“超级应用”。他认为,中国的机会或许不是技术科研上比美国跑得快,而是在应用上跑得更快。即“理想上慢半步,落地上快一步”。去年6月,他去美国硅谷走了一圈,发现OpenAI正在尝试把1000万颗GPU连在一起,训练一个大规模的模型。回来之后,这句话就被他调整成了“理想上慢一步,落地上快三步”,在产品应用上要跑得更快了。
但百川智能的超级应用仍然“在路上”。2023年的年底时,王小川在公开活动中还表示,针对C端的超级应用,预计会在2024年推出,“主要针对健康、快乐、个人助理方向”。
很多企业也发现,即使AI应用出现,大模型时代的应用模式,也和移动互联网时代不同。这仍是一条需要探索的路径。像去年火爆一时的妙鸭相机,就跳过了“免费获取早期用户市场”阶段,在推出的第一天就开始收费,但很快其热度也下降了。
对于大模型公司来说,现在探讨如何稳定造血还为时过早,目前还是处于卡位战的阶段。而在“百模大战”的下半场,淘汰赛也即将开始。
2015年那波AI浪潮中,就诞生过业界公认的AI“四小龙”。后来,四小龙中的商汤科技、云从科技都已经成功登陆资本市场。但是,以它们为代表的那一代AI创企,也普遍都经历过估值过高之后,商业化变现艰难等问题,很多公司直到现在还在苦恼盈利难题。
经历过这些的投资人们,面对大模型时出手更为谨慎,更加重视公司实现自我造血的能力。而无论是国内还是海外,大模型技术和产品都还处于探索期,从数据安全、应用场景到商业模式,都充满着不确定性,所有人都在摸着石头过河。
王小川这次创业,“押上”了自己的名字。他要实现昔日梦想,也要谨慎地避免重蹈覆辙。不过幸好,生成式AI大幕才拉开不久,未来舞台还足够广阔。
作者 | 杨 洁
编辑 | 孙春芳
运营 | 刘 珊
来源: 市界