您的位置:首页 >行情 >

王小川:大模型创业挺快乐,最好的大模型未必来自大厂

2023-08-08 21:03:40    来源:第一财经资讯

清华大学东门外不远的搜狐网络大厦,曾是搜狗的办公室,在今年大模型创业热潮中,王慧文成立的光年之外就在这里办公;而原搜狗CEO王小川,则将百川智能的创业地选在了与其一路之隔的赛尔大厦。站在这里,甚至可以看清对楼窗边的办公环境。


(资料图片)

不到一年时间,大模型创业者已经几近红海。隔着马路的另一面,光年之外创始人王慧文因健康问题离岗退出,将创立不到半年的公司卖给美团,引起了外界对于创业者心理健康的关注。

8月8日下午,在赛尔大厦17层的一间会议室里,当王小川被问及此事以及“大模型创业压力大不大”时,他对第一财经等媒体说:“我听说慧文是特别负责任的。他是国内几个主流做大模型里唯一一个没有强势的技术背景的,对他的挑战比其他家要大。工作中要做大量的技术决策、招什么人、走什么技术路线图、需要多少计算资源……一定会面临非常多的决策压力。”

王小川说,“不是做大模型压力大,是没有技术背景做决策压力会大很多,但是技术足够的话,其实挺愉悦的,我们的进度是在一个快乐的状态。”

“也就是说不会抑郁?”记者追问。

“如果慧文做成了(大模型),我会抑郁的。”王小川开玩笑式地回答。

搜索虽晚,但赶上AI好时候

从今年4月下场杀入大模型到现在,王小川说,比当年搜索引擎时候的成就感更大。

过去,搜狗想从搜索转问答,搜索输入法想做续写,尽管当时搜狗已经做了百亿的参数模型,把全身武艺都用上了,但始终不能有效地把搜索变成问答,实现不了今天大模型才能达到的效果。他说,今天有了大模型的加持,在搜索增强方面将大有可为。

而对于加入如火如荼的“百模大战”,他回应:确实每个有技术理想的企业都想下场去试一下。

ChatGPT火了,有朋友对王小川说,“你特别适合做大模型”,因为这正好需要用到过去搜索、输入法等相关的AI能力。他说当时回想了一下,自己干了20年搜索,从来没人说:“小川,你适合做搜索。”

当年王小川创立搜狗做搜索,比百度晚了四年,因此在行业里一直处于跟随的位置,做创新突破特别难,现在赶上了信息时代走向智能时代,大家站在同一个起跑线上,新的机会来了。

王小川说,其实自己也有压力,尤其在一开始,要抵制动作走形的地方。比如有投资人说,搜索公司不适合做大模型,因为谷歌也没干成,做搜索的人可能已经“脑子锈了”、思维固化了,再去做大模型可能是个减分项。还有人认为在新公司里有“老搜狗人”的加入,不够开放,建议他要多招90、95后海归回来的“小鲜肉”。这些压力其实不是来自内生,而是市场审美理念的不同。

他说,搜索这个模式存在太久了,以至于大家慢慢忘了搜索本身也是AI,且搜索和输入法本身就是把语言AI用到极致。百川智能技术联合创始人陈炜鹏对记者举例,做大模型的第一个环节是数据从哪来,中文互联网网页中的数据高达万亿、百亿量级,搜狗此前的数据积累,能让他们知道哪里有好的数据,并且将这些数据进行收集、处理、识别,在这一领域,百川智能目前的团队有较强的技术积累和方法论。此外从人才来看,搜狗原有团队有着较强的战斗力,搜狗原COO茹立云、原CMO洪涛相继加入进来,以及有更多年轻人才的加入,形成了目前百川智能的人才梯队。

从4月宣布下场做大模型后,百川智能动作迅速。6月发布70亿参数开源大模型Baichuan-7B,7月发布130亿参数开源大模型Baichuan-13B。

这两款的大模型引擎,并没有立刻商业化,王小川说首先是填补空白,展现自家的技术实力,相信伴随着开源后不断的技术迭代,商业模式水到渠成。他透露,目前有150余家企业申请使用百川智能大模型。

“谁是最好的大模型”还没结论

在发布两款开源大模型后,今日王小川发布了百川智能新模型Baichuan-53B,不同的是,这一次是参数规模更大(530亿)的闭源大模型。

在王小川的电脑页面上,向百川大模型提问的对话一幕幕闪过,比如“以古龙的风格写个朋友圈”、“罗刹海市的歌词是什么”、“300P算力相当于多少张A100”、“讲讲卡夫卡的名作《城堡》”等等。他说,这次大模型的文科能力更好,比如在理解古诗、生成有个性化风格的文章等方面。

目前的大模型有以OpenAI GPT-4为代表的闭源大模型和以Meta Llma2为代表的开源大模型两股力量。后者正在快速地拉拢“朋友圈”,对前者形成有力冲击。

谈到最近热议的开源与闭源之争时,王小川说,开源确实容易“建立人品”,“朋友多多的”,让大家迅速了解和评测;同时开源也是为商业化做准备,如果大家用起来觉得不错,当需要更好的服务和更大的参数时,可以探索进一步的商业化路径。

但是他认为,开源和闭源并不像手机中iOS或者安卓操作系统只能二选一,从tob角度,开源闭源其实都需要。他预计未来80%的企业会用到开源的大模型,因为闭源没有办法对产品做更好的适配,或者成本特别高,闭源可以给剩下的 20%提供服务。二者不是竞争关系,而是在不同产品中互补的关系。

王小川还提到,在6月发布第二款大模型后第二天就飞去硅谷。第一个收获是对齐认知,交流技术思路,到底走开源还是闭源……第二个收获是美国做技术很牛,但是应用能力可能有短板。

他说,在硅谷和 OpenAI 交流时,他们讲理想时满眼放光,走得非常远,比如他们现在做 GPT-4 需要 2 万多张卡做计算,国内都没见过这么大的规模。对方还很自豪地说正在设计把 1000 万颗 GPU 连在一块做计算模型。“要知道英伟达一年才生产100万颗。”而在怎么去做应用、做产品上,这可能是OpenAI的短板。

这让王小川意识到,光跟着OpenAI走是不够的,理想上确实拼不过,但是在落地上,更有底气了。他说在去硅谷之前自己认为,是“在理想上比OpenAI慢半步,在落地上比OpenAI快半步”。从硅谷回来之后改成了:“在理想上比OpenAI一半步,在落地上快三步。”

而在对比中美大模型时,王小川还提到,美国闭源大模型的头部格局几乎已经定,比如OpenAI、Anthropic的Claude,Google也拿到门票,已经没有太多悬念,投资人也不会再投。

但中国的情况不一样,面对轰轰烈烈的“百模大战”,王小川认为,钱是重要的是,最终决定的力量还是人和团队、组织能力。大厂钱多、人多、算力多,但组织效率通常不一定够好,创业公司的组织效率可能好、也可能不好。“中国谁做了最好的大模型,还没有结论,大家都在争取机会,而且不一定落在大厂里。”

标签:

相关阅读

精彩放送

马来西亚学者:新的权力中心已经出现,全球南方不愿再做大国“棋子”

北京的自来水变凉了?官方回应

广东人首次去山西吃席,随礼500元,看见当地酒席直接惊呆了

时代光影 百部川扬 | 秀丽平坦

暑期旅游市场热度持续攀升,相关公司业绩有望持续释放

“绿”动海外,临工连续向印度大客户交付电动装载机

李行亮中国好声音第几(快乐男声李行亮)

华民股份8月8日快速上涨

微软展示Rumi项目,通过多模方式提高AI理解能力

华为终端云服务与滴滴等多家合作伙伴签约 共建鸿蒙服务分发新生态

“新三样”表现亮眼 成为拉动长三角外贸发展新引擎

腾势N8正式上市 售价31.98万元起

世界奶业大会在呼和浩特开幕

HDC2023:未来人人可拥有一块智能手表,掌握数字健康钥匙

未经授权的阳光金果猕猴桃在中国种了7850公顷,佳沛再次提起诉讼

雨后巩乃斯国家森林公园带你漫步童话世界

孩子飞机上突然抽搐,广州医生按压穴位及时救回

吉林省舒兰市强降雨已致1人遇难、副市长等4人失联

你好,感觉你对绥芬河比较熟悉,想问下,我一直想不跟团自己带儿子去海参崴旅游,但又不...

探索户籍准入同城化!公安部最新举措来了,落户大城市会更便捷吗?

成都大运会 | 干净、热情、美味——韩国代表团成员点赞成都大运会

凌雄科技逆势增长,DaaS的春天来了?

艾莉卡(关于艾莉卡的基本详情介绍)

粉丝见面会演变成大规模混乱,美游戏主播被拘捕

超频三:公司有部分产品销往北美市场

人的生命就是如此脆弱

苹果2023第三财季财报:营收下降1% 利润增长5%

步罡踏斗图(步罡踏斗)

芜湖港储运股份有限公司(1;15;0;0)

八届市委第六轮巡察工作动员部署会召开

百合花的寓意和象征(百合花的寓意)

华为发布HarmonyOS 4;小马智行与丰田成立合资公司;花王停止在中国生产纸尿裤|Do早报

康普化学赚得多 旭杰科技扭亏了

龙头切换问题

水管两头都不活动怎么接(两头都不能退的水管怎么对接)

在电影《直到世界尽头》中,导演如何体现,其独特的导演风格?

【信息化建设】中盐内蒙古化工药业公司人工智能信息化项目完成安装调试

中来股份:二季度以来,聚酯薄膜价格主要呈现先涨后跌的波动趋势

一手数据,一波预告,从200家展商和10余场会议活动揭开面纱

酷狗音乐怎么把kgm格式转换mp3格式_酷狗音乐kgm格式怎么转换mp3

9块9的AI芭比写真,治好了我的“完美焦虑症”

吉利集团宣布捐赠5000万元 支持北大灾后建设

萤石网络:上半年营收22.85亿元,净利润同比增长70.3%

二三四五:证券简称变更为“岩山科技”

十三届全国政协原常委沈德咏受贿案一审宣判:判处有期徒刑十五年

淘宝紧急推出涿州图书专场

华为发布HarmonyOS 4:更好玩、更流畅、更安全

西工大在大模型异构智能体方面取得重大进展!

发改委:下半年经济将保持稳定向好态势

华为开发者大会2023召开,发布HarmonyOS 4

小马智行与丰田成立合资公司,推动L4级自动驾驶前装量产

部署“风云” 让风云尽在掌握

HarmonyOS 4将接入华为AI大模型

互联网巨头排名下滑,全球500强企业净利润同比下降

同为股份:使用合计8000万元自有资金购买理财产品 有助于提升公司盈利能力

阿维塔:捐赠350万元驰援京津冀受灾地区

8月3日中国汽、柴油平均批发价格分别为9065、8020元/吨

华电能源董秘回复: 公司发电机组均为火力发电机组,目前没有新能源发展项目

《盲盒经营行为规范指引(试行)》解读

高通与现代汽车集团协作打造定制化车载信息娱乐系统

奇瑞控股宣布捐赠2000万元驰援灾区

双江镇高求村:“1+4”助推乡村治理效能提升

燃油泵不合格 车辆或会行驶中熄火!上汽大众召回超8.3万辆车

中图网回应“25元一斤买书” 不会卖泡水书

商务部:上半年服务进出口总额同比增8.5%

深情一周年送TA最贴心礼物

长安汽车捐赠2000万驰援京津冀救灾重建

泰国人居然拍中国古装剧了 基本信息讲解

多部门联合发布税收优惠政策 支持重点群体创业就业

看守所关过半年有案底吗

美国科技股大跌;理想汽车L9 Pro发布;哪吒AYA纯电车型上市|Do早报

如果我现在创业失败,想回大厂,大厂还会要我吗?

三只羊网络捐赠2000万驰援京津冀暴雨救灾

达尔优A98 Master三模热插拔机械键盘评测:一把键盘,两种手感

蜜雪冰城捐1000万支持抗汛救灾

柳州市引种国家一级重点保护野生植物——广西火桐

梦幻西游:雪山爆发服战选拔,潘总发声“梦幻没有专属区”

梦幻西游名字大全带符号 梦幻西游名字大全

中国铁塔(00788):受商务定价协议影响经营现金流同比跌超六成 不派息因息率低

黑河:兴边富民展新颜

津铺子上半年净利润增长91%

栀子做调料起什么作用(枙子能和猪骨一起炖汤吗)

易纲讲座:关于数字人民币的思考与讨论

东方甄选捐款300万元支援京津冀防汛救灾

宏碁Q2净利润13.92亿元新台币 环比增长170.2%

迷宫蝴蝶歌词罗马音音译(迷宫蝴蝶歌词)

郴州市妇幼健康重点工作完成第三轮督导

丰田第一财季净利润达1.31万亿日元,同比增长78%

本田中国7月销量89691辆,电动化车型今年累计销量约13.3万辆

区别对待中国市场的三星手机回来了?

美团捐款3000万元,支持北京河北灾后重建

现代汽车向半导体初创公司投资5000万美元

7月份QDII涨幅冠军:嘉实全球互联网股票涨20.59%

黄田村:举办庆祝八一建军节96周年 关爱退伍老兵送健康活动

全国最大源网荷储一体化项目在甘肃玉门正式实施

抖音电商“山货上头条”助力食用菌产业发展发布会在闽召开

温州卫星地图高清地图市府(温州卫星地图)

唱一首歌赚两个亿, 四次登上春晚爆红, 开演唱会“堪比”刘德华

百度宣布调拨3000万元资金支援抗汛救灾

对多份财报财务数据进行会计差错更正 ST数源收深交所监管函

美国科技股大跌,全球十大富豪财富一天蒸发267亿美元

蚂蚁集团捐赠2000万元驰援北京河北防汛救灾

开心汽车宣布任命顾镭为高级副总裁 主管新能源

午评:A股三大指数震荡涨跌互现,预制菜、乳业等消费板块走高,超导概念遭重挫

内蒙古赤峰市局(公司)QC成果获佳绩

新车减配、亏损115亿,哪吒汽车如何“闹海”?

新华保险眉县支公司被罚 跨省经营保险业务

房子朝向哪个方向最好(房子什么朝向最好)