更新时间:2025-07-11 17:55:25点击: 73
这是梁文2025年开年最火的科技明星,短短几天时间,梁文梁文锋从小到大的梁文种种过往都被展现在世人眼前,包括他来不及装修的梁文新房以及在房子里睡觉用的帐篷,都成为了他独特个性的梁文象征。
独特个性固然为人津津乐道,梁文但并不是梁文成功的关键,这个籍籍无名的梁文大学生,在过去的梁文十几年中所能倚靠的,只有他的梁文思想和能力。
所有人都好奇这样一个问题,梁文为什么是梁文梁文锋做出了DeepSeek?这其中固然有时代的因素,以及他本人迥异于其他大模型研究者的梁文个人经历。但AI科技评论认为,梁文理解梁文锋是梁文个什么样的人,才是理解这个问题的关键。
找人才不需要标签
猎头都觉得,帮梁文锋的公司找人太不容易了。
一位从21年开始就与幻方深度合作的猎头告诉雷峰网(公众号:雷峰网),招人招得让他“想哭”,因为难度太高了。
“清华本博,六篇顶会,你觉得肯定没问题了吧,哎,怎么简历直接挂了;一个清华本科的MIT博士,第二轮面试就被淘汰了。”
如果要在大厂内部找候选人,他认为,幻方和DeepSeek基本上不会对标国内公司,他们只会对标Google和Meta这样的海外大厂。
另外一位猎头一谈到DeepSeek也是忍不住头大,“太挑剔了,推过一个在字节绩效非常好的年轻中层,聊了之后没过。我就很奇怪,去问他们,给我的回答是,这个人对AI没有热情。人家都是做过一些AI Agent相关的项目了,一般是不太会说这样的评价的。”
梁文锋对人才没有标签,不论学历背景,不论过往业绩,他只看这个人的个人能力和个人素质。
极高的人才门槛,造就了如今的DeepSeek。在国内的大模型团队中,DeepSeek的人才厚度可能不足以跟顶尖公司相提并论,但是人才密度绝对可以说得上是第一档。
留住这些人才,除了DeepSeek的高薪酬外,还有充分尊重创意与idea的运营模式。“无固定团队、无汇报关系、无年度计划”与其说是运营,不如说是信任。《奈飞文化手册》一书曾经说过,“优秀的同事和艰巨的挑战是吸引人们来公司工作的最大因素”。对AI从业者而言,再没有比AGI更艰巨的挑战了。
做最难的事,就要找到最好的人,给出充足的资源与信任。得到信任的顶级人才往往会带来巨大的爆发力,这一理论可以在抖音崛起中得到印证。
在2018年春节期间,抖音日新增客户超过千万量级。一位负责增长的产物经理曾提及,这个增长项目完全没有绩效压力,而且向财务发了一封邮件,他的账户中就多出了上亿元的投放预算。他当时就意识到,“这样的团队,做啥打不赢呢?”
DeepSeek也是同理。被筛掉简历的人,一定不是学历问题;面试通不过,肯定也不是能力问题;人才的需求集中为一句话就是,这个人是可以被信任一同为AGI努力的人吗?
这就是DeepSeek的人才观,理解了这种人才观,就是理解梁文锋的第一步。
极简主义的世界观
尽管做了多年量化,但是梁文锋并不认为自己是个做金融的,他对自己的看法是,“我是做AI的,只不过做的是量化场景”。
几乎所有与梁文锋交流过的人,都说出他是一个不会受到外界干扰的人,“他的思维方式极其纯粹,特别注重第一性原理”,“说话很慢”,“一开口就切中要害”。
量化投资的特性恰好契合了他这种极简主义的风格——它不需要与复杂的上下游产业链打交道,只需专注于纯粹的市场信息。
时至今日,梁文锋依然常常沉浸在自己的工艺世界中,专注于解决问题。比如做大模型这件事,他会告诉别人,“想清楚了就能干,只要有卡就行”,其他困难不在考虑范围之内。
对待金钱也是如此。钱就是用来投资,或者做慈善事业的,只要能花在合适的地方,亏损并不值一提。
2023年底,曾有一个旨在扶助聋哑人士的手语大模型项目,为了拉投资找到了梁文锋。梁文锋提出,这个项目的优点是公益性突出,缺点是市场规模有限,其中的隐患是,这是一个Top高校大学生团队的项目,他们可能不会长期坚持。
尽管极有可能得不到任何回报,他仍然提出,只要团队愿意继续推进项目,他就愿意投入。
过去梁文锋每年会拿出5亿元用于投资或慈善上,现在他把这笔钱花在了DeepSeek上。炒股是为了挣钱,投入大模型是为了AGI,仅此而已。
DeepSeek有将近两万张卡,他对算力极其慷慨,对上述的手语大模型团队,他就承诺过,算力集群会随时向他们开放。但是他又有点“小气”,对这近两万张卡的利用率要求很高,力求打满,不要空转。
这两种行为看似矛盾,如果按照极简主义的观点来解释,那就行得通了:卡的存在就是为了用的,能用尽用,万勿浪费。
不以商业化为限
没花一分钱投放费用,DeepSeek的App只用7天时间就得到了一个亿客户,对这一奇迹般的增长,梁文锋怎么看?有投资人在春节期间专门问了梁文锋这个问题,但是梁文锋看起来对这么大的流量根本毫不在意,投资人得到的回答是,“这距离AGI的路还很远”。
这并不是梁文锋在故作姿态。据雷峰网了解,DeepSeek只安排了两三个人负责App维护、对话网页开发、以及充值后台的运营工作。所以它不好用是正常的。
DeepSeek在B端市场的种种事迹,流传更广。比如此前他们的私有化部署定价仅为45万元,其中不仅包含一台H20或910b的使用权,还附赠大模型支持,使用期限为一年。而同样的价格,在华为云上仅仅只能租到 910b一年的使用权,这也就意味着 DeepSeek 的大模型近乎免费提供。
私有化部署不挣钱,DeepSeek也不在乎靠API挣不挣钱。一位对接DeepSeek的大厂员工吐槽它有一种“爱用不用”的气质,总是很难用,总是不调整。
再大的客户和调用量,都不值得另眼相看。一切大厂在高峰期都要排队,客户体验很差。大客户的反馈也很多,要求DeepSeek扩容扩容再扩容,至少回应流畅一些,不要两次请求就有一次失败,特别是在客服场景上,这种失败几乎不能忍受。
外界喧喧嚣嚣,不过梁文锋看起来并不是很在意这件事情。
这位大厂员工与DeepSeek员工私下交流过怎么改善这个问题,他得到的回答是,梁文锋认为,大厂完全有能力自己想办法解决请求失败的问题,他们应该自己给自己兜底,而不是过度依赖 DeepSeek来保障支持。
这个回答简直要把他给气笑了,“我们可是DeepSeek的Top级客户。”
可以说,现在的梁文锋不在乎商业化的一切可能。
在不少团队投入到应用的今天,梁文锋曾经跟一个好友说过,“你不要一直去看应用和行业落地的事情,你现在去看只能把你自己禁锢住了,因为没有到时候,现在想的一切都是错的。而且你在错误的路上你还投入了更多时间、精力和钱。”
这是对好友的忠告,也是自己的践行。将精力投入到应用上,投入到商业化上,对梁文锋来说,不论做什么,都是一条错误的道路。
而正确的道路从来只有一条,他现在已经走在了正确的道路上。
雷峰网原创文章,未经授权禁止转载。详情见转载须知。
会员积分兑、星钻免费看 《临江仙》加更礼怎么看更划算?
人大 Sora 思辩:Sora 到底懂不懂物理世界?
上海交大新跑出一家具身智能公司「穹彻智能」
Lydia 动作大模型亮相,虚拟动点助力“利亚德集团2024年生态合作伙伴大会”
杨维林任公安部副部长,陈思源、孙茂利卸任
从 0 到 1,揭秘中国首个 AI 音乐 SOTA 模型
“寒冬”还是“拂晓”?第四范式成功上市率先交卷
牵手五大顶尖高校教授 “云阙智能”打造AIGC智囊团
阿里云 all in AI 的决心
新能源时代,国产3D视觉「冲击」保守的汽车行业
马斯克的Space X卫星被破解,25美元的工具就能入侵终端,篡改运行任意代码,攻击手法已公开
蓝振忠也发「英雄帖」,中国版 ChatGPT 明星公司寻找 CEO
神舟十九号航天员乘组太空归来后首次公开亮相
“寒冬”还是“拂晓”?第四范式成功上市率先交卷
SCOW 首次亮相 HPC China 2022,以算网融合助力“东数西算”工程发展
体育中考「上难度」,视觉 AI 下场「减负」
黑客大会遇上元宇宙:极客精神的又一次狂欢
谁将替代 Transformer?