每日文摘
每日教程
生活就像海洋,只有意志坚强的人,才能到达彼岸。
每日文摘
每日教程
首页
名言
文案
人物
标签
著作
推荐
搜索
—— 请按键盘
空白键
开始游戏 ——
需要
在AI领域,技术的积累并非一蹴而就,而是需要持续的投入和耐心的等待。
梁文锋
技术的积累并非一蹴而就,而是需要持续的投入和耐心的等待。
梁文锋
AI大模型的发展需要全球视野和开放的心态,中国需要从技术的“搭便车者”逐步转变为“贡献者”。
梁文锋
我是八十年代在广东一个五线城市长大的。我的父亲是小学老师,九十年代,广东赚钱机会很多,当时有不少家长觉得读书没用。但现在回去看,观念都变了。因为钱不好赚了,连开出租车的机会可能都没了。一代人的时间就变了。以后硬核创新会越来越多,因为整个社会群体需要被事实教育。当这个社会让硬核创新的人功成名就,群体性想法就会改变。我们只是还需要一堆事实和一个过程。
梁文锋
未来硬核创新会越来越多,现在还不容易被理解,是因为整个社会群体需要被事实教育。当这个社会让硬核创新的人功成名就,群体性想法就会改变,我们只是还需要一堆事实和一个过程。
梁文锋
创新首先是一个信念问题。为什么硅谷那么有创新精神?首先是敢。Chatgpt出来时,整个国内对做前沿创新都缺乏信心,从投资人到大厂,都觉得差距太大了,还是做应用吧。但创新首先需要自信,这种信心通常在年轻人身上更明显。
梁文锋
DeepSeek也全是自下而上的。而且我们一般不前置分工,而是自然分工。每个人有自己独特的成长经历,都是自带想法的,不需要push他。探索过程中,他遇到问题,自己就会拉人讨论。不过当一个idea显示出潜力,我们也会自上而下地去调配资源。
梁文锋
如果需要,我们做应用也没障碍,但研究和技术创新永远是我们第一优先级。
梁文锋
英伟达的领先,不只是一个公司的努力,而是整个西方技术社区和产业共同努力的结果。他们能看到下一代的技术趋势,手里有路线图。中国AI的发展,同样需要这样的生态。很多国产芯片发展不起来,是因为缺乏配套的技术社区,只有第二手消息,所以中国必然需要有人站到技术的前沿。
梁文锋
如果目标是做应用,那沿用Llama结构,短平快上产品也是合理选择。但我们的目的地是AGI,这意味着我们需要研究新的模型结构,在有限资源下,实现更强的模型能力。这是scale up到更大模型所需要做的基础研究之一。除了模型结构,我们还做了大量其他的研究,包括怎么构造数据,如何让模型更像人类等,这都体现在我们发布的模型里。
梁文锋
创新需要尽可能少的干预和管理,让每个人有自由发挥的空间和试错机会。创新往往都是自己产生的,不是刻意安排的,更不是教出来的。我们交给员工重要的事,并且不干预他。让他自己想办法,自己发挥。
梁文锋
人工成本是对未来的投资,是公司最大的资产。我们选的人相对朴实一点,有好奇心,来我们这里有机会去做研究。大厂很难单纯去做研究,做训练,它更多会是业务需求驱动。如果不能很快应用,大厂不一定能持续坚持,因为它更需要看到结果。
梁文锋
对很多行外人来说,ChatGPT这波浪潮冲击特别大;但对行内人来说,2012年AlexNet带来的冲击已经引领一个新的时代。AlexNet的错误率远低于当时其他模型,复苏了沉睡几十年的神经网络研究。虽然具体技术方向一直在变,但模型、数据和算力这三者的组合是不变的,特别是当2020年OpenAI发布GPT3后,方向很清楚,需要大量算力。那之后,我们有意识地去部署尽可能多的算力。
梁文锋
只做复刻的话,可以在公开论文或开源代码基础上,只需训练很少次数,甚至只需finetune(微调)一下,成本很低。而做研究,要做各种实验和对比,需要更多算力,对人员要求也更高,所以成本更高。
梁文锋
这个世界需要两种人——一种是抬头看星的理想主义者,另一种是低头修路的实干家。而最幸运的是,我们正成为第三种人:把星光铺成道路的人。
梁文锋
现在可能还不容易被理解,是因为整个社会群体需要被实施教育,当这个社会让硬核创新的人功成名就,群体性想法就会改变,我们只是还需要一堆事实和一个过程。
梁文锋
未来的世界很可能是专业化分工的,基础大模型需要持续创新。
梁文锋
中国的AI不可能永远跟随,需要有人站到技术的前沿。
梁文锋
DeepSeek 也全是自下而上,而且我们一般不前置分工,而是自然分工。每个人有自己独特的成长经历,都是自带想法的,不需要 push 他。
梁文锋
创新需要尽可能少的干预和管理,让每个人有自由发挥的空间和试错机会。
梁文锋
«
1
2
...
87
88
89
90
91
92
93
...
396
397
»