什么软件炒股可以加杠杆 DeepSeek催人老：他们有了“炮灰”的觉悟 | 海斌访谈

你的位置：美港通证券_配资平台查询_在线实盘炒股配资 > 配资平台查询 > 什么软件炒股可以加杠杆 DeepSeek催人老：他们有了“炮灰”的觉悟 | 海斌访谈

发布日期：2025-03-16 01:22 点击次数：202

什么软件炒股可以加杠杆 DeepSeek催人老：他们有了“炮灰”的觉悟 | 海斌访谈

“所有0和1我这辈子都没做，我做的全是看到美国人做了0和1什么软件炒股可以加杠杆，我做1×10、10×100的事。”开源中国董事长马越对第一财经表示。他认为国内的一些知名企业家做的也是类似的工作。

马越是一位在科技领域闯荡多年的老兵。DeepSeek以及人工智能的进展，让他感慨新一代的科技创业者，更可能做出从无到有的创新性工作。

人工智能正在开启大航海的时代，没有人手里有明确的航海图，但年轻创业者们更有冒险精神。“我们看现在的大模型公司，谁家的研发团队大量聘用年轻的研究员，并给予充分的授权，它的发展一定很好。如果一个厂家有太多的学界、权威、层级很多，它的研发效率多半比较慢的。”MiniMax副总裁刘华也说。

炮灰的觉悟

马越生于中国改革开放之前，既经历过中国的贫困时期，也见证过中国的经济腾飞。

尽管他是一位连续的创业者，而且在科技企业里有所成就。但他回头看自己的过往，他这一辈人从小受的教育的经历等，塑造了他的工作方式。马越自我调侃“也就这么点出息，没有想象能力”。

在科技领域，想象力与创造力紧密相关。那些科技发展历程中颠覆性的创新，比如半导体、计算机图形界面、智能手机以及大模型等，都是从美国市场上走出来的。

马越认为，一些国内知名的企业家，做出的也不是开创性的工作，而是摸着石头过河。过去二十年间，中国市场上风生水起的搜索、电商、云计算等概莫能外。

这一轮的大模型浪潮，OpenAI珠玉在前，但DeepSeek是中国创业者带来的惊奇。

DeepSeek一夜之间给美国股市造成万亿美元的蒸发。它以史上最快的速度触达了上亿用户，B端的企业投入开源模型的怀抱。它也改变了很多大模型企业的发展道路。

OpenAI在考虑某种形式的开源，百度也摒弃闭源道路，转而选择开源其最新的大模型产品。

一些初创型科技企业，此前融资数亿，购买算力卡，训练自己的模型，在尚未成功之际发现DeepSeek以一种更具性价比的方式实现了更优的模型性能。关键是，DeepSeek开源，任何企业都可以学习模仿，并在此基础上二次开发。

大模型公司的估值和融资机会，因此受到DeepSeek的压制。

“过去的估值都建立在做这件事必须投大钱的基础上，因为起手的目标融资10亿美金，你不给我100亿美金估值都不行。”一家投资机构的合伙人认为，现在融资会变得更难了，“大家觉得你不需要几十亿美金，10亿美金是不是就行了，几亿美金是不是也能干得不错。”

科技创新的代价一直很高。一些大模型企业此前为研发、预训练而做的巨大投资，面临迅速贬值。

“中国本身这种沉没成本就是巨高。”马越说：“今天的积累都是给年轻人做土壤，我们变成炮灰。产业烧了几百亿，可能最终成就的是DeepSeek这样的公司。没有一点问题，我乐见其成。”

OpenAI没有出现在谷歌，也不是诞生于亚马逊。DeepSeek并非产生于腾讯或者阿里巴巴。

马越认为，颠覆式的创新，大厂很难。国内大厂习惯了拿来主义的路径依赖，内部是职业经理人的思维，“我完成 KPI还不简单，写PPT就完了，我跟自己较什么劲？彻底的创新这件事儿，大厂员工背着免责盾牌搞创新，拳头根本挥不开。”

新一代的科技创业者，更可能做出0-1的、从无到有的创新性工作。

“至少比我们这代人靠谱得多了。”马越表示：“因为我们穷，没想象力。年轻人现在不应该这样了。”

大模型创新靠谁

中国大模型向前发展，推动力是什么？

“我们认为依赖于高度组织化精细化的研发团队，它绝对不仅仅依赖于学界权威、院士、教授、博导。”刘华说。

MiniMax是大模型六小虎之一，它的产品已经开始落地海外20多个国家,是中国地域覆盖范围最广的大模型开放平台。

2017年，谷歌几位员工提出Transformer架构。大模型刚出现的时候，是以Transformer为底层架构的稠密模型。但是经过八年发展，企业界认为Transformer碰到了它的瓶颈。现在企业在探索非Transformer架构，稠密模型已经被逐渐放弃，MoE（混合专家模型）成了共同的选择。

“Transformer处理任务的长度跟它的算力消耗程度是成平方的关系。比如我现在处理100Token任务的算力消耗是一个恒定值。如果处理10000Token的任务，处理的任务增加100倍，算力消耗要增加100的平方，一万倍。”刘华说。

随着多模态的发展，大模型处理Token的规模远不止百倍增长，将来可能是万倍。大模型解决超长文本处理能力，需要研发新的模型底层架构，MiniMax选择的是线性注意力机制，其新一代的MiniMax-01模型，可以做到基本性能和GPT4o、Claude3.5齐平，但是能够处理400万Token的长文本，是4o和Claude3.5的20倍、30倍。

MiniMax在2023年拥抱MoE架构。大模型研发的底层框架迭代，MiniMax的经验是，要去聘用年轻的研究员，给予充分的授权，让他们敢于尝试新的思路，让他们用充沛的算力做大量的实验，才可以敏锐地捕捉到大模型迭代的方向。

刘华表示：“现在的大模型公司，如果谁家的研发团队是大量聘用年轻的研究员，并给予充分的授权，它的发展一定很好。如果一个厂家有太多的学界权威、层级很多，它的研发效率多半是比较慢的。”

马越认为，中国传统文化里缺少对年轻人的尊敬，更不必提敬畏了。老一辈的人都是基于功利主义，而年轻人的价值观跟过去不一样了。

“DeepSeek是一个年轻的团队打造的，少年强则中国强。我们这种年过半百的封建残余，满脑子的旧认知，一天到晚吹牛也好，抱大腿也好。”马越说，“你得有觉悟，我们这一辈子到今天是给年轻人当梯子的。”

人工智能拉开了一个大航海的时代，年轻人是更好的冒险者。

“新大陆在哪儿，我们不知道，每条海岸线都是迷雾。所有的旧认知都没价值，我们没有罗盘，也不知道自己的方向在哪里，也不知道终点在哪里，所以它才有意思。”马越表示。

举报第一财经广告合作，请点击这里此内容为第一财经原创，著作权归第一财经所有。未经第一财经书面授权，不得以任何方式加以使用，包括转载、摘编、复制或建立镜像。第一财经保留追究侵权者法律责任的权利。如需获得授权请联系第一财经版权部：banquan@yicai.com 文章作者

彭海斌