什么软件炒股可以加杠杆 DeepSeek催人老:他们有了“炮灰”的觉悟 | 海斌访谈
你的位置:美港通证券_配资平台查询_在线实盘炒股配资 > 配资平台查询 > 什么软件炒股可以加杠杆 DeepSeek催人老:他们有了“炮灰”的觉悟 | 海斌访谈
什么软件炒股可以加杠杆 DeepSeek催人老:他们有了“炮灰”的觉悟 | 海斌访谈
发布日期:2025-03-16 01:22    点击次数:199

什么软件炒股可以加杠杆 DeepSeek催人老:他们有了“炮灰”的觉悟 | 海斌访谈

“所有0和1我这辈子都没做,我做的全是看到美国人做了0和1什么软件炒股可以加杠杆,我做1×10、10×100的事。”开源中国董事长马越对第一财经表示。他认为国内的一些知名企业家做的也是类似的工作。

马越是一位在科技领域闯荡多年的老兵。DeepSeek以及人工智能的进展,让他感慨新一代的科技创业者,更可能做出从无到有的创新性工作。

人工智能正在开启大航海的时代,没有人手里有明确的航海图,但年轻创业者们更有冒险精神。“我们看现在的大模型公司,谁家的研发团队大量聘用年轻的研究员,并给予充分的授权,它的发展一定很好。如果一个厂家有太多的学界、权威、层级很多,它的研发效率多半比较慢的。”MiniMax副总裁刘华也说。

炮灰的觉悟

马越生于中国改革开放之前,既经历过中国的贫困时期,也见证过中国的经济腾飞。

尽管他是一位连续的创业者,而且在科技企业里有所成就。但他回头看自己的过往,他这一辈人从小受的教育的经历等,塑造了他的工作方式。马越自我调侃“也就这么点出息,没有想象能力”。

在科技领域,想象力与创造力紧密相关。那些科技发展历程中颠覆性的创新,比如半导体、计算机图形界面、智能手机以及大模型等,都是从美国市场上走出来的。

马越认为,一些国内知名的企业家,做出的也不是开创性的工作,而是摸着石头过河。过去二十年间,中国市场上风生水起的搜索、电商、云计算等概莫能外。

这一轮的大模型浪潮,OpenAI珠玉在前,但DeepSeek是中国创业者带来的惊奇。

DeepSeek一夜之间给美国股市造成万亿美元的蒸发。它以史上最快的速度触达了上亿用户,B端的企业投入开源模型的怀抱。它也改变了很多大模型企业的发展道路。

OpenAI在考虑某种形式的开源,百度也摒弃闭源道路,转而选择开源其最新的大模型产品。

一些初创型科技企业,此前融资数亿,购买算力卡,训练自己的模型,在尚未成功之际发现DeepSeek以一种更具性价比的方式实现了更优的模型性能。关键是,DeepSeek开源,任何企业都可以学习模仿,并在此基础上二次开发。

大模型公司的估值和融资机会,因此受到DeepSeek的压制。

“过去的估值都建立在做这件事必须投大钱的基础上,因为起手的目标融资10亿美金,你不给我100亿美金估值都不行。”一家投资机构的合伙人认为,现在融资会变得更难了,“大家觉得你不需要几十亿美金,10亿美金是不是就行了,几亿美金是不是也能干得不错。”

科技创新的代价一直很高。一些大模型企业此前为研发、预训练而做的巨大投资,面临迅速贬值。

“中国本身这种沉没成本就是巨高。”马越说:“今天的积累都是给年轻人做土壤,我们变成炮灰。产业烧了几百亿,可能最终成就的是DeepSeek这样的公司。没有一点问题,我乐见其成。”

OpenAI没有出现在谷歌,也不是诞生于亚马逊。DeepSeek并非产生于腾讯或者阿里巴巴。

马越认为,颠覆式的创新,大厂很难。国内大厂习惯了拿来主义的路径依赖,内部是职业经理人的思维,“我完成 KPI还不简单,写PPT就完了,我跟自己较什么劲?彻底的创新这件事儿,大厂员工背着免责盾牌搞创新,拳头根本挥不开。”

新一代的科技创业者,更可能做出0-1的、从无到有的创新性工作。

“至少比我们这代人靠谱得多了。”马越表示:“因为我们穷,没想象力。年轻人现在不应该这样了。”

大模型创新靠谁

中国大模型向前发展,推动力是什么?

“我们认为依赖于高度组织化精细化的研发团队,它绝对不仅仅依赖于学界权威、院士、教授、博导。”刘华说。

MiniMax是大模型六小虎之一,它的产品已经开始落地海外20多个国家,是中国地域覆盖范围最广的大模型开放平台。

2017年,谷歌几位员工提出Transformer架构。大模型刚出现的时候,是以Transformer为底层架构的稠密模型。但是经过八年发展,企业界认为Transformer碰到了它的瓶颈。现在企业在探索非Transformer架构,稠密模型已经被逐渐放弃,MoE(混合专家模型)成了共同的选择。

“Transformer处理任务的长度跟它的算力消耗程度是成平方的关系。比如我现在处理100Token任务的算力消耗是一个恒定值。如果处理10000Token的任务,处理的任务增加100倍,算力消耗要增加100的平方,一万倍。”刘华说。

随着多模态的发展,大模型处理Token的规模远不止百倍增长,将来可能是万倍。大模型解决超长文本处理能力,需要研发新的模型底层架构,MiniMax选择的是线性注意力机制,其新一代的MiniMax-01模型,可以做到基本性能和GPT4o、Claude3.5齐平,但是能够处理400万Token的长文本,是4o和Claude3.5的20倍、30倍。

MiniMax在2023年拥抱MoE架构。大模型研发的底层框架迭代,MiniMax的经验是,要去聘用年轻的研究员,给予充分的授权,让他们敢于尝试新的思路,让他们用充沛的算力做大量的实验,才可以敏锐地捕捉到大模型迭代的方向。

刘华表示:“现在的大模型公司,如果谁家的研发团队是大量聘用年轻的研究员,并给予充分的授权,它的发展一定很好。如果一个厂家有太多的学界权威、层级很多,它的研发效率多半是比较慢的。”

马越认为,中国传统文化里缺少对年轻人的尊敬,更不必提敬畏了。老一辈的人都是基于功利主义,而年轻人的价值观跟过去不一样了。

“DeepSeek是一个年轻的团队打造的,少年强则中国强。我们这种年过半百的封建残余,满脑子的旧认知,一天到晚吹牛也好,抱大腿也好。”马越说,“你得有觉悟,我们这一辈子到今天是给年轻人当梯子的。”

人工智能拉开了一个大航海的时代,年轻人是更好的冒险者。

“新大陆在哪儿,我们不知道,每条海岸线都是迷雾。所有的旧认知都没价值,我们没有罗盘,也不知道自己的方向在哪里,也不知道终点在哪里,所以它才有意思。”马越表示。

举报 第一财经广告合作,请点击这里此内容为第一财经原创,著作权归第一财经所有。未经第一财经书面授权,不得以任何方式加以使用,包括转载、摘编、复制或建立镜像。第一财经保留追究侵权者法律责任的权利。如需获得授权请联系第一财经版权部:banquan@yicai.com 文章作者

彭海斌

相关阅读 安徽率先利用DeepSeek等大模型技术推出16个场景应用

安徽省率先在全国省级层面完成DeepSeek满血版(671B)本地化部署,推出无差别综窗、公文写作、语音转文字等16个典型应用,并在全省试用推广。

29 03-11 14:31 DeepSeek在ESG实践中的问题分析

通过专业机构以DeepSeek为基础进行ESG垂直模型的训练,是DeepSeek应用于ESG领域更为高效的路径。

227 03-10 22:18 “万有AI力”的时代到来了

电力便宜,中国制造起来了。AI只有便宜了,才能像电一样无处不在。

374 03-08 11:35 腾讯、阿里、阶跃星辰入局,视频生成模型掀起开源潮

在能力较突出的视频生成大模型中,开源模型已占有一席之地。

190 03-06 20:47 AI进化速递丨DeepSeek回应“理论日利润346万元”

DeepSeek最高日赚346万元?官方称理论收益并非实际;清华大学2025年将适度扩招本科生什么软件炒股可以加杠杆,重点培养“AI+”拔尖创新人才。

31 03-02 20:35 一财最热 点击关闭

上一篇:安全配资炒股门户 肥娟小吃店火了,“听劝搭子”洁柔又来整活了
下一篇:没有了