MiniMax 创始人闫俊杰:做大模型,千万别套用移动互联网的逻辑
都还没有解决,或者即使有解决方案,它的实用性和普遍性仍旧有限。具体来说,我认为智能体在以下几个方面的能力亟需提升和优化:
首先是对复杂问题的解决能力。这包括不仅能够完成单一任务,而且能在多步流程中进行有效的推理和交互。在实际应用中,用户的需求往往是多样和复杂的,因此智能体需要具备处理这类问题的能力,这就涉及到分解任务、协同工作和逐步执行等方面。
其次是上下文理解能力。智能体需要能够保持对上下文的持续理解,以便在对话或任务执行过程中,能够正确解读用户的意图和需求。长时间的对话中,上下文的保持和更新是一项巨大的挑战。我们希望通过增强记忆机制,让智能体在多个交互中能够记住重要的信息,并在合适的时候进行调用。
再者是工具使用能力。许多智能体在接受指令后,能够理解执行的步骤,但对于如何有效地使用外部工具(如网络搜索、数据库访问等)仍然存在短板。提升智能体与工具间的互动能力是提升其智能水平的重要途径。
此外,规划和决策能力亦不可忽视。智能体应当能基于获取的信息,自主制定合理的计划,并在执行过程中根据环境变化调整决策。这样不仅提高效率,也增强用户体验。
最后,情感和社交理解的能力也是一项重要的扩展特性。现有的智能体在与人类进行情感互动时,往往缺乏敏感度和适当的反应,而这往往是用户满意度的重要因素。通过对情感的理解和合适的社会互动策略,智能体能够更好地满足用户的情感需求,从而提升用户的整体体验。
综上所述,虽然我们在架构上已经为智能体的未来发展打下了良好的基础,但要实现真正的智能化,还需要在多个层面上进行优化和创新。我们相信这一系列的技术进步将会推动整个AI行业朝着更高的目标迈进。
今天的节目就到这里,感谢您的收听,希望您能继续关注我们未来的更新和讨论。 是由学书界定义出来的。举例的比如说代码,对吧?比如驱动这个代码,这个进步的一个很重要的Benchmark就叫斯文Bench。Bench的话,就是模拟的这个软件工程师的工作。这个Benchmark在一年前的时候,它的分数,我记得应该只有十分左右。而现在的话,其实已经有七十几分了。
为什么你们这次没有测这个Bench?这是我们下一个版本要来增加的一个东西,就是代码的能力。其实比如说像东文台里面,也有一些类似这样的Benchmark,比如说东文台的一些Adent,它其实也有非常复杂的一些Benchmark。其实这本需要做的事,它的实质就是说把你认为下代的AI需要具备的能力,把它定义成一些Benchmark,然后刷这个Benchmark,并且让这个刷的过程是可以泛化的。就这个东西值得这个AI建议的路径。
在技术上,我去刷这些Benchmark和我的计算架构,是分开了两件事吗?其实是一体的,相当于是说计算,你可以认为是说那个架构指的是你的计算的Painton是什么样的,而那个能力呢,是按这个Painton计算,那些参数具体是哪些参数。那么你怎么去判断我选的这个架构,它去得到这些能力的上限会很高啊?是靠你的认知吗?还是靠什么?这个的话,其实一方面靠认知,但也要靠很多实验。
实验?对,因为决定了很多不同公司的研发效率,一个很重要的东西是说,首先你这个认知要对。不同公司会不一样,但有可能两个认知都是对的,只是说不同认知会导致你做的方法没有那么一样。但可能毕竟分对错,有可能每个认知指导最后它都是对的。其次的话,就是说这是一个认知,但这里其实有大量的细节,这些细节没法靠人拍,需要靠设计很多实验,然后一步一步来验证,并且这面很多步骤之间是相互偶合的,应该先验证啥,再验证啥,这面的话其实是有很多的讲究的。
那我们平时会认为是说,现在我们的研发能力比几个月之前变得更强了,比区域变得更强了。而我自己一个最直观感受的方式就是,我们在恒大公司来探索的实验的设计,是否比之前的设计水平更高,这成为一个非常核心的能力。这种能力其实很依赖于团队的合作。
为什么Minimax这次的更新没有提到OE放箱的一些进展?这实质是因为我们自己觉得还是需要把某一步做得很扎实。其实做一个看上去像OE的东西是比较简单的,因为只要把OE的数据来,蒸留几千套数据就可以了。你们是做过这种实验了吗?我们内部做过这样的实验,最近有不少这样的学术论文,这个事起码是一个业内的共识。
我们自己其实并不太需要蒸留几千套数据来说自己有个OE,然后发布个什么新闻告。我们其实还是希望自己,因为第一,我们的业务不依赖于我们是否有OE,在目前对吧。第二个方面其实是说更诚意来说,我们需要把每一步走得比较扎实,所以至少在目前吧,我们并不太需要说号称我们做出来一个OE。
因为OE也被认为和agent是非常相关的,它也可能会打开agent的应用的很多可能性。对,因为它可能会提升每一步任务的准确率,就这样的东西是结果的,就是架构和它的能力。所以你觉得OE是一个能力的?对,就是推理能力,是一个benchmark的那部分。
我觉得是吧,但这个benchmark其实推出来的是说训练方法有什么变化。你刚才说你们下一版本就会去强调coding的这个能力,实际上不管是coding还有planning,还有规划,对吧?那么这个算是OE方向的一个进展吗?下一版本你为什么不叫O3方向的进展,或者叫O系列?我想说就是这种方法。
我觉得可以这么来看,但具体它是哪个,我们还是得需要做些实验才能最终确定下来。那你刚才小小透露了一下,所以你是认为你们下一版就能做O3的效果?没有。我觉得这个事其实主要取决于我们认为核量这个能力的benchmark市场。例如,像O3就技术O3,其实在多么泰的benchmark上,实际上集成的A纪曼克上分数也是非常低的。
这是为什么,我其实不太知道,因为我们并没有做到O3的水平。我其实不是说我们需要更多的实验。但我想说的事情是说,即使O3展出的能力距离一种都不太雷近,其实也是不太够的。因为你刚才说你们的想法是一步一步的扎实地去做。
确实,Minimax不是第一批跟进O1的公司,因为像阿里通议、TMDipSea、智朴,他们都已经有一些发布了。在你的规划里面,它一步一步的优先级是怎么判断的?我觉得这个东西取悦于这么两个事吧。首先是说,我觉得一家公司不应该指望所有事情都一定要是第一个。它的实际原因是因为第一,公司能力是有限的,这是个可观现实。
第二个方面,在过去两年,最终在那个领域里,能把那个方向做得最扎实,把自己的长处能够充分发出来的那样一个公司,不管在中国还是在海外,其实都是这样的。所以我自己觉得早一个月晚一个月,其实还好吧,因为AI还是个很长期的事。核心还是说自己的能力能不能真的把那个事做到最好。然后这个东西来思考,所以说,它确实早一个月晚一个月,好像不是很重要。
那你的优先级是把自己,还有多么太能力放在前面是吗?因为你们这次还有一个视频的更新。对,因为我们需要一步一步做。那相当于这个东西,其实又等价于是说,你是不是真的可以做后面的事,对吧?后面的事出成绩最快,前面的事是不是可以忽略?那这样的话,显然如果不做前面的事,确实可以出成绩更快。
但是我们认为它没让人做到最好。你可以非常明显地发现一个行业里面,不管在那个三大号里面,其实也只有做到最好的那一两家,最终才有价值。可以说这种比较常上下文的记忆能力是现在很多会社比较忽略的一个。对,我觉得实质上是这样的。思考我们每个产品,或者大家说的每个赛道都应该是这样的。比如说,当前你可能会领先一点,或者落后一点,不管是什么工具产品,什么预额类的产品,各种各样的东西。
那怎么样决定你到底要不要做呢?或者怎么样决定是不是应该把这个东西关掉呢?或者应该是有更大的投论,它的实质一方面取悦,现在的时期的情况,另一方面更重要的东西是取悦你认为这个领域足够收敛了,那么在这个里面的话,你到底能够创造多大的独特的价值,我觉得本正是取这件事。
AD的话其实也是一样的。如果只是OE、OR53这样东西,它其实是有一定的价值,但它并不会带来那么大的变化。它最终呢,可能还是得需要,比如说AD的这种产品形态能够比较清楚,真的能够带来很大的效率提升。这个事我觉得还是需要一个时间的,虽然说已经快了。我其实我们真是需要做的事还是说,假设这天到了,我们的技术是不是足够solid的,对吧?但好像并不太取决于我们是第一个做出来的,还是第二个做出来的,或者说我们别人找了一个月。
我看OpenAI去年7月他们提了一个AGI的五阶段的路线图,其实这个思路跟你刚刚说的类似,就是我可能要知道我大概一个阶段、一个阶段怎么往前走。那他们这个五个阶段是聊天机器人、推理者、智能体、创新者再到组织者。然后我看MIGMAX这一次的更新也是,除了你们文本的这个更新之外,你们有一个视频的模型就是VL01,你们也是比较看重大模态能力的。你觉得大模态在这个路线图里是什么位置和作用?
这个事我觉得其实是非常重要的。比如说Editor,Editor的核心就是能够完成复杂任务,比如说可以完成一个医生的任务。那如果他不会看,他其实没法完成医生的任务。比如说我要做数学题,如果我不会看,我也没法做几个题。我觉得有两种方式来看多模态,一种方式的话你可以把它看成这个模型原生的,它就是这个模型的一部分;还有一种方式的话,它不是原生的,就是先有一个原模型,后面又加了一个多模态。但不管怎么样,这个事其实都是避免不掉的,就是多模态一定是在这个路线图里一个很重要的位置。因为如果不在的话,不管是刚才说的A或者B,它很多事就是完成不了的,就是到不了智能体的这一步。
你怎么看有一种观点认为视频生成的能力对智能的提升没有继续去迭代基座的大原模型,对智能的提升要大?我不知道这是一个判断还是一个解释,但我记得感觉是说可能不同人对智能的理解不一样吧。我对智能的理解是生成内容这件事本来就是智能的一部分。我觉得现在大家比较关注OE这个方向,包括它和Agent,还有一个很强相关的原因是因为它显著提升了编程的能力,而很多人会认为就是Coding是Agent第一个落地的场景,之后AI在数字世界取自有行动的一个基础。
那你说Cursor是Agent吗?你觉得它是Agent吗?我觉得算是吧。对,我觉得它其实是符合你刚才说的复杂任务的定义的。但你要想一下,比如说Cursor一开始成功是基于G的Cloud的Solent 3.5,但Solent 3.5并不是一个OE系列的模型。相对来说,现在的Coding人物,或者是大家广泛使用的基于AI Coding的产品,其实并不是基于OE系列模型产生的。
并且说比如说在两个月前,Gate Hub就开始集成那个OE,对吧?好像它也并没有变得比科技的体验更好。对,你说到这个,其实有一个有意思的现象,就是OE之后,反而是中国公司跟进的比较快,就相比美国其他的像Google和Solent 3.5。我觉得最终的大家应该是一样的。
就只是因为中国公司看起来更快,因为中国公司大家可能认为蒸留是一个可以做的事,因为中国公司多,大家可能都这么来做,也没什么问题。美国的话,我猜像Cloud或Google应该不会说去蒸留一个OE。对吧,如果让他们去蒸留一下,应该也是很快的。
但是坦白说就是从这个正确性来说,我并没有办法说蒸留是一个错的事,不同的有不同的看法。那所以Google和Answer Peak不做这个事是因为什么?是因为技术的傲气吗?我猜应该是为了做出来这件事,他们应该有自己的思路吧。蒸留是一种捷径,可以这么说吗?
我不知道能不能说它是捷径,它肯定是一种路径,但路径是不是说它就是捷径这个见仁见智吧。我说捷径的意思是,它更快达到一个效果,但可能会有一些不知道的代价,比如说你中间有些步骤没有做得很实。对啊,这个的话,它其实在文本里面也发生过一次,对齐税嘛。对齐税的意思就是说,比如说如果把模型对齐GPS的结果,那就会让这个模型的能力受到一些限制。
在OE出来之后,其实也有很多讨论就是说它开去了Inference Scaling这样一个趋势,你怎么看这个趋势,包括你们接下来会怎么去响应这个趋势?我觉得这个趋势其实很早就有了,它并不是OE才有的。原的话是因为很早大家就开始意识到是最简单的事,比如说Best of N,意思就是说你采样十次,然后选择最好的,它其实准确度就可以提升很多。
还有更暴力的方式,比如说你可以Best of N一千,那又能继续提升。这个东西基本上手段其实很慢的,大家就早就开始意识到是说,你采样越多,只要能选择一个最好的效率,它一定也会变好。那么怎么来采样呢?比如说你必定要重复一千次,对吧。有些更高要的方法,比如说就是这些Trace Structure什么类的,其实很早就这样的东西。
然后还有的话是说怎么样来找入World,只要来分布,就Step by Step,这些东西其实都很早就有了。OE的话,它主要是说把这个东西变成一个端来端的模型了,这个我觉得是它主要的进步,因为端来端可以做这种整体的优化。之前的一个方法都是这种模型已经固定了,然后我怎么样找一些规则,或者是分不同的模型来实现。OE的话就是单个模型就可以来实现这件事,至少看起来是这样的,因为这样的话可以比进一些权力最优。
所以其实效果可以提升很多,但这件事我觉得它基本上就是这样。所以你们肯定本来也有这种尝试。对,因为它基本上是共识吧。你自己觉得agent可能最先一批落地的场景是什么,有价值的?Coding不都隐世了吗?Coding是,对,还有了。
所以Coding这个你是同意的,对吧?你觉得这确实是其中一个,因为这确实是非常显著地提升了工作效率。除了Coding之外,我觉得很快应该会有一类运用就是信息的获取。你可以讲开讲一讲信息获取和agent的结合是什么大致的心态或者思路吗?
我觉得它的核心就是说,比如说现在的信息获取其实是基于推荐的,对吧?其实推荐的好处是说这个内容,大概率是你想看到的,但它并不能保证是说你想看到的信息都能推给你。我举例子吧,我自己非常关心的信息是,比如说我希望每天这个领域内最好的十篇论文我都能看到。但是有时候可能出去玩了,或者怎么样了,也没有打开电脑,可能就看不到。像我的这些内容平台上也并不能满足我这个需求,对吧?打开电脑是我看内容的唯一的办法。
当然我说的是一个偏工作,其实有很多更加顺庸化的这样一些信息,比如说我想听周杰伦的演唱会,他突然间在中国开演唱会我可能也不知道。那如果想知道关于周杰伦的所有信息,我应该怎么办呢?这个我觉得至少会发生一定的变化吧。
据你所知,除了你们在看核市这个方向之外,其他公司有类似的尝试吗?我觉得海外应该有,国内也应该有吧,因为我觉得这是一件很大的事。这个听起来有一点像使用一个新的技术方法的精神头条,我不知道它是啥,但做AI产品的教训是说千万不要用上一代做移动互联网产品的方法论来思考新的产品。
你可以展开说一下吗?就是它可能听起来好像满足的是你类似的需求,但是你说不能用一个方法去思考的一些具体的点吗?其实还是有挺多区别的。就是之前的移动互联网产品会思考的东西是说,比如说有哪些供给,然后有哪些消费,怎么样就一个确定性的方法来做。AI产品里面的一个不一样的东西是说,其实它前提是不需要供给的,因为AI它既承担了分发又承担了供给的功能。
其次的话,AI的能力它又在不停地发生变化的。比如说在一个互联网产品里面,这个产品的体验变好,它其实大概率主要是依赖于是说它的供给发生的变化。但是在AI产品里面,它主要依赖于模型能力发生的变化,或者得到这个供给的方法发生很大的变化。这样的东西它的周期不确定性都是不一样的。
那再比如说增长方式上,其实也是不一样的。比如说在移动互联网时代,大部分的产品其实它,移动互联网产品的增长你看一下AI产品的增长,其实也不太一样。所以说我觉得就这个里面的话,我自己感觉还是挺不一样的。这种agent的产品,你觉得到什么信号,什么指标的时候可能你会有更多的推广?
很神奇就是发现,实际上在海外就不需要做推广,但国内就需要来做推广。比如说其实我们海洛视频在海外其实也没有花过一分钱的推广费用,但是在中国它就需要。我在中国也没有推广。真实的理解是,我觉得如果一个产品特别依赖推广,大概率就是还不太对。
所以就是回到刚才说的那个问题,这个问题可能不是说出现什么信号它要开始推广,而是它应该自己有一个自己增长的动力和趋势。对,我觉得格漏当年它是这样,自己就自来水,它就活起来。其实格漏跟海洛视频都是这样的,新一眼,你们还是做了相应的一定的推广。TALK的话,也有很多这种自然增长的成分,我觉得这个也是跟移动货量实在不一样的东西。
但是这个,我觉得可能也是不同公司之间的区别。如果对一个自己的产品来说,其实很简单,就是看留存就好了。留存好,比如说算LT的逻辑,基本上就决定怎么样。但这种逻辑,我觉得不太适合创业公司。如果是这样的话,什么创业公司的创新是不够的。
就是从格漏当时没有推广到星野和TALK,其实你们有一些推广到后来海洛,因为它是更晚一点的产品,你们又没有再推广,这个变化是因为中间发生什么事吗?是因为自己的认知吗?我觉得不是的,主要原因是因为我们自己的认知的升级。几个阶段吧,从一个没有做过产品到学习大厂的做产品的方法论,到又开始意识到大厂的方法论又是有局限的,然后找到一些我们自己认为更加适合我们的方法。我觉得是这么一个过程。
就相当于格漏的时候是没有做过产品,所以也不知道怎么去推广,也没有做,然后是中间那个阶段我就去学,可能我能看到的最强的人是怎么做的,然后是你意识到我们不能那样去做。意识到那样做有好处,但它也是有局限的,它有可能东西是对的,但是有可能对的时候,比如说它对A公司对,但它对B公司不一定对。
就是说比如说你做一个创业公司,你应该想的事其实就是说,如果它只是一个及格。那么它就不应该是你做,说明你的创新不够。上个月我们跟小马智行的CTO楼天成聊,他有一个挺有意思的观察的,就他有主动提到你们,因为我们在聊L2和L4的一些事,然后他说他觉得大模型里面,minimax做的新业这种产品比较像自动驾驶力的L4,因为完全他不是一个人就他是一个AI在和用户在互动。
然后他觉得像XLGBT,包括他自己用的非常多的co-pilot,他觉得更像L2加。他觉得后者的核心价值可能是未来在商业化的时候会比较难justify,然后他有一个想问你的问题,就是因为L2和L4他优化的目标不同,所以他的技术路线是有一些分歧的。至少在现在,它还没有统一到一条路线上。
就是在大模型领域的话,你觉得就是做这种比较侧重于辅助人来完成工作的co-pilot类的产品,或者说能力吧,和做这种更偏向替代人或者我造出一个AI行动体来产生价值的agent,你觉得这两个事他的路线会有什么异同?
我觉得这个还是挺有意思的。我觉得这个方法确实是不一样的。其实在做新野的时候,我们用了一套非常不一样的方法。你说在做新野的时候非常不一样是指和谁比非常不一样?和XGP这一类聊天机型,还是对,它的方法其实是挺不一样的。
我先不说我们的产品,我就说大家知道的产品,比如说XGPT跟Cloud,你可以发现这两个模型其实表现是不太一样的。对吧?你可以发现XGPT它就是一个助手,它就是帮你马上任务。而Cloud你会感觉到它很像一个朋友,有时候情商还挺高的。有个有趣的例子,这个还挺有趣的,就是说比如说,有个测试的一个用力,你跟这个模型说,一到一板之间随便说个数字,比如说50。
然后你会回他去说,那我就加了50天不跟你说话了。如果是Cloud的话它就会说,那能不能再给我一次机会?然后他会说个非常小的数。如果你有问XGPT的话,他就不会意识到这样的问题,就是他不会有后面那个人性化的反馈。对对对,不会请求能够再有一次机会,然后说一个更小的数字。我觉得这边的核心的实质是说,就是怎么来看待对齐这件事。
安索尔维克有一套自己的宪法,对吧?然后有一些自己的价值观,然后基于一些自己的价值观推出来一些宪法。然后宪法推出来自己的对齐数据,其实是有一套自己的这样一套体系。然后体系导致它的模型具备这样的一些表现,其实不是说它有意识地训取出来的模型具备这个能力,其实是由于它的一些宪法推出来的这种模型会具备这个能力。我觉得其实就是类似这样的吧。
我觉得上线比较高的事情还是说,当然我觉得我们现在其实也需要提升,能够非常清晰地定义出来是说你做的那个东西到底是个啥。能够清晰地定义出来你做的东西到底是个什么东西,对。你说这个做出来的东西是指模型?
对,做出来的模型,这个事我觉得是非常关键的。坦白说我觉得中国跟美国的模型有一个很大的区别。比如说Cold,其实是非常明确地指导自己的模型需要具备什么样的特点;然后OPI它也非常清楚它的模型就是要优化关系码上的一些效果。比如说关系码上也有很多它们自己内部定义的。
然后中国的绝大部分模型的目标都是说对起OPI的输出。当然比如说可能像豆包的话现在开始有一些自己的特点了,但它本质上其实也是这样的。你观察到的豆包的自己的特点是什么?比如说你让ColdGPT给你写首诗,它可能就给你写首诗。
比如说你让豆包写首诗,它又给你写三首,让你选一个,相当于就对用户的场景优化得更深,用户的观感会更好一点。坦白说我觉得国内至少目前大家的模型,还是比较缺乏自己的特点,因为都是在对起OPI的输出。主要是在对起OPI的输出,其实还是比较缺乏从底层开始的这样一些丝毫跟设计的。Minimax也算在内吗?还是你们有自己的想法和特点?我们在很努力地变成刚才说的那种。
这个听起来好像不纯是一个技术上的区别,这跟你的判断有关,你想做一个什么东西有关。对,它其实是一个非常底层的事。这其实是非常妨当门头的一件事。那你可以描述一下Minimax想要的特点是什么吗?大概是什么方向?
我们的不同产品里面的这个目标是不太一样的,还是那个判断追求一家过程。虽然我们没法定义是啥,但追求智能水平更好的路上,我觉得还是需要通过多个产品的不同阶段,不同阶段我觉得应该是不一样的。
那这会导致你们是在同一个模型上,要做不同的对齐,让它去适应不同产品做要优化的方向是吗?本质上是这样的。那么这需要更多资源,可以这么说吗?原来上是需要更多资源,但实际上不太需要。真实的原因是因为做对齐的时候,方法上试错需要的资源,原来比最终训练那个模型要更多。
这种核心是掌握一套方法,而不是说真的训练那个模型。你们接下来会更偏重于Agent这个方向是吗?我指向比辅助人的co-palette。没有,实际上我们现在的产品都不是Agent。我自己觉得,你说的现在的产品指的是新页、新页、涛刻,包括像工具型的这种海螺。
其实我觉得现在这些东西都还没有到一个Agent的程度。这是一个相当于的产品。那你们那个新产品算是Agent?我觉得算是吧。在往那个方向做。对,我知道这次你进入采访想和我们聊你的初衷,也是想讲更多的技术进展,当然也可以讲其他都想。
但是它的实质就是回到一个最开始的问题,一家AI公司,它到底应该是技术驱动的,还是应该是产品驱动的?对,你其实刚才很明确说了你觉得就应该是技术驱动的。对,至少是现阶段,对吧,就至少在原来的。
但这个东西的一方面不想说信仰,我觉得信仰是这样的,另一方面它是一个事实,因为驱动这些产品出来的一个驱动力就是因为技术的变化,还会在快速发生更多的变化。它到什么时候,这个周期会结束?就技术驱动的周期会趋于放缓或者结束?我觉得它一定会有结束的那一天,这个事并不了,但我觉得我们应该做的事或者作为从业者应该做的事是说,让那个进步的周期变得足够长,通过自己的努力。
而且进步的周期足够长是更有利于新的公司的。对,我觉得可以吧。对,回到你刚才说的,你认为Minimax肯定是非常坚定的一个技术驱动的公司。然后你也提到,你们之前做的不好一点是你们的技术品牌做的不好。
比如说我在这个Hacker News上去搜DeepSeek,我搜到了470多个帖子,然后搜Queen就是说阿里的通缉签文,有530多个帖子。对,因为我们之前就是第一的,我们也没有去做这些开源社区,对吧?对,搜你们很少。对,这是我们应该提升的地方。
就是你是接受这个落差,然后接下来你们要去把技术的品牌做得更好,对吧?影响力和你们的技术实力有个更好的匹配。你觉得就是去年到今天,你们实际上做的挺不错的,但是其实外面可能没有那么强认知的技术成果和进展是什么?是这个先行注意力机制吗?
我觉得不是。怎么说呢,我觉得有些东西是我们在意的,有些东西是不在意的。在意的东西是说,我觉得我们真正在意的,包括我们为什么要希望来做很多这样的事的原因,是因为我们确实还是非常在意技术的品牌跟技术的影响力的。
然后这个其实是我们真的非常希望能做好的,而我们不在意的东西是说,比如说投资人怎么看,这种东西其实就不重要。因为我刚问的是说,你实际情况你觉得你们做得不错,但外面可能没有那么关注的东西是什么,你说的你不在乎外界的关注,尤其是在关注什么。
你是想要这个。对,它真的原因还是这个最底层的东西,就是这个行业的变化确实是技术的变化带来的这些变化。那么这个事对招人都不重要吗?重要,所以我们就非常在意我们的技术品牌,所以我们就想把这件事给能够变得更好。
你们在意的是AI研究者,这些人才对你们的技术的看法,而不是说投资人对你们的技术的看法。对,那你正好可以在这个机会讲一讲,你觉得你们做得不错的成果是什么?你刚说不是信心注意力机制,我觉得我们做得最好的还是我们的基础设施和算力相关的东西。
因为我们每天生成的对话量,我们每天生成的,比如说图片的数量和视频的数量,还有音频的数量,其实都还是一个非常精准的一个数字。那怎么样真的能够产生出来这么多的计算,怎么样把它优化得很好,怎么把它调度得很好,怎么把它稳定性做好,有一个非常合理的一个成本,这个我觉得我们应该是业内做得最好的。
这个是靠模型和Infra,还有工程对吧,一起来做到的。我觉得这样是实际上我们最强的地方。算法上的话,我觉得我们都不太,从结果上来说算是比较领先的,把这一点都不太相关的。然后我们的通用的文本,我觉得暂时还没那么领先,但是开始有比较强烈的我们自己的特色了,我觉得这是我们现在的现状吧。
你们这次也是说你们这个新的架构是一个非常大胆的创新,是首次大规模的实现了信心注意力机制。对,这个创新有多大胆,其他人都没这么做过。因为你看有这么多的模型了,对吧?但是我们确实是第一个这么来做的,其他人不这么做是因为大家不认为这是一个好的方向,还是因为这件事很难?
我觉得可能都有吧。具体来说,你们做的时候遇到些什么难点,然后你们怎么解决的?我觉得有可能两条路都是对的,实际上就是选一条路。然后选一条你认为的路,但是选一条路的时候会有一些原因,那把会结合自己的特点,结合自己对一些未来的判断去选一条路。
我最觉得其实就是只要把那条路选好了,然后就走下去,实际上就可以了。你说这两条路是个抽象的两条路,还是说在你们现在是什么架构具体的两条路?和不用这个架构的之间的具体两条路。就线性重力机制,这事不是一个行业共识吗?它不是一个特别强的共识。
之前其实Deepseek在发Deepseek V2的时候,他们当时也提过一个改进,他们提的是那个Transformer里面那个矩阵程的时候,他们比如说用了一些低质的矩阵,那个程的算力效率变得更高。他们叫MLA,他们其实也是做了架构上面的一些创新吧。像这种就是MLA的这种架构的创新,也不算一个特别大的行业的共识是吗?那肯定不是啊。
所以其实现在中国公司也是大家都会有一些自己摸索的,就技术上的一些特点,当然有些避免的我不知道。但至少开源出来的,我觉得我们都还是有些自己的独到之处的吧。你们其实海螺你刚才也提到,是现在全球可能是视频生成的产品里用的人最多的之一。
然后我了解到你们做视频生成模型过程中间也是有些波折的,这个可以展开讲一下吗?其实做查是都有波折的,好处的是说我们已经做过一遍文本了,那其实有些积累。然后当然团队上,之前其实我们也把本身图的东西也完整的做过一遍。
但是缺点的话呢,是说发现这些infer完全没法复用,因为视频的infer跟昨晚上的infer其实不太一样的。那算法上其实也有很多的变化,然后怎么来做实验呢,也有很多的变化。怎么来做评价呢,那就更不一样了。我觉得它就相当于说又新长出来一家公司。
你觉得2024年过去之后,视频生成模型到了一个很实用的状态吗?我觉得确实这个里面还是有很多用户在用,并且很多用户愿意为它来付费,说明它还是有实际的价值的。并且是说这些产品你发现它周一到周五的使用量其实要远大于周末的使用量,说明它还是强生产力的一件事。
但是那问题其实也有很多,对吧?比如说各种各样的画质、物理的这种移植性、然后生成的速度,反正还有很多这样的问题。我觉得它就出来这么一个状态吧。因为2024年3月的时候你当时有一个预测,你觉得2024年视频生成模型会变得很实用,你觉得整体上来说它是达到了还是落后?
我也达到了吧,就刚才我们聊了你们做文本模型,包括你们新的架构更新,还有视频模型,这些过程,总结来说Minimax的研究和开发实践里面,你们的技术团队的优势特点,还有方法论是什么?可能表达的不一样是说我们这儿相对来说还是比较客观的,我指的客观的意思是说,有可能我们的目标定的不太对。
但是一旦我们能够找到一个正确的目标,我们做的这套效率和深度都还是能做到比较好的,这个为什么叫客观,非客观的意思就是评价它的时候有很多取舍,有很多trade-off,就是会考虑很多有的没的。比如呢?要考虑很多,比如说各种各样的一些平衡,外界的影响,团队稳定性,会考虑很多这样的因素。
所以你说的客观是指你们对一个技术成果的评价是很客观的。对,就是看它是否达到了我们当时设定的这个目标。对,那难道这个行业里很多公司它不客观吗?我觉得不客观。怎么讲?因为很多时候大家会考虑很多东西,别人怎么看,然后这个东西让大家的士气会不会受到影响,会考虑很多这样的东西。
那你能通过什么方式,比如说我本来这个模型可能没有达到我的目标,但是我能有一个什么方式给它包装成能达到吗?还是有办法的。那除了这个还有什么特点?我觉得本质的不一样是说,我们这边沟通方式还是比较简单直接。对,因为我这边也没有啥层级级什么之类的这种东西,所以就是客观的,然后比较扁平和灵活的,沟通比较直接的。
对,比较扁平吧,灵活我觉得也是一个优势吧。灵活指的事情是说,我们可以所有不同的方向之间经常相互来支援这些东西。你好像没有怎么去强调,比如说人才密度啊,比如说我什么有多少竞赛的奖项的这种。对,这是一个好的问题啊,我觉得自己的人才密度实际上是最高的,其实不是财公司,这件事是在二三年就是如此。
还是二四年,他们非常积极地去到处招人挖人之后才变成这样的。你这么想吧,比如说有些自己的人去了欧坡爱工作对吧,但是没有其他公司的人大批量地去欧坡爱工作对吧?说明那他市场里面有些人的标准还是足够好的,对吧?
所以你觉得你不去强调这件事情也是一个客观的表现?对,是,因为我们不想就是一定要把自己包装成怎么样,对吧?对,接下来可能我想聊一些那个模型应用一起做这件事的一些变化,因为这个是你们一开始的战略,但是在2024年这个行业有很多变化,包括开源和闭源的差距。
其实在缩小,还有对大家讨论很多,这个skin law遇到瓶颈,其实你刚才讲了一部分,就是你觉得模型和应用它其实分开的一件事,但如果是这样的话,为什么一个公司不能?我觉得不是分开的,应用是模型驱动出来是七颗变化驱动出来的。起初商业法律上面其实是没有明确的限制,这个其实是在后面的。
但实际上是说模型不一定决定应用能做到的程度,模型这方面做得再好。那如果是这样的话,那也许有些时候决定你们应用程度的一些东西也跟你们的轮转能力出自行是有关系的。这个是一定的,但你想一下不同公司模型和产品决定的状况是完全不一样的。
每个公司的发展状况还有产品的进展都是不一样的,哪怕上游的技术学研究或者一些前瞻性研究,这些东西都对这个事情会产生很多的影响。所以说这个也是一个相互刺激吗?对,形成一个有机的关系,最终…
这个模型是核心的一个背景,接下来就是过程才能达成的一个应用的最终结果。对,模拟模型,反正跟实际应用比较明显的点,决定这一段的目标。这个过程其实有很多的变化。讲到目标,可能就会觉得长久以来,每个公司最重要的最终目标其实都是为了能出产品。
我觉得这个是目标的问题。目标主要是八个方面。 发展的路径是这样,并且我们认为,加来的。如果有一些更新的产品,大力也都是这么来长出来的。我刚才说是历史导致的,我的意思是,因为你们在21年底就成立了。
当时其实整个大模型并没有什么很好的基础,所以你肯定是得先有一个技术的进展,你才有一个产品的进展。对,这个东西就变成了我们做多个产品的一个思路。然后Midmas没有变成只做应用的公司,可能有一个原因,我上述的那个历史原因是因为你们成立得更早。就有可能,比如说你更晚创业,也许你会做一个只做应用的公司吗?不会吧。我觉得一定会存在这两种类型的产品吧,就是基于向着技术做出来的产品和基于未来的技术做出来的产品的公司。我觉得我们大力就只能是后面一种。
你觉得你想做基于未来的技术做这个产品的公司,是因为你想做一个更大的公司吗?我觉得不是,就这两点东西都是有意义的,对吧?那既然都有意义的话,我猜可能思考的角度可能不是想当想,它既然都有意义,那就做自己最能够发挥出来的那样一件事就好了。就是你觉得技术是你更能去发挥你的专长的一个方向,或者是这家公司吧。所以说其实我觉得并没必要纠结两个朋友哪个对,实际上两个东西都对了,你擅长啥就做啥就好。
去年其实你说过,就是现阶段模型性能和产品体验是直接正相关的。但另一方面就是,你有了一个模型驱动一个产品和应用出现之后,这个产品后面的表现其实就不完全跟模型相关了。对,那比如说你们去年做这个海螺,你也说其实没有做出来,表现是比预期的差。就如果复盘下这个事,你们是哪些地方可能不如对手?我觉得就没有坚持技术驱动,在海螺上没有坚持技术驱动。可以讲一下在海螺文本上,那本质上就是说你发现有很多问题的时候,比如说有些用户用的不满意的时候,那其实解决思路不应该是去来补这些counter case,应该是找到一些真正的提升方式。
那你真的觉得海螺的体验是不如其他产品的吗?我觉得在三月份的时候是,但是在五月份的时候其实就不是了。但是那个时候你已经没有这个产品的这个门类的心智了,对吧?比如那时候可能KIMI是最火的。不是的,那个时候其实我就知道豆包会赢。因为其实在那个时候,豆包的体验就比其他的体验要显得到好了。
所以你五月就知道豆包会赢?对,一个是知道了他会赢,一个是那个时候就开始意识到是说,就是我最开始说的那件事,就是说其实有了更多的用户并不会导致模型的能力提升,然后在那个时间点来说,我觉得就是我们找到一种办法,让我们能够负担更强,让模型能力提升可能是更重要的事。当时我记得海螺有段时间推送也特别多,比如说我已经是海螺的用户之后,它老给我推那个,所以说这个东西其实就是因为没有那么技术驱动的时候导致的一些结果。我感觉23年的时候你就有这个认知,这个东西我觉得也是创业过程中的成长。
其实这些认知它是很简单的,只是有的时候就是没那么坚定,就是你执行的时候可能没有那么坚定。我觉得至少在那个时间点的时候是这样的。回头看,你是被什么东西干扰了?你是被周围的,比如说同事或者说投资人的一些想法压力吗?还有竞争对手。我觉得是人吧,有的时候会考虑一些人的感受吧。你主要指的是团队里的人的感受,对吧?
你什么时候开始变得更无情了?其实现在也没有了。可惜呢,变化就是说你认为那些最对的东西其实是要非常明确地讲给大家的。就是有些事是没法妥协的。然后另一方面,你们的社交陪伴类的聊天产品是中国表现最好的,就是星野,其实它比字节,包括美团这些大厂做的同类的产品表现都好。那你怎么总结,就是星野成功的因素?我觉得还没有成功吧,或者说它暂时领先的因素吧。就甚至比可能做了这一类产品的公司也做得好的,原因是什么?可能就是因为我们更懂吧。
首先是说技术路线一定要选对,这是最关键的。其次的话呢,就是做决策的时候更懂用户。但这边如果说一件事的话,我自己觉得还是技术路线要选对。技术路线选对是前提,然后是做决策的时候更懂用户。对,你后面说的那个决策,是指产品决策还是指什么决策?因为像星野这样一种产品可能大部分人我才可能不太会特别懂它的用户到底在想啥,你怎么懂得呀?你通过什么方式懂的?其实我觉得它的用户跟你不是一种画像跟你自己。我觉得这件事,它的实质是,这个东西还是需要挺多同理心的。所以你是个同理心很强的人?我觉得是。
它的实质是说,就是大部分做技术的人都会觉得自己很牛,会觉得自己是天才,但是我不是这么来认知这个世界的。下面我想聊一下,就是现在越来越激烈的大模型的竞争。最近我看到一个帖子,挺有意思的,就小龙书上的一个帖子,这个博主叫秘密知识,他排了一个六小龙加deep seek的生存指数,你猜你们排第几?你猜minimus排第几?我不知道,排第几是越小越好,越高越好,就生存指数,从高到低的排名。我觉得我们应该还行吧。
对,他给你们排的是第一,核心是产品力不错。我觉得首先感谢认可,但是我自己感觉是说,分成什么AI极小龙这种东西单独是一个track,我觉得这件事其实是不太对的。因为在小时候有很多这样的帖子,但是我觉得核心是说不应该把AI的创业公司单独看成一个track。应该把AI公司看成一个类别,就是把大厂都算进来,对,就比如说你看美国,对吧,他也不会说open card是一个track,对吧,然后google是一个track对吧,其实也是放在一起来看。
对吧,这么来看,我觉得才是更客观的。但是如果这么来看的话,我觉得其实对创业公司的要求肯定也要变得更高了。因为光在创业公司也是好的或者不好的,其实意义不大的,应该是整个AI在一起看来才更有意义。对,他本来看的也是存活率,可能他的假设是大公司不会那么容易要,对吧?对,然后我也去问了一些你们的投资人,就有一个投资人的想法是觉得你们非常纯粹,以及他也提到的产品最早开始产品化模型工程化和产品化团队都具备的国内的创业公司,他觉得只有你们,反正其他有公司也都还不错。
我觉得制谱也挺好的。你觉得制谱也挺好的?实际上我说一下,我觉得有两个公司还是不错。首先我觉得Deep Seek确实还挺不错的,因为我觉得他们也是很纯粹的。我觉得制谱也还不错,我说一下为什么我觉得制谱不错。比如说刚才你提到OPEI有那个路线图,对吧,R1到R5,其实制谱也是有自己的路线图的,并且别的东西,他们确实是很坚持在做的,对不对?不同有不同的观点,但他们至少是有自己真的一个路线图。当我们先做的,虽然说我不直接认识唐老师,但我觉得他们至少是有自己的坚持跟思路的,他们应该是最早有自己的路线图的,这点我还是挺佩服的。
对,我想补充问一下你关于AI的路线图是什么,就是OpenAI有他自己的一个路线图,那你的设想是什么?坦白地说,我觉得这一点是我们自己在慢慢加强的一件事。你看我们这个墙上写的就是Intelligence,我们一开始只是明确了Intelligence是有意义的,然后我们做的方式要跟运户在一起,然后我们需要一步一步来提升,这是我们一开始的定义。但一开始我们其实并没有非常进去的定义每一步到底是啥,这个的话是一个客观的一个现实。然后做的时候其实我们一开始基本上就是,实际上情况是说,有点是一个这种叫逃出生天的这种逻辑,比如说认为最开始的时候,比如说我们做这种聊天类的,然后做这种能力更强的,能力更强的,然后又分几步,我们大概是这么来思考这个问题的。
坦白地说,其实我们自己是没有一个举例子,比如说欧潘的话,它有那个L1到L5对吧?但是其实我觉得这个L3是有意义的,因为比如说L4是长什么样,其实并不会影响到它们任何的技术路线。L4它是创新种,对,那个事儿其实并不会影响到欧潘现在做啥,只有L3视察影响到它们现在在做啥。对,因为智能体是下一步。首先我觉得还是应该是这个假设吧,第一的话是说我们认为AI的智能程度很重要,这个东西是能进步的,其次的话是说真正影响的,其实只是下一个东西的视察,才真正影响现在做的东西。
你觉得从我们2024年初那一次聊到现在,中国大模型行业的竞争格局最大的变化是什么?我觉得最大的变化是说,在2024年的时候,那个时候可能很多人认为AI就是一个移动互联网,只是把这个事儿给复制了一遍。我觉得现在的话,至少是有些人开始意识到,其实AI不是,就是把移动互联网给复制了一遍,这里面还是有很多自己独特的东西的,就是这是完全两件事。这个怎么影响到竞争格局了?这个你说的其实是一个对这个事儿的认知有一个变化,它一样的格局是说,就是不是只有我说按照移动互联网那套思路来思考自己公司的组织形态,然后产品业务。
那你怎么看,就是移动互联网时期积累的一些优势,大公司当时积累的一些优势?我觉得还是有意义的,但它可能不是唯一的一条路,原因实在于是说,那些东西是有意义,它可以让你有跟它利用规模,但它其实不会导致是说你的智能程度变得更好。不会导致你的智能的程度变得更好,就是因为它那是产品上的优势。对,而像你所说的,不是说你的产品用户越多,你的模型就会自然变好的。更好的智能程度,可能会导致新的东西出来,然后新的东西也会有新的东西的商业模式。
然后在全球的话,我们也可以观察到,比如说像产品形态跟你们有一些相似的这个CLUDER AI,它是选择回到大公司,就是Google是花了25亿美元收购了它的部分团队,这可能是Millimax的选项。 我觉得它其实非常明确不是,因为我觉得我们自己还是比较坚定的,就至少我们在决定做什么东西,不做什么东西的时候,包括做一些决策的时候,好像其实确实是没有考虑是说怎样把自己能够卖一个价钱。这种东西其实确实还是比较单纯的是说想把公司任务做好,然后技术上做好,产品上有更大的价值,然后公司能够长期发展,这个基本上就是其实说我们大部分的决策确实都是这么做的。
我去年看到这个新闻的时候,当时不是给发了这个信息吗?然后你说感觉是一个happy ending,我觉得对他们来说确实是一个happy ending。那个Nome,他本来就不喜欢自己的那个产品,他确实他就想回到Google,他回到Google之后做得也还挺好, 据说那个节目的2.0应该里面就有很多他的贡献。你说是指那个founder创始人,对吧?对对对。有一个传闻向你求证一下,就说字节24年初的时候和你们谈过40亿美元的估值来收购你们,没。没有。对,好好证明一下谣言,就完全没有这个事对吧?对没有,那这确实也是一种市场现象吧,就是大家老是会传,比如说这个公司可能要被谁收购,那个公司可能要被谁收购,最终你发现这个事还是比较简单的,还是就是你坐下来查东西,你和张一银聊过吧?我是只交流过。对,聊过几次。
你愿意和他交流的原因是什么?首先你要做的假设是说,他们的信心密度肯定是比我们强的,这个东西我觉得是一个假设。就不应该假设是说我们知道什么东西他自己不知道的,对吧?那如果知道这样的话,那其实也没啥好害怕的。你跟他聊的话你有什么收获吗?我觉得就是你知道,在你面前一个非常顶级的企业家他是什么样子吗?所以你关下到了他是什么样。我觉得还是很希望能够给这个社会带来很多正向价值的。然后说会到融资的这个事,就是24年可以看到的一个现象是,24年到下半年很多投资方已经是走到了国资轮还有中东轮,感觉后面就是能接力的人没有那么多了。你们后续要怎么持续获得比较充足的担要?反正我们还没有到这个地步,就是这个事。我觉得实际上还是取悦于这样,就是作为一家公司,应该思考的问题是说,这个公司怎么样做出来自己好的东西,然后怎么样变成一家真正的公司。
公司也好,特别依赖自己的这个演化能力,这是现在的现状,不应该考虑的问题是说,就抱个大腿然后啥都不用干了。我觉得不应该这么来考虑这件事。对,其实你去年就说过你不相信中国的大某性创业公司能重考融资,你觉得真正的拐点它会来自于技术产品或者商业化的效率的领先。对,然后我了解到你们24年的产品和收入其实都没有实现年初定的目标,你会怎么复盘这个事?它也是最快的。对,你们比别的公司要快要好。所以是你目标定太高了?我觉得不是,我觉得核心是,在一年前的时候,当时我们还认为是说,就那个时候,其实我们会把,也有看成还是一个移动互联网,还是那样一个认知。
但是现在的话,我们那个东西之后,我们开始意识到,其实这是两回事。所以当时定的DAU的这些目标是根据移动互联网成功的产品在它早期的增长来定的。对,我觉得它的实质其实这是两个行业,所以你对这个事复盘是24年初当时定目标的那个逻辑是不太对的,因为你按照移动互联网去定,逻辑是不太对的。对,那你现在会怎么来去设立目标了?实际上我觉得在这个阶段,真实的情况是不应该定一个收入的目标,其实应该定的是说这个技术研发的目标。是因为做出来的东西导致有了那些业务跟用户的产品的变化,不是因为是说我们认为需要做到一个什么样的产品变化来倒退出来,我们需要来做什么样的技术,这东西我觉得是一个本末倒置的一件事。
你们2025年就是这样定目标了是吗?你们已经定了吗?对,但是逻辑就是说公司的增长曲线需要长什么样,所以你就定一个这样的目标,是说我们认为我们的这个研发能做到什么样的程度,这个程度会能带来什么样的变化。然后基于这个东西来思考我们的EO应该推出来一个我们的预算,然后应该是怎么样的。然后我们其实就是看到去年下半年,大家都看到大公司,比如像字节还有阿里的强悍,尤其是豆包的产品表现是很亮眼的。你刚才也说,其实你5月的时候你就觉得豆包会赢。我觉得之前就我聊到这些创始人里面,你也是非常早非常直接的,就会去表达,其实创业公司跑出来是一个很难的事。
就即使你很早的时候有这个人质,你觉得去年一年有什么事仍然是超出你的预料的样?不是指大公司的动作方面和这个竞争激烈程度方面。我觉得基本上都基本上都预料到了。对,连程度你都预料到了?我预料的比例还会更紧紧。就是我觉得真的是不要,操一根广望。如果是按照一个换我私人来看,那也确实很久,但是如果你观察那个私人来看,你能够是说假定是说技术会长期发展,后面的发展会带来不一样多人,产品跟三十年来看就真的不一定是件好事。你说什么,不一定会是件好事,就是以比如说豆包的DAU作为一个衡量标准来说,真的不一定是一个好事。
你是指对豆包不是好事,还是指以豆包的DAU作为一个评判标准,对观察者来说会造成干扰,我觉得都是吧。你觉得这事对豆包都不是好事,为什么对豆包不是好事?有好的一面对吧,好的一面是用户多对吧,但这也会有不好的一面,不好的一面是说,比如举例子,就比如说对欧巴尔来说,虽然说他的用户规模是Cloud的好多倍,但是他的估值、资金能力、人才,可能应该都没有Cloud的三倍多对吧,然后但是他还要负担很多很多的东西。那这个东西有可能是说,为了要照顾这么多的用户,那很显然让他们的研发的节奏变慢了。
比如说假设欧巴尔他现在没有这么多DAU,他得有只有一半,但是他在技术上比如说把Cloud给碾压了好多倍。所以用户越多这件事不一定直接让模型能力提升,它多到一定程度反而有可能会限制模型发展的速度,迭代的速度和灵活性。是,至少你看OpenID和Cloud是这样的对吧?对确实你用户更多,你的责任也更多。对,但是技术是在快速变化的,它都不是说提升几个点的事,它其实可能是天翻地覆的变化,还会再迟一发生。那如果说去年的这个情况你们都预料到了,你们当时做了哪些事来应对这个竞争吗?其实就是你技术的就要看技术,技术的话就是看进步曲线,然后产品就应该看产品本身。只是说这个产品本身不应该用移动互联网的产品逻辑去套。
对,那应该看什么产品指标?你看吧,现在的这些,比如说AI里面有合理商量化的产品,主要都是依赖订阅的对吧,都是不是依赖广告的对吧,但中国的移动互联网过去的历史上,所有的商业模式都是依赖广告来计算的对吧?所以这显然就不一样啊,但其实付费用户这件事就只能在海外才能跑通对吧?所以在海外产品付费用户确实是个指标,包括订阅的转化。对,但是在国内其实不是对吧?那国内有什么你现在看到的指标吗?
我猜是有的,但是我想跑得更好一点。就你现在不想透露是吗?对。比如说你用一个广告的计算逻辑来计算这个事,至少在国内肯定是不过可能的。但其实那个talking也蛮早就开始做广告的。反正就这样的话,我觉得还是有些局限性的。所以这是你们之前的尝试。对,你很早就是看到说创业公司跑出来是个小概率事件,挑战很大,但你还是选择了创业。你算到了这个翻盘的概率是什么,可能性是什么?这个东西它都没法算,就只能是说,首先第一我觉得它一定会存在。
本质原因就是因为这边还是有能看到不同的路径,对吧,大概率我觉得是没法一家同吃的不和巨头正面竞争。就豆包类的这种产品,你们不是重点投入去做的产品,这是你们的一个原则和策略吗?这个东西本上是我们认为是说,做AGI跟做一个恰GPT其实是两件事。就是相关,但它其实不是说有了恰GPT你才能做AGI,也不是说你要做AGI一定对我一个恰GP上的产品。因为我刚才说的很多原因,对吧?所以说当开始意识到是说,用户规模不一定就是提升技术水平,不一定意味着是说一定需要最多的用户,这件事之后,所以这个事其实就没什么负担了,对吧?也不需要有心理压力。
你觉得除了大公司,它是比较明显的给这些头部的大模型公司带来一些外部压力之外,还有什么不明显的威胁和压力?首先我觉得压力不是坏事,我觉得对串通公司其实是个好事,让串通公司亲戚的意识到是说必须得创造出来独特的价值,否则的话就不应该存在。从事上来说,我觉得这是一个好事,可以非常亲戚的意识到是说有哪些东西我们一定要做好了有哪些东西我们就根本不应该去想,其实辩论来看,反正我是这么来看这件事的。那回到刚才那个问题,就是说,还有什么不明显的,可能大家比较忽视的竞争或者说压力?我觉得主要还是自身,其实还是怎么把自身做得更好吧,还有认知水平的提升,组织的认知肯定不光是指你的吧,就你们所有人。
对,就比如举意思,如果我们一年前就开始意识到技术品牌很重要,那我们肯定会被现在做得更好吗?你觉得那些就是他不自己做模型,他进入一些开源的模型做一些精调,在2025年就这种公司和像Millimax这样的公司,它会是一种什么样的竞争情况?我不知道,首先我只能说这样的公司肯定是很有意义的,还挺不错的对吧?但是话说回来,好像是说这个市场行业不是说有A不能有B的事,对吧?反正至少我们不需要考虑这件事。不过你们可能需要考虑这件事。我们需要考虑这件事。那就是你要观察这个行业。
对,我之前就是有这个大磨仙的投资人,对比过Millimax和月战面,他们市场策略就有的人的选择是把长板做到足够长,有的人选择是没有短板,你觉得你们会更倾向于哪一种?我觉得这个东西好像我们并没有什么偏好,还是取悦于怎么样做能够更好的在这个技术不停经的这个浪潮里面吧,就是那是一个核心的目标。对,然后你其他东西是根据那个去看去对齐去调整。
接下来我想聊下你们团队与组织,刚才也提到点,可以再展开一些。你怎么看去年有一些人离开?本上还是刚才说的,就是我们还是相信这个事,它应该就是技术驱动的,就是不是所有人都合适,就至少对我们来说。
所以你劝推的吗?你做这种事会心理负担表大吗?会,那你怎么克服那这必须得克服?你做这些事拖延了吗?拖延了,所以感觉不应该拖延。我觉得这也是属于认知不够强。我觉得就不应该假定说一个公司不会有人缘流失,对吧?因为一个公司确实应该有人缘流失才是合理的。实际上你们现在坎堆架构相比于24年初有什么变化?其实有个非常核心的变化,就是自己来提方案跟自己来做决策。
提方案跟做决策其实是两个完全不同的状态,提方案是说,自己来提方案要怎么这么来做,然后做决策指的是说,有同学提出来一些方案,你来做一个选择。至少在我们这个组组里面,其实我们会签线于不管自己还是一个方向的leader,大家其实一个基本的标准是说,大家其实一个基本的标准是说,大家都要是那个提方案的人,而不是说等着别人给你来汇报,然后你来做过选择的人。
所以是要hand on的。对,要一手要去了解细节干活的人。对,这是一个比较核心的一个点。还有第二个点就是说,我们发现一个比较有效的方法, 就是什么样的人适合这个组织什么样的人不适合,能够比如说客观的来分析这个现状,然后能够找到一套理性的方案和把上一家公司的经验直接copy过来,这其实是一个非常大的区别。所以说其实我觉得核心它也就两条,第一条就是就是每个人都得是能够提方案的人,就是都得hand on。第二个话是说那个方案,它应该是基于客观的现状分析出来的,不应该是说只是把一个别人家的经验给搬过来。
我觉得这两点其实就是我们的非常明确的两个原则吧。所以这个核心的变化并不是组织形式架构上的变化,而是对人的要求的变化。对,这大概是2024年什么时候有这样一个转变和调整,它其实是慢慢演化出来的。这里发生了什么事让你会有更清晰的这两个总结?一个话是基于某些事没做好,还有第二个就基于某些事做好了。他分享过一个deep seek分工的方式,大概是说他们不前聚分工,他们自然分工。对,然后他让有想法的人自由组队,这个想法是如果你其他人对这个感兴趣,你就来参加这个项目。然后每个项目可能他能调动的卡和人是不设上限的,这种在公司里能执行吗?公司应该至少有些项目是这样的,有些项目是这样,说明这个事它是能执行的, 比如说在一些实验室里面其实也有类似这样的组织形式。
只是有的实验室是说,可能每个人要做的都很不一样,有的实验室是说那个项目大,就可以有更多的人,其实也是这么一种组织形式吧。实际上我觉得它都对就是说,被应该孤立地看说一个组织形式是不是对,应该把这个组织形式跟它已经有的人就分在一起来看, 其实是一个这种双向筛选的这么一个过程。因为你刚才也说2025年,你们最重要的目标肯定是跟技术迭代相关的,就技术迭代这块,你们现在的组织的协作和分工的形式是怎样的,包括资源怎么分配。其实就是客观来看的话,我们感觉这些资源其实都还是挺充足的,就是做出来一个好的技术需要的这些东西。但是创业公司的话就得做取舍,其实核心就是怎么来做取舍,这个取舍是自然跑出来的还是?
比如说你得来判断取舍,当然应该要判断了,对吧?但客观的情况来说其实是,你不应该假设所有的判断都是对的。你应该假定是有些判断就是错的,当你意识到判断错的时候,怎么样能够及时来补,其实是这么一件事。什么机制可以让你意识到你的判断是错的?我觉得最好的机制就是不依构吧。不依构,就是不自我。对,这个怎么具体落到每天的工作上和决策上?区别就是说,如果你依构的话,你比如说有些东西就明明意识到是错了,然后还会找一些理由,我说的是我自己。那可能就会让它变成一个对的东西,然后不以后的方式就是说,那我发现的客观你意识到错了,他就是错了,那就也不要怕打理,你就第一时间改。
Millimax现在哪些重要的决策是你来定夺,哪些是放权给其他人来做的?我觉得是这样的,就一开始我也觉得这个事很重要,就是在深入创业的第一年,就是说你来决定什么东西,什么东西不决定。但后面的话,我发现这个事其实不重要。可能更高级的形态是说,不是说大家分好说你来负责啥,你来负责啥。更少的东西是说,大家把怎么来思考这个问题的方式能够定下来。就是说我们会基于什么东西来思考出来是说要这么做或者不这么来做,这个事是比较核心的。
我说一下这个东西的区别, 这个东西的区别就是公司里面的人可能会来自不同的地方,对吧?比如有人来自自己的条件,有这样的贫图多,不同的人做的方式肯定是完全不一样的对吧?那如果管理方式是说顺来负责啥,顺来不负责啥,那一定会导致比如说这个A来负责一块事,B来负责一块事。但是他们在之前的公司里面会有这套思考方式,那它导致大家的决策逻辑是完全不一样的。那这个东西放到一个组织里面,就会导致这个组织其实很混乱,因为不同模块的决策逻辑是完全不一样。 所以这个事其实就没法让一个公司非常好的来运行,虽然说每个人的素质都很高。而且每个人在两个人都是对的,然后证据的方式应该是说这个公司它最底层认为什么东西是对的,什么东西是不对的。然后这个事大家能够慢慢地有团的这些认知,这样的话导致的结果是说初来做决策结果都差不多的,逻辑也都差不多。这样的话,这个东西才会组织才会变得比较顺。
就怎么让大家能统一了?就是通过不停的沟通吗?我觉得一个是沟通,一个是观察,观察指的是总会有些正反规跟负反规吧,我觉得这可能是一种比较高级的管理形式。当然也不能说我们做到这样一个视频了,那对我自己来说,就是讲明白,就是当一定要做一个决定的时候,跟大家讲明白,或者大家能够讨论清楚这个决定到底是怎么做出来的,而不是说你来拍了一个版。
所以你觉得更理想的状态就是,可能在这个组织里的人他做的决定会是类似的?对,比如说自己,他其实就会有这样的一些特点,但这是一件好事吗?就不会让你的决策的多样化变少了吗?我觉得这是好事,不同阶段可能不一样吧。那如果每个人都想得很一样的话,那不是会错到一起去。多样性也是一个很重要的指标了,但我感觉就是说,真正把一个公司能够拟据起来的,其实还是这些东西,对或者你可能说的是一些原则性的,一些比较大的认知。多样性可能是在一些更具体的事情上。
对,总的来说你觉得你是一个容易被说服的人吗?我觉得不是,这个和不要Ego是什么关系,就是矛盾的吗?就很多事都是矛盾的,就跟MiniMax也是矛盾的对吧。对MiniMax这个名字就是矛盾的。对,因为我觉得世界可能就是这样,它就是两个东西便能来看吧。那实际在工作中,在一些重要的决策的时候,你怎么去平衡一方面你有自己的想法,你可能很难被说服,另一方面你不要Ego,不要太自我?反正还是有一些办法的,我觉得这个实际上还是说,就是能够建议先来思考吧,不要被一些表面暂时的东西迷惑住。
你们现在的这种决策方式会不会让员工觉得公司的一些管理决策会很乱啊?我觉得首先呢,一个比较重要的事是说,对,意识到是说,让大家觉得管理很好,或者让大家觉得这些东西,其实它不是一个目标。对,不是一个目标。对,就跟你不能讲另一个团队,它就不会有人缘流失是一模一样的。是一样的。有Millimax的员工说,24年的时候他有一段时间感到公司的管理决策非常摇板,就可能这个月的核心目标是收入,下个月的核心目标是增长,下个月又换成收入,所以我们就同意了思想吗?现在同意的思想就是其实这两个事可能都不是最重要目标,最重要目标是技术迭代。对。
你觉得就是管理一个不能用以前的逻辑来套的这种新的AI公司,在组织上你遇到的最大难题是什么?我觉得主要挑战其实还是,就是持续信任到好的人吧,这个实际上是目前最大的挑战。你会怎么评估,就是你们在人才吸引力上和其他的同类公司,包括大公司都算一起?我觉得其实现在最有的人才吸引力的,我观察,我觉得其实是自己跳动。对,我听一些公司说,校招的时候,现在很多人都是选了自己。
对,其实我觉得这个东西,这是一个科幻事实,但是呢,其实去了自己跳动,很多人可能是并没有发挥出来的,真的发挥出来人的比例其实是很低的,比创业公司低是吗?要低非常多。对,是因为自己跳动人太多了。对,所以它其实就是这么一件事。对我来说,其实核心真的还是如何吸引到更多更好的人。就最后想聊聊你个人的变化和成长,我觉得其实还是有很多变化的,就是半年多以前吧,或者是一年前,好像好多人会觉得我很焦虑,有些人,然后最近半年就完全不焦虑了。真实的情况就是这样的。然后呢,我觉得核心就开始意识到其实就是要做取舍。
你半年前焦虑是因为什么?半年前的话,我觉得本质上是因为不太知道该怎么来做取舍,或者是不敢来做取舍,或者有的时候就不想来做取舍。你过去一年最大的痛苦就是取舍这个点吗?最大的痛苦是不知道要做取舍,当知道要做取舍的时候就不痛苦了。那个时候痛苦已经解决了很大一部分。对对对,之前这个YC的创始人格林伍说过一句话,他说创业公司摊开碳都是抽货现场。你觉得去年你们经历的最大的混乱是什么?我觉得就我刚才说的这件事,就是意识到是需要来做取舍的,然后在那之前可能会有一个焦虑和混乱的状态。对,并且意识到就公司的驱动力到底是啥。那你去年反思最多的问题是什么?反思的问题是说,为什么这个认知能力不能提升得更快呢?
你后来找到啥方法了吗?找到了一些,比如了,就是要放下以后,然后思考得更深入。你之前说过你很重要的一个学习方式,是和比自己强的人去交流。对,去年你有见过什么比自己强的人给了你很大的启发吗?还是有的,但坦白地说,我觉得就是光这样是不够的。本质上还是自己得能够,就是放下以后,能够思考得非常的深入。大部分的时候其实是能想清楚的。自己想清楚,这是一个自我反思的过程,可以这么认为吧。你去年当外部压力很大的时候,你怎么排挤压力啊?其实就是当想明白这些事的时候就还好了,就是有一个投资人,他分享了去年和你一起找算力的一个故事,说你会非常极致地去追求便宜的价格,更短的租期,然后可能有一些供应商会提出说,我可以给你一些当地的2B的AI订单,然后让你接受一个更贵的GPU。你说你不需要订单。
首先我其实非常感谢我们的那些供应商,其实核心还是说我们开始意识到很多东西我们自己做不了,就是相当于是我答应人家要去交付那些东西,第一我们没这个精力,第二的话有可能也会把别人给坑了。我们知道我们在那个时间内,我们没法去来做这样的交付。所以说其实这个事我觉得可能不是不敬人情,还是很感激的。我觉得核心是因为就是我们不太想去耽误别人。就你有的时候看起来是非常适应性的,甚至可能有的员工会觉得是摇摆的。你觉得哪个更接近真实的你?这个的话也是一个个人的进步的过程吧,我觉得至少比之前变得更强烈之后我觉得其实是越来越坚决的,就是你想清楚取舍这个事情,以及不要太自我,要放下自我。对。
就是你创业的时候你既不是那种业界大脑,可能也不被很多人认为是技术小天才。你会认为自己是什么类型的创始人?我觉得是比较这个简单的吧。简单是指?简单的话就是知道有件事嘛,这件事反正还挺难的,然后但是如果做好价值也挺大的,然后就坚持做,就是这样。 在创业或者说当一个CEO这件事上,你有什么role model吗?没有。那如果没有一个的话有几个吗?就可能他们不同的特质也没有。
你觉得当一个CEO你的天赋和你的缺点各是什么?我觉得就不要觉得自己是CEO,觉得自己CEO的表现是什么,就是你要考虑CEO应该是干啥不应该干啥。就是我刚才问的,比如说我哪些事我管,哪些事别人管。其实你觉得不应该这样去考虑CEO。对,有一个我比较好奇的问题,就是你在公司里直接被大家叫做IO,就是DOTA2里的一个角色嘛。我去问了Midimax的海洛AI,他的回答是这是一个辅助型的英雄,主要是为队友提供增益和保护,在团队中扮演四号位或五号位。对,你为什么玩DOTA2的时候选了这个角色,而且你一直叫这个名字,它对你有什么意义吗?
主要确实是这样的,你就说这个角色确实是这样的一个角色,对其实这个东西很恶然的, 是因为那个时候其实它不是一直都是四五号位的。TI8的时候吧,我记得反正不是TI8就是TI9,当时那个安娜,就是那个叫上帝的小精灵, 其实是把他那个IO变成了一号位,然后非常的强,那个是导致他们后面白乱,就是TI的冠军, 当时就觉得这名字挺酷的。你是有一个战队,就是把IO作为一号位来使用,这样一个创新的打法,然后帮他们得了冠军是吧?对。
所以本身这个角色的属性跟你自己的特点倒并没有非常直接的相关。对,就是创业这个事,它还是有很多随机的行为的。就可能你很难归类说,我是个辅助型的英雄,还是个输出型的英雄。对,你觉得你比较像什么型的英雄?我觉得不应该把这个传说单独看,如果一定要单独看的话,我觉得我肯定是那个最相信团队的。
最相信团队的。2025年你觉得可预见的变化是什么?比较确定的变化,整个行业吧,我觉得接下来,我自己觉得AI一个比较合,其他目标就是那样,就是我觉得专业领域到达专业人士的水平,这应该是一个比较实质的一个milestone,但我不知道这个事会不会在2025年完全实现, 但是我觉得至少能实现一部分。那你觉得还是悬念的,可能的关键变量会是什么?我觉得变量的话其实还是这样的,就这个事它其实会比做个chatterbots其实会更复杂一点。因为chatterbots的话其实它的产品形态比较简单。
比如说假设是AI的定义是专业领域到专业人士的水平,其实这个事它不光是一个技术的事了,其实是一个技术加整个产业的事。它甚至可能还会导致一些社会的变化。对,我觉得它其实是一个很综合性的一件事。你是指的社会分工,包括就业这些的变化是吗?有可能吧,但这个事可能不是顺点发生的,它可能是一个主阵。对。
2025年你自己最期待的事情是什么?可以讲三个层面的,行业的公司的,还有你自己的。我先说我自己的吧,我自己的话,我肯定是希望自己的技术水平变得更高。我其实发现的是这样的,就是说,最大是在创业的时候可能还会考虑一下什么管理的这些事,什么之类的,后面的话我自己发现其实是没那么重要的。我觉得真正重要的东西其实就是自己的技术认知,是不是能够再不停地提升。这个事其实是我最希望自己能够进步的一个地方吧。然后那公司的话呢,我觉得我们还有很多地方做得不太好,我不是指的是说这个地方可以提升5,提升10%啊,我指的是说我们有很多地方可以提升10倍,还有挺多这样的地方的,我希望这些事我们能够变好了。
行业的话,我自己肯定是觉得是说AI这个行业的价值是说,比如说假设AI技术不会进步了,就假设AI技术停滞了,那我觉得是其实肯定是对不起大家对这个行业的付出跟投入的。那所以这行业里面我觉得最重要的事,那就是说真正水平在不停地提升,然后并且带来了直接的设备价值。OK,感谢Io今天的时间啊。嗯好,本期节目就到这里,如果你对今天聊的话题有观察好奇或疑问,欢迎在评论区分享想法,这也会成为我们节目的一部分,让整个讨论更完整。你也可以把我们的节目分享给对这个话题感兴趣的朋友。欢迎推荐更多你想听的主题和嘉宾,你可以从小宇宙、苹果podcast等渠道关注晚点聊Late Talk,也欢迎关注我们的公众号晚点Late Post,下期再见。