欢迎收听本期晚点聊,今天的主播是曼琪。10月10日备受期待的特斯拉robotaxi,也就是无人出租车,终于亮相。不过,这场发布会短期带来的更多是失望。特斯拉的股价在发布会之后下跌了约9%,而Uber等网约车公司则大涨10%。
首先要明确一点,行业里说的全无人驾驶,就是车上不需要人类司机,并不等于特斯拉现在已经上车的FSD。虽然后者也叫Full Self Driving,对应中文的完全无人驾驶,但它其实是一种需要人类司机随时接管的高级辅助驾驶。特斯拉做全无人驾驶是一场连续数年的续剧。早在2016年10月,马斯克就第一次承诺,到2017年底特斯拉的车就能不依靠人独自从洛杉矶开到纽约。事实证明,这又是一次过渡承诺。
不过,人们还是对特斯拉抱有期待,毕竟马斯克式的爽文叙事一贯就是先提出一个不切实际的想法,再给出一个激进的时间表,然后苦苦挣扎多次延迟,陷入绝望,最后绝地反击。今年初开始,特斯拉的一系列进展让市场对它的自动驾驶和无人驾驶有了更多期待。先是FSD V12表现惊艳,4月也有消息称特斯拉将暂缓开发售价约2.5万美元的下一款平驾车,转而集中精力做Robotaxi。消息爆出的当天,马斯克在推特上预告8月8日发布Robotaxi,这场发布会后来又推迟到了10月10日。
但在两个月的等待后,马斯克只做了20分钟的演讲。他展示了两款无人驾驶车辆,但几乎没有讲技术信息,也没有讲实际的落地计划。发布会后的第一时间,我们邀请了L4级别的无人驾驶资深从业者侯晓迪来与我们分享他对这场发布会的感受,以及他对L4行业当前的观察。
侯晓迪本科毕业于上海交通大学,后来在加州理工获得博士学位。他是自动驾驶第一股图森未来的联合创始人,历任CTO、CEO和董事长。侯晓迪的核心想法是,L4自动驾驶现在更多是一个工程问题,到了以CPM(Cost Per Mile,每英里综合运营成本)为指引的阶段,各公司的竞争核心就是怎么在保证安全的情况下降低CPM,从而能比现有运力网络更有优势。其实马斯克在发布会中也提到了这个指标,只不过侯晓迪非常不同意马斯克所说的具体数字。
我们聊了他对自动驾驶行业近年的一些热点技术,如端到端和世界模型的理解和看法,以及他在离开土森之后再次创业做L4自动驾驶的新认知和选择。下面我们就正式进入节目吧。
欢迎收听本期的晚点聊,今天我们要聊的话题是刚刚结束的特斯拉的微robot发布会。我们非常高兴地邀请到了自动驾驶,并且是做了全无人驾驶也就是L4级别的自动驾驶,非常多年的一位资深从业者侯晓迪,来和我们一起分享一下,我们怎么来看现在特斯拉的这场发布会,以及目前这个阶段robotaxi的一些进展。尤其我们想讲一讲这个行业里的实际情况和一些烟雾,因为自动驾驶行业一直是一个争议和交锋都非常多的行业。
小斌,你可以和我们的听友打一个招呼,也简单的自我介绍一下。
哈喽,曼琪你好,感谢今天的邀请。大家好,我叫侯晓迪,我做自动驾驶大概已经做了八九年了吧。我上一家公司还挺有名的,叫Too Simple,我是联合创始人、CTO,后来又成为了CEO。但是由于一些原因,这个公司也没有继续走下去,所以我现在又出来重新搞了一家公司。新的公司叫做Bot Auto,总部在美国的休斯顿。
小斌是非常坚持这个行业,现在还是在做L4的无人驾驶。那我们接下来可以先从发布会开始聊。其实你是一个比较有名的,在自动驾驶这个方向上,应该算是马斯克的一个反对者吧。我想先问一问,昨天你也没有看这场发布会,包括你看的时候是一些什么感觉,直观的感受如何。
我其实没有现场参加他的发布会,因为确实时间有点晚了。但是我还是有看后边的一些剪辑,以及复盘,了解了发布会里的细节。其实也不能说我是马斯克的反对者,比如说我还是非常喜欢SpaceX的。我只是比较讨厌他在推广过程中一些特别强的hype,就是一些吹泡泡的东西,我是很反对的。
那我们今天正好可以聊一聊你觉得哪些是hype的、吹泡泡的部分。总体来说,这个发布会里,哪些地方在你的预期之内,哪些地方可能超出你的预期?
其实发布会本身就有一个预期,我觉得发布会本身没有讲什么东西这件事情,是在我预期之内的。发布会之前一天,我说爆米花已经准备好了,这个其实我就写在我的朋友圈里。很多朋友还说,难道你对这个发布会还有什么过高的不切实际的预期吗?我说不不不,主要是看观众反应。我是在局外去看观众们对这场发布会的反应,我觉得这事比较热闹。
但其实这件事也很有意思,我惊讶地发现,人们对这个发布会的反应也超过了我的预期。什么部分?这句话我展开说一下,实际上对于这个发布会而言,甭管是8月8号还是10月10号,他不可能拿出一个具备L4功能的Robotaxi这样的运营产品,这显然是我早就知道的,因为我们做L4做了很多年。虽然我没有做Robotaxi,但这件事是很清晰的。就是他们的基础水平,FSD今天能到的状态是L2,不是L4。
然后呢,我觉得自从FSD12推出以来,很多公众对FSD到底能达到什么样的程度,尤其是在一些虚无缥缈的概念词,如Scaling Law,比如End-to-End Learning,在这些词的加持之下,很多人对这个FSD、对Elon Musk、对Tesla,产生了一些宗教式的狂热。这些狂热让我觉得是比较不对的,我很担心这些狂热会进一步加深人们对无人驾驶的误解,这明明是一个工程问题。
所以这次发布会超出预期的地方就在于,大家都好像纷纷表示对这个发布会觉得比较失望,全部都没讲,而说马斯克是大会友的人的数量远超我的预期。确实没讲什么,但也是有一些东西的。一个就是他这一次拿出了两款无人驾驶车辆的形态,最受关注的肯定是Cyber Cab,就是他轿车的这个版本,两个座位,然后是叠一门,没有方向盘,也没有刹车踏板。这其实和目前谷歌的Waymo,还有百度的罗伯快跑,这些主流的无人出租车形态都是非常不一样的。至少在一般人看来,特斯拉拿出的这个车可能是更酷、更未来、更终极的。
作为从业者,我想问问你怎么看这个新版本的robotaxi轿车?
我觉得这事得退一步讲,到底有哪些东西是虚的,哪些东西是实的,我们实际上要分开。我们谈任何一个事情,它分两个部分,一个是事物发展的客观规律,另外一个是公众意志。这两个东西就像是阴阳的两个方面,客观发展的规律是阳,公众意志是阴。有的时候两者一致,有的时候两者不一致。
在我来看,无人驾驶技术的发展这件事是很客观的,你能看得出来,这是一个很实实在在要靠证据说话的事情。但是大家对它的热情,这就是一个公众意志,是一个阴的部分。我觉得特斯拉特别擅长把这些阴的部分基本上拉满。比如说,你看又是一个没有方向盘,没有踏板,就是没有方向盘,没有踏板这件事,它的逻辑是因为没有方向盘,没有踏板显示了特斯拉的自信。这种自信反过来能给公众对于无人驾驶、对于特斯拉对无人驾驶十拿九稳又有更多的自信。但是没有方向盘和没有踏板这些事情,完全不能帮助到它无人驾驶技术的前进嘛。
但它在这些跟客观发展规律不相关的一些地方,就特别喜欢发很大的力,就在阴的这方面强调非常多。我觉得如果说你阴阳调和,你能强调得好,也可以。但我觉得它在阳的方面又非常落后,所以这个事情实际上是一个我觉得不是很好的事情。
然后他还发了一个形态,就是一个无人驾驶的巴士,这个可能跟你现在做的事关系会更大一些,因为马斯克在发布会上也说,这个无人驾驶的巴士他们叫Robo One,可以拉20个人,除了可以拉人之外,未来可能也可以送货。你怎么看这种就好像我又能干这个又能干那个的通用设计和设想?
我是毫不担心的,因为这事真的是跟我们没啥关系。并且他这种发展出来又是继续在操控公众意志上越走越远。首先就是从产品设计上来说,如果你有一个东西又能干这个又能干那个,基本上就结果而言就是你啥都干不好。对吧?比如说我有一个特别厉害的杀人兵器,叫要你命三千,一大堆东西都绑到一起,说你看我这个是不是很厉害。但实际上真正的战争中,没有人使用要你命三千这种兵器。
但我觉得还是那句话,他这个发布会过多地强调了公众意志,实际上也是对特斯拉品牌形象一种反噬。当然,反过来说,Elon Musk有他自己的打法,我们这种工程师或者科学家出身的人,又有另外一种打法。我觉得就我自己而言,可能过去太多关注门头的发展,但现在确实也是一个时机。正如我今天接受咱们这边的采访一样,我希望公众意志不要成为事物客观发展规律的一种阻碍。
所以从业者还有义务告诉大家,实实在在来说,无人驾驶技术接下来发展规律大概长什么样子。你不要有一些不切实际的预期。反过来说,比起比较好的领域,比如航空航天、生物制药,这些领域基本上没有点经验的人是不会敢多评论的,所以这些领域的hype就少了很多。而无人驾驶领域,我会开车,我当然能点评一下你的无人驾驶系统嘛,所以这个领域其实我觉得被代谢作代的比较多。
我们刚才讨论了一些哲学方面的观点,我们可以说些更具体的。昨天这个发布会上,马斯克就少数的说的一个比较具体的信息,有数据的,就是他说的每英里的运营成本。他自己说Cyber Cab,就是他们这个轿车的版本,每英里的综合运营成本会低于0.2美元,而现在Uber的每英里的成本是超过一美元的。
当然马斯克也并没有非常具体的说,这个0.2美元到底是怎么算的,以及说这是哪一年会实现。你也是行业里第一个提出,我们做自动驾驶要看CPM,也就是每英里的综合运营成本。那我们可以好好把这个讲一讲,因为这也是商业化的一个关键啊,这个0.2美元你怎么看?
就是怎么算就怎么有,这显然又是带节奏的一个具体体现了。我觉得这一点上就有实锤的证据而且非常简单,10秒钟之内告诉你为什么两毛钱是不对的。因为电池的成本每英里1毛5,电力的成本每英里5分钱,轮胎的成本每英里5分钱,这三个加起来就是2毛5。好,证明完毕。
所以马斯克再胡说,完全不考虑自动驾驶,我就只算本身车在路上跑的这些消耗,你觉得就超过这个价格。对,对,这些数字我还是,因为是发布会发完了嘛,我特意去简单查了一下。当我查完第三个数字,我就发现得了,瞎胡扯嘛。我觉得这件事也很有意思,就是其他行业里的同行也都在问我求证。我也有一些私下讨论,大家肯定不可能这么便宜,这违反物理定律嘛。所以我觉得我是希望借这个机会,展开说一说,可能会比较长一些,到底应该怎么算每英里的运营成本(CPM)。
我们行业里边一般就简写为CPM,我觉得首先第一,我们要对CPM有一个共识,要不然你经常会出现,我们家这个产品A的方面比较厉害,你们家的产品B的方面比较厉害。那文人相亲就开始互喷,这样是不利于这个行业发展的。CPM需要一个统一的认识,这就像说会计行业,你需要一个什么叫做净利润的统一认识。你不能说,因为我换了会计师事务所,我就能给一个公司算出来一个不同的净利润。
对吧,这件事情是需要有统一标准的,但你看就像我刚才算了这三个数,超了两毛钱,就是2毛5。对于Elon Musk来讲,我相信他一定是通过其他一些计算形式说,这也不算,那也不算,我就算了一点点东西。这些一点点的东西加起来,你看不到两毛钱,所以我很厉害。但是人家Uber可是有正经的这个会计手则算出来的,人家能算出来一块钱。所以这就是区别。你不能用自己一个跟别人连标准都不一样的东西去互相对比,这样永远比不出什么结果来。
但是对于CPM的计算,确实今天没有太多的标准。我觉得这一点也是无人驾驶行业需要去进化的。我觉得这个计算一定要放弃以前对于其他行业,特别是无人驾驶;它是一个新的产业。有很多人说汽车产业怎么怎么样,但我一直提醒大家,无人驾驶产业不是汽车产业,它是一个新的产业。它的CPM(Cost Per Mile)的计算要遵循第一性原则。第一性原则就是你只要车上路,就得消耗能源,对不对?那这个能源成本怎么算,不管是电呀,是燃油呀,都要算上。
那它有折旧,比如Elon Musk其实还提了说,我这个车你可以自己拥有,还可以在你不用的时候让别人去坐,但是你让别人去坐你的车,当taxi去开,它也是对电池的损耗,也是对车体的折旧。这些车辆的本身的资产的折旧也是应该算进来的,对吧。那再接下来,维修是不是也要算,保险也是要算的。不管是谁负担这份保险,哪怕说特斯拉自己负担了这个保险,保险也是应该算到里面的。
除了保险之外,还有很多奇奇怪怪的其他东西,比如说,如果这个车今天发现哪坏了,那维修以及由于维修产生的不能工作带来的损失,都是成本。这里面一大堆的成本都要计算。我们需要有一个新的结构,尤其对于无人驾驶而言,我想提两个非常重要的点:一个是硬件成本。比如说,很多人说无人驾驶有很多的传感器,那这些传感器到底有多贵呢?
如果我们举个例子,有一个比较稳定可靠的激光雷达,比如说我们公司现在用的是核赛的激光雷达,我们就觉得非常好,稳定性奇佳。那一百万英里寿命,如果一百万英里的寿命,咱们就说这个激光雷达量产了以后的价格比较便宜,可能几千块钱,咱们就往多里说,是一万美元。一百万英里的寿命,这时候每英里的运营成本摊下来呢,就是一分钱。我介不介意增加一分钱的每英里运营成本,让我的系统安全一些?当然我不介意。
所以从CPM的角度来看,硬件成本就需要去重新的计算和认识。我想插一句,就是你刚刚说,你们的激光雷达一万美元,实际上核赛现在在国内给车企供应的主激光雷达,大概也就在三千人民币以内吧?所以你们用的是不同的版本,是吗?
我说的不是,我的意思是说,虽然我们现在用量少嘛,我们是几千,未来如果车企大量买的话,肯定是更便宜。而且你还不止用一个,把所有的激光雷达的整个生命周期加起来一百万,你就往多里算翻几番,也是在一万美元以下的。换句话说,它的每英里运营成本上带来的成本提升是小于一分钱的。我只是说想非常保守的去估算这样一个数字,这个数字小于一分钱。
你说现在很多人说,激光雷达之争,为什么不用激光雷达?这么贵的成本我们怎么能接受?但是在运营成本面前,这个成本一点都不贵。所以运营成本其实很好地能够帮助我们看到到底什么是主要矛盾,什么是次要矛盾。这是硬件成本。
第二呢,我想说的是CPM要遵循的第一性原则,是因为很多时候你的运营,无人驾驶的运营跟你自己家里边开一辆车是完全不一样的。无人驾驶,咱们先不说辅助驾驶。辅助驾驶因为永远有司机在能够接管,而司机是为这个车辆驾驶负全责的。如果是无人驾驶的情况下,我们需要关注的就是任何时候、任何的硬件出了问题,我们的系统都能够把控住局面,确保车辆和人员的安全。
那么在这种情况下,你就要有一重冗余,甚至有的时候要有二重冗余。如果你的车辆在正常行驶过程中,冗余系统出了问题,那怎么办?是不是你就赶紧需要去维修了?但是如果你的这个车辆系统变成了一个全冗余的系统,那么你有可能出错的部件就会比一个普通的汽车要多得多。对吧,因为你的车辆能运行的基础条件是,你原系统要确保能够正常工作,同时冗余系统也要确保能够正常工作。
这两个东西叠加在一起,你的失效点就比一般车辆多很多。而这种由于组合产生的可能都不是线性的,是超线性的。这种失效点的个数,就会让你会发现无人驾驶的运营,就是在一方面确保绝对的冗余,冗余都能够正常工作,另一方面就是你的冗余系统经常坏,于是你就经常需要停下来,确保冗余系统或者那些不那么重要但对安全有必不可少的系统一直都在工作。
在这种情况下,运营的复杂度是成指数往上走的,而运营成本也和一般的车辆的运营成本完全不一样。当然,这些事情呢都是后话。也就是说Elon Musk在他前几天的发布会里面完全没有提到,我们甚至也不需要去算这些东西就知道,他的这个两毛钱一定是说了大话。
你可以举一个例子吗?就是一般人可能认为是一个很简单的、跟自动驾驶这种高精尖技术不相关,但实际上它在运营中又是很重要的冗余系统,一处理不好就会导致你很麻烦。
举个例子,每辆车都有胎压检测。我们正常人驾驶的时候都不会发现胎压检测会有任何的误报,但如果我们每一秒钟都勤勤恳恳去监测胎压检测,我们经常会发现胎压检测有一边一个一个跳动。这些跳动就会导致突然胎压检测不稳了。那么到底是胎压检测器坏了呢,还是胎压真的有问题?我们到底感冒多大的风险,是否要继续开车?这就是问题。
但是很多时候,对于人类开车的时候,大家没有那么介意胎压检测这样的事情。所以这就是一个我们无人驾驶需要解决的工程问题。这些工程问题没有一个很难,但是如果我们真的用最严格的标准去监控这个系统的话,你会发现这个指标总有一些不正常的地方。
你说到这个,我也想到一个比较有意思的点。在这场发布会之前,美国自动驾驶公司Cruz的创始人沃格特,他列了一个清单,就是说如果我们去看一个新的Robotaxi公司,我们应该去看什么要点。我之后会把这个放到show notes里,大家也可以去看。他大概讲了十几个点,实际上里面跟一般人想的不一样,他基本上没有提什么特别硬核技术的东西。他提的全部都是一些运营细节的东西。
比如说,如果你这个车出了一些问题,你卡在路中间了,你没有什么机制把它弄走,你不要去影响其他的车流。比如说碰撞之后,我能不能远程打开门,以及说因为现在其实你就算车上不坐人,你肯定远程有一个操作员要去控制这些车的。他可能一个人盯三台,或者一个人盯十台,这也是大家设想的未来降低成本的方法,但万一说这个远程控制,通信中断了,你有什么办法去保持安全等等。他讲的全部都是这些。当然,马斯克的发布会上是这些都没讲。
对,马斯克的CPM,就他的cost per mile完全没有设计这些东西,而这些东西就像我刚才说的,才是无人驾驶技术发展到后面,接下来几年大家都需要努力去解决的核心问题。所以我觉得Kyle Vogt他给的这些点,都是实实在在的点,可以看得出来,他是属于比较上手干活的那个。我觉得那个CPM框架之所以好,就是曼琪你刚才提到的这些指标,很多都可以放到CPM的框架下。
举个例子,比如说一个车停在马路中间了,那么停在马路中间这件事情,就牵扯到两个问题:就是我多快的能去做救援。越快的救援就意味着我就要让一些人员standby的成本就非常高。对吧?那如果我说我第二天再救,那没关系。 那这个成本成本救援成本就会很低。但是他对社会造成的压力,以及这个社会压力反过来给公司造成的损失就会很大。所以其实无人家很多时候是工程问题,就是你快点救有快点救的麻烦,慢点救有慢点救的麻烦。
但是我们要在CPM上找一个均衡,就是到底多好的救援是一个能最终省钱的救援,因为它会有总会有这个直接或者间接的影响,反映在CPM上。但是这些问题我觉得你刚才提到的几乎都可以放到CPM的框架下,而这些问题其实恰好也就是无人驾驶充刺到比人类司机更便宜所缺的就是运营成本。
那比如说还有我在那个Elon Musk的发布会上还看到也很有意思。他说我们这个车因为是要作为一个公共的系统给很多人做,那比如说其他的乘客把车弄脏了怎么办呢?没关系,我们有机器人能去洗车,洗车当内部。那么我就问你多长时间洗一次,对吧?洗车的成本有没有放到这个CPM里边?显然是没有。
但是我觉得如果从CPM行业规范来讲的话,正如说每一个这个就是净利润,这件事情是一个很好的accounting的一个数字,就是很好的一个会计的数字。那么我们也希望是CPM是一个包含了全部直接或者间接影响的数字。这些数字都应该算进去,你的洗车当然要算在你的驾驶里面,因为洗车也是你运营的一部分,而且是不可分割的一部分。
你刚才讲说你觉得行业应该要形成一个CPM的共识,我听下来我理解是两层意思。一个就是大家都认可说这个框架很重要,另一个就是大家要去有一个共识说这个里面具体它的成本都包含哪些成本。第二点我觉得比较好理解,第一点其实现在可能这个阶段会有一个比较大的疑问,就是我们现在就来讨论CPM,那前提是其实你这个东西的技术上已经比较ready了什么,但现在这个技术还在快速的发展。
为什么现在这个阶段就要以成本去作为一个指引的指标?就是技术的发展跟CPM的下降不矛盾,甚至它们是相辅相成的。如果你一个早期技术,那我们还是回到这个航空天的例子上来说,早期的技术比如说是这个航天飞机,航天飞机诞生之初,它发明的这个准则是说我做一个可重复使用的飞行器,这个可重复使用的飞行器就能够自然而然的降低成本。
那这显然是办公室决策啊,它是没有真正深入一线的。当第一架第二架航天飞机造出来以后,每次航天飞机落地再起飞,要做的维修工作甚至比我直接造一个一次性火箭还贵。所以很长一段时间这个航天飞机的运营成本,反倒是比这个就是美国的航天飞机的运营成本,反倒是比苏联造火箭然后一次一次的单次使用的成本要高。
那后来呢还是Elon Musk对吧?他说我们要把一次性的火箭转化成多次发射多次使用的火箭。那基于这样的第一性原则呢,SpaceX才会去说我不管是什么形态,航天飞机也好,火箭也好,我不管,我只要便宜。这个第一性原则最终导致了这个可重复发射的火箭。当然它可重复发射火箭里边也不是任何什么东西都重复,也是说以尽可能节约成本为第一性原则去往下做加法或者做减法。
在这种情况下看的话呢,其实我觉得CPM的前进,你不应该去把它定义在某一个具体技术之上。技术可以天天换没关系,但是技术发展的大方针应该是在保证安全的情况下尽可能的去降低CPM。所以恰好就应该是在技术发展的过程当中,我们应该用CPM作为指导行业发展进步的一个指挥棒和一个标尺。
像我刚才说到的激光雷达嘛,对吧,还是那个意思。就是你现在不要跟我提要不要激光雷达,这不是一个主意之争,这个黑猫白猫抓着号的就是好猫之争。激光雷达如果是低于一分钱的成本,因为刚才我稍微一算,低于一分钱的成本,那如果能上激光雷达,感觉安全性能好很多,那自然要上了。现在没有必要去讲究什么,我不上激光雷达所以我的技术比别人更先进,不是这样的。
那选不选某一种传感器会不会导致你的技术发展路径不一样,然后导致你性能是不是一样?因为当时马斯克就是要求不用激光雷达,他其实让他的这个视觉能力倒逼他们去发展的比较强,包括为什么后来做断到端也是因为你视觉再往上做已经到顶了。
从信息论意义上讲的话呢,激光雷达带来的信息永远是一个增量信息。就是这事我们不应该去跟乡农老爷子叫板说,我们没有这东西反倒逼有这东西好,不是这样的。我觉得所有的技术好坏不应该由工程师的这个所谓的taste来决定,这个东西因为优美所以好。我们现在面临的是一个工程问题,这个东西安全或者不安全它是一个客观标准的,这个标准跟技术无关。
能达到这个标准这个技术就够好了,不能达到这个标准的你回去改进技术。你可以通过倒逼算法改进这个技术,你也可以通过家装传感器改进这个技术。作为一个产品的角度来讲,我不在乎我用了什么技术,最后就是跟Robotus本身不那么直接相关,但也是在大的这个机器人范畴。
就是他这次发布会上其实让很多optimus亮相,最后变成了一个大的party。他自己就长了20分钟,后面可能有一个小时吧,就是有很多机器人来服务人。有跳舞的,有给你端水倒酒的,给你猜拳什么帮你唱生日歌的。有些观点会认为说这次虽然无人出租车好像没啥亮点和惊喜,但是特斯拉的这个机器人的表现,它的这种动作的丝滑程度,它和人互动的程度还是让人有些惊艳的。
那关于这个我可能因为首先我不是机器人行业的专家,所以我不太好评价它的这个水平相对于其他公司的相对发展更快或者更慢或者怎么样。我听到的更多是从业人员给我的一些反馈啊,就是分三层。第一层的从业人员说哇好厉害啊,这个不光无人驾驶还有机器人很厉害。第二层说嗨你别看那些机器人,那些机器人都是远程遥控所以这个不行肯定是有问题的。
但是第三层呢,真正机器人行业的从业者说哎,虽然是远程操纵,但是他们这远程操纵也比别的ABC一家公司做的厉害做的好。所以我觉得这三重不同的认知恰好表现出了这个就是所谓公众意志和事物发展客观规律之间的一个矛盾。具体的从业人员看都是技术细节,可能有可能呢都是指缘身在此山中,所以他们想的就是哎,就是算是有了远程遥控,这个优化做的也是为别人好的所以要肯定。
但是呢,如果你退出这个具体的工程实现,你会在一个更大的尺度上你去看这个产品形态和产品价值和商业模式,你会发现你都远程遥控了,你这玩意儿有什么商业价值啊,对吧?所以就是位于第二层的人不会去管第三层的微小技术进步,但是会看产品价值。那于是第二层的人会觉得这个发布会说会觉得不好,然后但是在第一层更广泛的人民群众呢会说啥也看不懂,反正我就是来看戏我觉得挺酷的。
所以我觉得这个恰好表现的是不同的精细度对这件事情的看法。那这些不同的层次的观点都应该综合起来构成一个所谓的这个公众意志。其实人形极权这个行业现在应该是你所说的这种阴阳博弈,就是大家认为它能做到什么程度和它实际上能做到什么程度分歧更大的一个领域就相比相比自动驾驶可能要大得多。
正如2016年的自动驾驶我想说,我觉得它可能比2016年的自动驾驶还早期,因为现在这些机器人没有办法真的自己在工作和活动,对吧?就像你说的,它其实背后要有一个人去操控它的。那2016年自动驾驶起码可以开的吧,在路上,虽然可能只能非常小的范围,那现在在厂房里边的机器人也是能拧螺丝的。
对,这涉及到另一个我觉得也算是一个误解吧,其实从2012年之后机器人架AI这个事情已经在发生了,并不是说在大模型之后才开始发生的。现在的工厂里本身也有很多有一定的自主性可以干活的机器人,这还是另一个话题了。最后想聊一下这次发布会的可能影响,其实这次发布会也是马斯克队内对外官宣进入L4行业,这赫特斯拉之前做的高级辅助驾驶可以说是两个范畴。
相当于是L4领域迎来了一个来势汹汹的新玩家。你之前说过马斯克声称要发RobotX这件事情,就会导致你们行业,我是指的L4行业里的很多人就输了。因为不管他做的成还是做的不成,可能都会有很多人跑来质问你们。后来实际这个发布会结束之后是什么情况,可能那个时候我也是有点过于悲观了。
现在看起来我说这个发布会让我比较惊喜的地方,就是看明白这件事的人呢比我想的还是多的多的。我听到的更多的是共识,第一呢,就是说这个发布会果然就是个话题的发布会。第二呢,就是CPM就像我刚才说的,已经渐渐成为这个行业的共识,就是说你别,我也不管你用什么技术,对吧?到最后呢,保证安全的前提下,你越便宜,这个东西越逼近它的这个量产,越逼近商业化。
所以就是CPM现在已经渐渐成为一个大家都认为需要发力,都认为应该用CPM去来定义一个公司的发展前进路径的这样的一个事情了,所以我觉得这个是好的。嗯,其实马斯克自己也提了这事嘛,如果他觉得这指标不重要,他肯定发布会也不会说。我倒觉得发布会本身不重要,但是因为它的热度和这个它这个新闻性,通过这个发布会看大家的反应,反倒是能够让我们更好的去说这个因的那一部位,就是说公众意志的这一部分到底是朝着哪个方向在前进的。
我觉得现在来看的话,它的这个建设性是大于它带节奏的误导性的。接下来我们可以从这个发布会进一步的延展啊,就是聊聊目前自动驾驶行业里的一些实际情况和弥漫的烟雾。因为从去年到今年这个领域其实进展也非常快嘛,尤其是它出现了很多新的流行词和Buzzword。
一个最闪亮的明星肯定是你最开头的时候有提到的这个端道端特斯拉,它今年的Robotax的发布会,为什么在之前的一段时间里,我觉得大家还是很期待的,就是因为从去年底到今年初FSD V12确实有一个很大的表现的提升,这个提升按照马斯克的表述也是因为他们使用了端道端的技术。因为你自己在美国生活你也开特斯拉,实际上你体验FSD V12是一个什么感受?
开的没那么频繁啊,就是我老婆的车是特斯拉,所以时不时借着开一开,大概可能一个星期做一次测试员吧,反正至少在休斯敦十分钟一次接管算是运气好的,运气不好的时候可能刚出门就接管。关于这个端道端我觉得这个事情实在是比较不好,它是带节奏的。我总结了一下,端道端这件事,它叫技术的意识形态化。我觉得现在国内的很多宣传基本就是你是端道端,你厉害,你先进,你不是端道端,你就是基于规则的什么无人驾驶,那你就是上一代的技术,你就要被淘汰了,根本不听你讲细节。
你是不是端道端?你是端道端,那你是革命的。你不是端道端,那你不行,你就是上一代的腐朽的意识形态,就开始打击。所以我觉得这一事情是特别不健康的。然后当然你说我懂不懂端道端,当然了,我比挑战我端道端那些人肯定都懂端道端,但是我不能上端道端,我是有原因的。
所以我觉得无人驾驶技术,其实大家不要去想用一个简单的名词就把一大堆的概念涵盖在一起。因为任何时候你用一个几个字的词汇去描述一个特别复杂的概念,一定是有很多失真的。这恰恰是这些小的技术选择最后决定了第一,你安不安全,第二你的运营成本怎么样,这种反映在CPM上。
那简单来说一下的话,端道端是一种什么思路?然后你说的被舆论认为是上一个时代的落伍的基于规则的技术,它又是一种什么技术?我觉得就是说首先人工智能这个技术或者说深度神经网络发展到了一定程度以后呢,你就变成了你有一坨数据,然后你把这坨数据扔给一个你也无法解释的网络,最后你得到一个输出。
然后人们又进一步的发现,当然这个跟原始paper说的也不一样,但是呢,我现在就说的是意识形态化以后的一些概念。人们又进一步的发现你数据越多,算力越强,你最后的结果就越好。这件事情就构成了某些人的这个非常简化的一个思维,就是我不管你的技术水平怎么样。你第一,你是不是完全用一个神经网络的算法来去做优化,而不要人工插手这个优化。
你只要任何地方有人工的插手,你就不圣洁了,你就不先进了,你这就是基于规则的,这事就是不好的,这是端道端的意思。但事实上就是首先有些事情是要通过学习来解决的。但另外一些东西不是通过学习来解决的。我举两个例子,一个是车辆行驶的物理规律,就牛顿力学,这事你不要用机器学习的方法来学,这个学这个事情就是舍尽求远了。
第二就是人类的驾驶规则,规则这个事你也不要去学。当然你说理论上你用无限量的数据,而这个数据质量又无限的高,你是不是能够让神经网络学出来一套符合规矩的,或者是符合交通规则的行为的策略的集合呢?当然也能,但问题这里边有第一无限的数据,第二无限高的质量的数据,这两件事情都不能被满足。
所以end to end在我来看,它第一不是解决一切问题的根本。我们要意识到任何的技术它都是这个历史长河中一朵小小的浪花,它的技术是要往前发展的,就要先承认这个技术不是完美的,然后再往前发展。然后再有一个就是人们经常会去说我有这个scaling law,但是这个我指的是意识形态化以后的曲解过的scaling law。
原来那paper大家都可以去读一读,人家不如这意思。在这个意识形态化下呢,就是我多一些数据我就厉害,我数据越多就越厉害。但这个事情明显是一个非常懒惰的思维,就是数据越多越厉害,这件事是一个无用的真理。可能几十年前,任何的machine learning算法都会存在一个数据越多效果就越好的这样的现象。
但是之所以machine learning这个行业,机器学习这个行业不断的在发展,不是人们抓住一个数据够多的救命稻草。就是20年前40年前的很多nonparametric learning的算法,或者说任何nonparametric learning的算法,都具备这样的属性,就是数据越多效果越好。但是人工智能或者说machine learning这个领域,过去四五十五六十年的这个人们的努力,一直是让算法在进化,不断的搞出更聪明的算法,而不是说现在我别的不管了,我就陆起袖子开始加大算力。
加大算力永远是这种蠢人的做法。如果没有被简化的这个scaling law的版本,你说的原始的论文里,它会是怎么描述的?它指的是特定网络结构下,在特定任务上,当然scaling law这个事本身,如果你上wikipedia你肯定有更广的更远的解释,但是我说在machine learning或者说在当下很多人援引它,援引的处处收看AI的那篇论文,对它当时讲的应该是transformer这种架构之下的。
就在特定网络结构,就是说在不改变算法不让算法变得更聪明的前提下,在具体的任务指标上他发现了这样一个东西。那蠢货的问题都在于他们的无限外推,找到了一个片面的认知,就把这个认知推广到宇宙的各个角落,这是不对的。我觉得我们可以回到端道端,就是端道端是不是它有一个改进是说,我把自动驾驶本身它三个模块嘛,感知、决策,然后控制。
他把感知和决策给它贯通了,然后它会带来一些性能上的提升,或者说感知到决策这两个模块。因为就算是端道端,就算是一个神经网络,你也可以把这个网络作为一个图graph,你可以切一刀,切一刀以后你可以说认为这边是感知,那边是怎么样的,这个都好说。那么其实端道端要做的事情,它想强调的点是一个神经元的集合,和另外一个神经元集合之间的通信的带宽增大了。
但是这个带宽增大,你是端道端还不是端道端都可以达到。但是我承认就是这个带宽的增大,是一个非常有价值的事情。假设我们做一个过度的简化,这个自动驾驶算法里面,你会发现说有一辆车在往前开,你不光要告诉这辆车在往前开,你还要告诉说这辆车的大小是什么,这辆车的行驶轨迹是怎么样,以及这辆车的遮挡情况是如何。
如果你能把这些边边角角的一些其他的属性,都告诉你的运动规划的算法,很有可能这个规划算法就能够规划出一个和之前不一样的路径来。也就是说上下纹的重要性,你如果让路径规划算法能考虑更广的上下纹,而且每一个物体的上下纹能够之间有一个互通,那么这样的话路径规划一定是能做出更好的结果的。
所以这是一个通常的对于机器学习而言非常有价值的一个东西,就是你的信息量越大你当然就能做出更好的决策。端到端实际上是他提出了一种网络架构,而这种网络架构恰好满足好几个刚才我说到的这样的优点。但是同时端到端这种架构也没有必要的增加了一些其他的一些限制因素,也就是说中间你不能碰的,中间你不能干扰的,这些限制因素。
这些限制因素在我来看是完全没有必要的,所以我没有必要去效忠端到端。但是我觉得这个网络结构的迭代和升级朝着这个方向去前进,朝着一个模块和模块之间共享更多信息的大方向,这个是绝对正确的。
对,你可以把这些限制因素展开说一下,因为你刚才也说其实你是了解端到端的。 所以你们才没有在现阶段来用这个东西,那它目前的缺陷或者说问题是什么?就是你不知道这个系统是怎么做对的,你也不知道这个系统是怎么做错的。这件事呢就是说这个AI的结果是不可解释的。不可解释带来一系列问题,第一你不知道它是不是合规的,你也不能保证它一定会做出合规的行为。然后第二就是说如果当系统不合规的时候,你怎么能让它修完以后它能变得合规,又是一个链单一样的玄学。
所以它在有人在车上的这种L2或者说L2到L2.99吧,这个阶段它在应用上是可行的。如果在L4上它就不可行,你是这么认为的。对,就是你可以认为有这么几类啊,就是我们谈一个产品呢,产品都有这个叫做best case performance、average case performance和worst case performance。就是在最佳情况下,就是你去秀demo的时候能表现出的行为来,或者说正常情况下的行为。但是对于无人驾驶游戏L4,它一定要看的是在最糟糕情况下,它是不是还是能够化险为一保证安全。
因为这个最糟糕的情况只要不能够解决,那它带来的后果都是任何公司都无法承受的。所以我觉得就是end to end的这个系统呢,它在average case或者best case情况下,它都做得不错。那就是说你看咱们也见到很多这个大语言模型去平时写个小作文什么的还挺方便的。那你让大语言模型去给你搞一个什么法律诉讼,出个法律文书吧,那他就是之前就有一个律师被发现,法律文书里边hallucinate出来了一些奇怪怪的东西。就是在这个最差情况下,它是对于它的结果的质量没有一个最低保证。
所以任何英文叫mission critical,就是在一个你不能容许它失败的任务上,直接无脑的上这种end to end learning,那基本上就找死。作为这个一个L4从业者呢,我们需要的是一个explainable AI,就是这个AI必须可解释。如果是end to end你可以认为就是你有一根管,进气口呢你就吹一大堆数据进去,然后出口就是出一大堆你也不知道是什么的东西出来。
但是我们要在中间去检查它的气流,那我们就要把密闭的这个管道呢中间扎几个洞,让这个早期中期晚期的这些小洞里边都能有些东西出来。就我们把这个管改造成一个长笛,那我们就能够从这个小洞里面去窥见它里面的执行机制是怎么样的,确保这个东西在执行过程当中永远是有一些足够强的限制,或者说它本身是可解释的。
说到这个其实发布会上马斯克还说到一个点,就是在他们这个Cyber Cap也就是现在没有方向盘的这个版本量产之前,你自己买的Model 3啊,Model Y这些车就可以去路上拉客人。那实际上也会面临合规的问题对吧?就我们基本上可以认为这句话是不太可能实现的短期内。对,不可能实现,那么撞了人算谁的,这个问题谁解决?撞了人如果是算车主的,那哪个车主敢把自己的车放出去搞这事呢?那么哪个车主就死定了。
如果特斯拉要来做一个Robotaxi的运营,它是不是还是得像Waymo那样,我先从一个小范围开始做运营测试。我觉得应该是吧,想不出来别的路径。当然它要不要做就是另外一个问题了,这个全都是假动作呢,还是说它有可能哪一天真的要做,这个拭目以待吧。
然后除了端到端之外,今年各家也都在提的一个东西还有世界模型。 当然世界模型这个概念可能就是被说得更反了,就不光自动驾驶行业再说,比如说理想未来Waymo都有类似的表述,像这个做大模型的OpenAI最开始发Soro出来的时候大家也会说这是一个世界模型。
可以简单说说就是你理解的什么是世界模型吗?行的世界模型这事我得先说,就是我现在接下来的讨论就都不是意识形态化的讨论了。因为我觉得任何时候谈到意识形态化的话,就是狗咬狗。世界模型这个事如果我们真的去探知一下,用一个善意去探知一下每个人去讲这个世界模型的边界,其实真的回归到这个computer vision的祖师爷David Maher,他在197几年就提出了所谓的mid-level representation,叫做中层视觉表达。
这件事呢就也恰巧就是我对于computer vision这个行业的启蒙就来自于David Maher的那本书。这也是我非常坚信,我觉得如果要想了解智能的本质就应该去了解它的internal representation或者叫mid-level representation。我也是怀着这样的信念从2006年就好多年过去了,对吧?18年前投身计算机视觉这个领域,包括我的博士论文也讲的是mid-level representation,叫做中层表达。
你06年是在上本科吗?对,大二的时候。你当时是为什么大二的时候要去看这本书,包括有长期这样一个例子说我就想干这个?这个说来话长了,那就更早的时候呢我其实之前做网络安全的。但是我越做网络安全越发现网络安全我做的再好我也不会凭一己之力去改变世界。所以我必须做一个可重复的或者说可复制的一个生意。
这样的话我做了一份我就能复制很多份,并且这很多份都能够产生价值。所以在这个大思路的驱使下吧,我其实就挺早就决定要搞AI了,因为我觉得AI这个事情好,所以我只要把一个AI做好呢,它的能够产生的社会影响力是会比我什么发现一个著名网络漏洞,产生的世界影响力要大得多的。因此,怀着这样的想法呢,我就开始去大一的时候吧,开始去看各种人工智能的东西,当然看的也很杂了。
但是我最打动我的其实是David Martin的那些理论,就是说一方面我们是从人脑的神经院入门去窥探意识,会窥探智能的本质。那往这里边走的话非常重要的一个概念就是mid-level representation。这个representation其实我就是觉得它就是当今大家都在谈世界模型,所谈的这个事其实都是在谈representation。那我就再打个岔,比如说人工智能领域有一个非常著名的一个会议叫做 iCLEAR ICLR International Conference on Learning Representation。
这个里边也是他把这个坑就占的非常好。他就是说我们对于一个外在世界的内运表征或者内运表达都是可以学习并且应该学习。这个学习不是指这种什么上学的这个学习,是指说机器学习的具体算法叫做学习。那么就这些内运表征都是可以被学习的,而且应该是通过学习内运表征最终达到智能。
其实我们如果忘掉无人驾驶,忘掉机器人,我们就谈这个人类的智能是怎么产生的。你会看,或者说动物的智能怎么产生的,那个脊椎动物的智能主要为主啊。那基本上都是说视网膜先做了一层分析,能够把一些光点,我认为有一些具体的颜色进行一些最基础的处理。随着这层处理以后呢,视网膜处理完以后放这个到后脑勺那边有一个初级视觉皮层进行进一步的从很小的区域的处理,变到一个更广的区域的处理。
于是我们能够在初级视觉皮层检测到边缘,检测到边缘再往上走,到这个次级视觉皮层VR,检测到轮廓,检测到遮挡,检测到甚至物体的概念,运动的概念。这些物体的运动的概念以后再进行的是物体识别,一层一层往上走。 甚至说具体化的人脸识别、表情识别,那最后呢?这些识别有的东西会极致的细化到,所以你有一个脑子里边有一个神经元,能够对且紧对你的祖母,就你的奶奶有反应。那这个就是著名的祖母细胞。那么这个过程就是智能。
那如果我们把这个过程谈到智能的话,你会发现这是一个很长的pipeline。那么在这个pipeline里边早一些的处理,比如说对于边缘、对于轮廓的处理,它有没有用?当然有用。晚一些的处理,人脸识别有没有用?当然也有用。甚至人脸和声音的结合也有用。
所以在我来看呢,我们应该基于的是一个mid-level representation,或者说应该是基于一个所谓的世界模型去认识这个世界。但是不要说只有这个认识过程的最终点的一块有用,中间你加了就是作弊,加了就是不纯粹。就这种观点就是红卫兵的观点了,我们肯定是要强烈反对的。
但是在我来看,世界模型只不过是新平庄舅舅。应该是79年的时候,David Mark写完他那本书呢,白血病就去世了。所以这也是我们行业的一个重大损失。但是其实79年,机器视觉行业的祖师爷就已经提过了这个世界模型了。当然我们觉得随着这一代又一代科学家的努力,这个世界模型变得渐渐我们看到它的模样了。我觉得这个还是非常令人欣慰的一件事情。
那简单来说,世界模型它要解决一个什么问题了?就是它要实现的目的是什么?当然每家人讲世界模型讲的东西都不一样了。就是以这个胡小迪的理解来看,这个世界模型就是说通过一个很漫长的信息处理的过程,使得物理世界的各种各样的属性能够在这个信息处理的过程中涌现出来。它涌现的地方有可能比较偏前面一点,有可能比较偏后边一点。任何的具体的任务、具体的属性、物理属性都是能够通过这样的处理过程自然而然地发生。
那么这个处理过程就产生了一个信息的宝藏。如果我们需要一个产品产生一个具体的任务,那么这个具体的任务是可以在这个所谓的世界模型里面找到它合适它使用的原材料的。这些原材料的处理过程是智能的过程。
具体到自动驾驶这个领域的话,世界模型可以提供什么功能啊?比如说楼天成就是小马的CTO,他就会认为世界模型的短道端更重要。他讲的一些东西我理解的是,比如说你可以提供一个仿真环境,同时你可以提供一个裁判吧,就是去评判你这个自动驾驶系统到底进化到了什么程度,它的表现到底是好是坏。
你觉得世界模型在自动驾驶里是什么作用?那你看,我觉得我跟他的理解就不完全一样了。我是比较原教旨主义者的。那比如说我们无人驾驶要去把所有的感知任务拿过来,那我们需要去知道这辆车的速度是什么。那我掏一掏这个口袋,这个口袋就是世界模型,这辆车的速度都在这个里边。
信息的智能处理的过程,就是把东西从像素一步步地翻译,这个处理过程就形成了一个巨大宝藏。这个巨大宝藏就是我们说的世界模型。在这个模型里边,我们能够很轻易地获得我们需要的所有的物理属性,完成我们的任务。
仿真环境在我来看是手段,就是你用什么环境怎么样都好,它只是帮助了你的学习过程。任务是要把这个固体的内运表征学出来,当然有了这个内运表征你怎么用,你反过来你可以说仿真环境能用这个内运表征,但是除了仿真环境还有很多其他的东西。谁都能用你的内运表征。
其实还想问的一个问题是说,现在自动驾驶已经发展了十几年,然后大家也目前看到一个路线好像是在逐渐收拧的。那沿着我们现在这个路线就可能达到L4乃至L5了吗?就是大家凡是提到L5,我觉得是有一个误解,L5本身提出来的时候就不是为了让你达到的。这个定义者在定义这个问题的时候,其实就是一个我既然都定义了这个问题了,所以我也得定义一个这个问题的终极最终乌托邦形态。那么这个乌托邦形态就是L5。
所以就像地平线一样,你永远能看得见地平线,但你永远达不到地平线,就是这样一个意思。那L4反过来就很好说了,L4是产品。产品到最后就是你谈产品就得谈怎么挣钱,挣钱嘛,生意不寒碜。我觉得技术问题就是商业问题,是一个问题更需要的是说L4到底能不能挣钱,到底什么样的技术能够让L4的运营成本变得特别省心。
能挣钱呢?这件事情今天没有达到还。在今天还没有达到目标,就是让L4挣钱上。你觉得有什么绝对性的限制因素吗?因为你之前说过,愚者的一个问题就是不加节制的外推,因为大家会忽视一些限制性因素。
对,我觉得首先就是今天,甭管是Waymo还是百度的罗伯快跑,都没能挣钱,对吧?这个是一个大家都承认的事情。但这事也不寒碜,就是我们今天确实技术还在往前走,但是可能对于整个行业来讲,第一就是说算法的进步,是要跟你的软硬件的成熟度所配套的。比如说如果我们面临一些非常不稳定的硬件,可能就需要在软件和算法上多花更多的精力,所以现在还是在一个收敛的过程当中吧。
但是呢,我认为这个收敛里边有一些因素,它的收敛速度,我感觉可能是遇到了一些瓶颈。我举一个具体例子,就是说很多人说远程遥控嘛,对吧?我也听过一些朋友讲远程遥控,但是我自己也没有太多的坐Robotaxi,所以我肯定这是以听别人说为主。但是远程遥控现在看起来就是大家都纷纷遇到瓶颈,也就是说为了能够让一个人类乘客在接受无人驾驶的服务的时候,出现了一些城区内的,比如说要么是别人不守交通规则,要么是自己的车开的太慢,这样各种各样的问题的时候,能够更快地解决这个问题。
远程遥控和这个无人驾驶车辆的比例现在可能是1比3是一个常态,但是什么时候能从1比3变成1比10,这个时候大家其实心里都没底。我就这一点上很有可能我们会遇到一个比外界估计的花的时间更长的时间,才能够解决一个人驾驶车辆这样的问题。因为第一,任何时候车出了情况都需要有人去立刻去看,乘客是没有耐心的,乘客不会等你一分钟,然后你再去给他解决这个问题。
第二,城市交通又不是那么符合交通规则的,比如说前面稍微压一下双方线,我可能就蹭过去了,那我要不要压双方线呢?很多时候如果你直接去让无人驾驶去做判断,很有可能是不要。但是在这种情况下,是不是人类可以远程遥控一下,压一下双方线。这些事情一方面是需要更多的人的社会属性去做一些判断,第二就是说乘客的等待时间永远是非常短的。
所以为了提供高质量的服务,远程遥控一个人能拖几辆车,这个事情的进化我觉得不一定很乐观。我们最后可以聊聊你自己的创业,你刚刚也提到了,零星提到了一些信息,我们可以展开说一说。首先是恭喜你们刚刚宣布了一轮融资,2000万美元。自动驾驶这个行业其实这几年的融资水温都是非常冰冷的,所以下相信这个方向的投资人他们的理由是什么?
我觉得这个里边既有投人的理由,也有投项目的理由。我觉得一方面可能确实之前至少我在技术和技术管理上还是表现出了很强的竞争力的,所以确实很多很多的人哪怕是一些没有最后投bot的投资人都会有这样的说法吧。但我也很荣幸啊,有的人说这个要是谁能在未来五年之内无人驾驶卡车做出来呢,肯定就是你了小弟。但是我们不投是因为我们觉得谁都做不出来。
所以有的投资人是怀着这样的想法,最后就没有投。但是呢,凡是投了我们的投资人呢,那肯定是首先对我是认同的。但是他们的决策数里面第二点就是说现在是不是无人驾驶合适的投资时间。很多投资人跟我讲过这样一个事情,他们之所以之前按兵不动,是因为他们无法回答自己这样的问题,就是无人驾驶当时是不是太早了。
但是现在看起来呢,我觉得在这个时间点大家都是有比较清晰的共识,无人驾驶会发生,接下来不是技术问题。所以这就是为什么我比较开心的地方,就是你看越来越多的人聊CPM,而且聊得这么自如,就是每一个运营成本CPM。所以这个时候我能看到是有人在闷入场的。
当然,此外就是无论是Waymo啊,萝卜快跑,还有其他的文远啊Pony啊,他们其实都在已经在做运营了。所以这个事情成不成不是一个技术问题,而是一个技术优化问题。就是技术优化导致到最后让它变得CPM变得有竞争力。我相信大家逐渐有了这个共识以后,接下来我们融资的路可能会走得好一点,因为对投资人而言,他们也这是最后一波投资无人驾驶机会了。
因为如果我们这个技术再往下发展,发现无人驾驶技术自己就能挣钱了。所以其实这个问题就是五年前、可能七年前、八年前大家担心的是技术行不行,技术现在差不多已经没有问题了,那就是运营行不行。运营没有问题的时候是不是也就没有VC什么事了?所以我觉得可能越来越多的人会从这个角度去看这个问题,就是这是最后一次VC能投无人驾驶的机会了。
所以我觉得我们这次融资还算比较顺利,而且也是抄目的。你可以讲一下你们现在大概的业务是怎么运转吗?比如说你刚才有说到其实你们是不做这种远程托管的,所以你们并不会真的去拿掉一个卡车司机,是吗?
首先我们现在是公司还在早期啊,我们现在还是在有人的在做各种各样的测试。公司刚成立一年, 这个还没那么快,这是第一。但第二其实就卡车跟轿车比一个特别大的点,就是说第一卡车里边运着货,这个货不像乘客一样,一分钟没人理他他就急了,对吧?
所以我们允许这个车比如说停在路边,我就晾你10分钟,无人驾驶车也不会跟我们着急,这是第一。第二就是说大部分的超长的距离都是在高速公路上跑的,而高速公路上面它的这个交通规则是相对比较清晰的。不会说我必须压双方线绕过前方停着的那辆车,我才能够进一步的继续行驶,不太会出现这种说不清道不明的事情。
而在城市交通里面这种情况实际上非常常见。所以我觉得我们是比较容易获得一个不需要接管,就能够解决绝大部分问题的这样的一个系统。这是我们比人类司机的一个优势,或者说比城市交通、比城市的robotaxi的一个优势。
你刚才也说到其实在七八年之前或者五六年之前,市场都是觉得这个行业非常早期的有一个疑问。那回头来看就是你上一家的公司图森是在21年就上市了, 你觉得有什么可以复盘的吗?整个节奏上。
我觉得其实无人驾驶这个事就变成这样,就是公司里面有的部分团队就是在做技术,比如说我是带着一个做技术的团队,我也把自己很舒服的安排在做技术的位置上。但是实际上公司就虽然是一个股票代码,一个股票代码下就产生了两个公司,一个公司在做技术,另外一个公司在搞扩张,在搞运营,在搞收入。
这种搞扩张、搞运营、搞收入的公司,我觉得我作为创始人的问题就是说我一没有过问这个事情,然后第二就任由它发展,发展到了运营可能占了公司一大半的成本,就是钱全都花到运营上了。但是技术团队还是那十几辆车,还是原来那两三百个人还在做技术。这个事情就导致我觉得一个公司如果说一方面认为需要靠运营去刷一些收入,刷一些单,拿这个单能撬动更大的融资,但实际上撬动更大的融资这件事本身就是不可持续的,还是应该回归技术本身。
所以我觉得这次在重新做boss的话,我确实是有一些思考。我觉得我们应该尽可能地避免过早的扩张,过早的去搞输入,对吧?就revenue这个事以前可能不懂事我也不懂我也没管,但是现在就是说我懂事了,管了,一定是不能有以revenue为刚的这样的心态,也不能基于revenue去建一个团队。
现在我们要做的事很简单,就是以cpm为刚,一些东西朝着这个cost per mile前进。那算法呢,要服务运营,就像我说的算法的选择是会很大程度上影响运营成本的。我们不要让这些最聪明的大脑们高高在上,说我们算法最厉害了,我们就要搞一些特别炫酷的算法。我们现在的运营才是最厉害的。
我们甭管算法高级低级,能省钱就是好算法,黑猫白猫抓着耗子就是好猫。同时呢,如果我们的算法并不需要我们有30辆车在全美国各地各处跑来跑去,那我们就不要去过早的扩张出什么几十辆车在全美各地跑,显得好像我们已经建立起来一个伟大的商业帝国一样。本分一点,在一个小区域先把这个cpm跑通,不要给资本演戏。
回到几年前的话,你觉得当时包括你们在内的各家同行他有别的选择吗?因为那个时候其实竞争是很激烈的,你需要一些动作去吸引更多的钱,同时他也会带来更多的人才,对吧?人家都在扩张你一小团队,那可能人也都跑了。虽然可以说这个历史不允许假设,但是我觉得是有选择的。
那就算图森1500个人的时候那1000个人都不是我招的呀,对吧?就真正你会看推着技术进展、推着事情往前走的,还是那些可能在这个我们一穷二白的时候加入的这些早期员工。这些人构成了一个公司的中间力量,推进的这个技术发展,反倒是说这些后来产生了扩张又因为扩张而加入的这些新人,他们自己构成了另外一家公司,虽然还是独自的名字。
所以我觉得这个其实是很多过早扩张的公司都会有这样的诅咒。其实你刚才也说投资人愿意投你的有一个原因是你积累了这个技术管理能力吗?当然我觉得可能你也积累了很多技术管理的教训啊。你刚刚说的这是其中一个点啊,你觉得还有什么吗?
我觉得可能最主要就是这个技术管理的教训吧。就是公司的战略呢,一定是以这个赚钱为目的的。赚钱不是赚revenue,赚钱是赚profit。如果我们能把这个赚钱赚profit这件事从公司level想清楚,甚至从技术level想清楚,甚至这件事还能回答我们要不要上激光雷达,对不对?
那如果我们这些事情都能融会贯通的想清楚,那就朝着这个目标前进就好了。这时候你会发现很多可能口口相传的,就是硅谷神话里面其实有很多没有必要的操作,有很多都是花架子,把这些东西都去掉以后,剩下的是什么?剩下的就是一堆工程师,天天应该盯着卡车搞运营,然后运营到什么时候我们的CPM能降得比人低了,大工搞成。
你们的新公司Bot Auto是在休斯顿,是在美国的中部。你之前从上海交大毕业,是去加州理工读了博士, 然后图森之前在美国的话也是在加州的圣地亚哥,相当于就是你有一个从美国的科技创新腹地,硅谷往中部迁移的这么一个动作,这个主要是为什么?
还是那句话嘛,运营。就是我最不能够容忍的就是让聪明的大脑有高高在上的架子。但是我觉得我们很开心的就是团队其实没有这个架子,大家都是以那么这件事做出来为最终目的。如果这样的话,我们就不应该去挑我们在哪里做,那我们公司总部就应该设立在一个最能够帮助我们降低CPM的地方,那这个地方呢,就是一个美国中部的物流重镇。
就是我觉得可以讲讲硅谷和休斯顿的你感受到的一些区别吧,比如说像去年硅谷银行这个事件前后有此,我们还聊这个事来着,然后你说挤兑风潮挺有硅谷的风格,这里有很多聪明人会无脑的去跟风和扎堆。那你现在去休斯顿的话你觉得两边的区别是什么?
这个有好有坏了, 就是好处呢是离产品太近,这个20分钟我们就能上车录测。那坏处呢就是离投资人太远,所以时不时的我就得出差。但我觉得我宁可我出差,我也不希望我们工程师出差。以前的情况是什么,是离投资人比较近,也不算特别近,但是离产品太远,什么开车坐飞机都得好几个小时,你才能去做录测。
这是第一个吧,我觉得就是离什么近离什么远。这件事第一个区别。我觉得能够办公室20分钟就出去录测,这件事情实在是太好了,这个事情比一切东西都重要。那第二,我觉得从心态上吧,还是一个不浮躁的心态,这个也很重要。
当然当时为什么选San Diego, 没有选直接把公司开在Bay Area,也是一样道理,就是我觉得一定不要浮躁,不要是每天一惊一乍的,每天这个就是经历什么这个叫做Breaking News Overflow。我这个创造这么个概念,就是说你每天看这种好外好外,世界上那么多事,哪有那么多需要你关注的,对吧?
你说什么纳达尔退役了,你也Breaking News,布吉纳法所政变了,你也是这个啊有这个Breaking News,然后黑神话悟空没拿到这个金鸟杆奖提名也是个Breaking News,其实这些Breaking News跟你有什么关系呢?如果我们说一个人的这个认知的能力是有一个范围的话,你如果你每天都被充斥着这些Breaking News来占领了你的这个认知能力的话,你其实就没有什么心思去想具体的事情了。
我觉得在湾区的一个比较大的感觉就是说,因为信息流动太频繁了,又有很多聪明人。那聪明人在流动信息的时候,他就能够看到一些很小的事件背后,有可能对这个世界产生的巨大影响。于是任何微小的噪音都会在湾区放大很多倍,就是任何一个小的产品的发布,任何一个小的但是新的机会,都让你觉得啊这件事情就是个Breaking News。
于是你每天活在这个Breaking News overflow里面。我觉得在这种情况下呢,我是比较希望我和我的团队能不要那么着急去跟进每天的新闻事件的发展,我们又不是香港记者对不对,图样图simple。但是你在休斯顿的话,我觉得可能会有一个比较常见的质疑啊,就是说你们怎么招到足够好的人?
我觉得你要是信这个事能做成在哪都不重要,而且休斯顿还便宜呢,你看看休斯顿的房价。我其实还有一个正好还有一个想法也可以分享一下,就是说我们这个公司呢,我认为也没有必要做得很大,所以我们现在四十来个人,四十多应该快五十了,到最后呢可能我觉得,如果说真的把这个技术做到这个cost per mile比人类司机还便宜的时候,甚至可能也不会有特别夸张的说我们再搞个几千人的大团队,可能一两百人这个事情就做出来了。
我觉得这也是一个新时代人工智能公司的一个新特性,就是你发现越少的人总是能够越多的事情做出来。这个事情其实反过来也是一个新时代的底色,比如说2022年以后对吧,随着这个XGPT的诞生,Pre-training这个事情变得很普遍,很流行,那Transformer也变得很通用。
那基于人工智能的大流行,整个生态系统也变得说,你随随便便找一个云计算平台,就能几乎满足你的所有的要求,你也不需要一个这种软件基础设施的团队、并行计算的团队都不需要了,然后呢开源平台也会让你这个很多这种别人已经造过七八十遍的轮子也不需要你重新去造轮子了。这些事情实际上都能够让这个团队以一个比较小的团队规模,关注到这个产品中最重要的部分,这也是我这一次组织团队的一个基础原则。
所以就是哪怕我们融了资了,我也公开在融资材料里边写,我说我们不会孤独扩张团队的。这会招一些人,但只会招很少的人。你们今年或者未来一段时间Bot Auto有什么计划吗?就是希望你可以比马斯克讲得稍微具体的。
对,我觉得就是明年年中之前我们不会招超过15个人,这个人头一个个都算出来,不会招超过15个人。每个人要做什么讲得很清楚。我就今年之内可以给一个预告,不知道是你减的快呀,还是我们这个开发的快,很快我们这个Hub to Hub就能够做出来了,就是一个全L4功能的车就能在休斯顿路上跑了。
是有人的啊,这个车就是今年的车是有人有安全员坐在车上,但是呢这个事情更多的反应的是团队一年零几个月的时间就能把这个技术做出来。这些事情当然是有赖于我们的全面拥抱Generative, 没有Generative,我们全面拥抱Pretraining Transformers的这样的一个技术选择。
今天非常感谢小迪做客晚点聊和我们分享了他看这个发布会的一些感受,以及他作为从业者看到的L4行业的一些真实进展和烟雾。如果总结一下今天最大的take away,或者说小迪想表达的一个核心观点就是CPM,即单位综合运营成本的重要性。自动驾驶当然是一项机动人心的技术,但是这个技术要落到实际,要为人所用,其实中间有很多细碎的运营问题、工程问题,那CPM可能就是现在这个阶段能把方方面面的问题容纳进来的一个比较好的指引框架。
再次感谢小迪的分享。好的,那我们今天就聊到这里,谢谢满期,感谢各位的收听,大家再见。本期节目就到这里,欢迎收听。如果你对今天聊的话题有观察、好奇或疑问,欢迎在评论区分享想法,这也会成为我们节目的一部分,让整个讨论更完整。你也可以把我们的节目分享给对这个话题感兴趣的朋友,欢迎推荐更多你想听的主题和嘉宾。
你可以从小宇宙、苹果podcast等渠道关注晚点聊LateTalk,也欢迎关注我们的公众号晚点LatePost。下期再见。