5月1日,在Meta 新开发者大会 LlamaCon召开前,Meta CEO Mark Zuckerberg接受知名科技分析师Ben Thompson的访谈。本次对话,扎克伯格分享了新开发者大会 LlamaCon 的举办初衷,以及 Llama API 的定位。对话进一步聚焦于 AI 如何重塑 Meta 的核心广告与内容推荐业务,赋能商业消息传递,并催生如 Meta AI 这样的原生 AI 应用与个性化助手。
此外,对话还展望了 Reality Labs 的长远规划,特别是 AR 智能眼镜作为未来 AI 交互与社交连接终极载体的构想,并回顾了 Meta 在平台发展、开源理念及长期投入方面的思考。
扎克伯格表示,AI 正从根本上重构 Meta 的广告(趋向全自动成果交付)、内容推荐(从分发到辅助乃至直接生成个性化内容)、商业消息(通过 AI 赋能大规模高效互动)乃至催生全新的 AI 原生应用(Meta AI)。
以下是本次对话实录
1
Llama API
主持人提问:关于新发布的 Llama API,它具体是什么?为何选择现在推出?如果 Meta 不打算通过 Llama API 大幅加价盈利,这是否意味着它可能发展成一项规模庞大的业务,用户为何不直接选用你们的 API 而非其他云服务商?Meta 为何此前整体上没有发展云业务,尤其是考虑到利用已投入的 Llama 训练成本来获得更多盈利方式的需求?针对许多其他公司正从 Llama 中受益的情况,他们是否应该为 Llama 的训练贡献更多力量,这是否是 Meta 正在设法推进的事情?
扎克伯格:我并不认为它规模小。它不一定是我们想要着力打造的一项业务。我认为这通常是人们在看到有公司推出付费 API 时会有的主要设想。我们听到的主要反馈是,人们喜欢开源,原因我刚才已经阐述过了:他们想要一些自己能控制、能定制、没人能剥夺、可以随心所欲使用的东西;它更高效,也更便宜。这些都是开源的价值所在。但直到今天,开源的一个缺点在于直接调用某个现有成熟服务的 API 要简单得多。当然,现在有不少公司专门从事托管各种模型,包括开源模型的业务,我认为其中一些公司做得比另一些更好。我们最近发布了 Llama 4,从中我们学到了很多关于如何推广的经验。但我认为,其中一件不太顺利的事情是,仅仅因为我们发布了模型,很多 API 提供商在他们的实现中出现了一堆 bug,导致许多人对 Llama 4 的初步测试都是通过这些外部 API 提供商进行的,而这些提供商的实现本身就有问题。
即便是早在 Llama 3 的时候,你也能在网上看到很多人讨论:“我想要一个能提供纯粹未量化版 405B 模型的 API 提供商。我很难判断不同的 API 提供商具体用了哪些类型的量化技术,或者走了哪些捷径,质量参差不齐,我们只想要一个可靠的来源”。所以我认为,拥有一个广泛的 API 提供商生态系统是件好事,而且其中很多公司都在做非常有趣的事情,比如 Groq。他们基本上通过垂直整合,自己构建定制芯片来实现低延迟,这真的非常吸引人。他们目前的业务是制造芯片,并构建一个垂直整合的服务来提供延迟极低的 API,这非常酷。我认为,能有一个生态系统,让像 Groq 这样的公司可以利用开源模型,这是非常棒的。
不过,我想我应该重申一下几分钟前您提问时我本该点明的核心观点:Llama API 的目标是为行业提供一个参考实现。我们并非试图围绕它打造一项庞大的业务,我们基本上是想提供一个非常简洁、堪称“原版”的 API,让大家知道这就是我们最初设计的模型,它是可靠的,你可以直接把之前调用 OpenAI API 或其他任何 API 的代码换成这个 API 的 URL,它就能正常工作。而且,我们也没有大幅加价,基本上是以我们的资金成本来提供这项服务的。
它不会为我们带来很高的利润。理论上说,其他将 API 服务作为其核心业务的公司,应该能够提供更有趣、更有价值的产品。比如我们刚才提到的 Groq,他们就在构建定制化芯片,以进行针对特定延迟需求的推理优化。当然。AWS 的价值显而易见,如果你是 AWS 的客户,他们提供了你已经在用于各种不同事务的全套服务。如果你想尝试一些东西,想知道:“好吧,我想开始用 Llama 4 模型了,哪个参考实现是我知道肯定能用的?”,那你就可以用我们的 API,它能满足你的需求。然后随着时间的推移,我预计当用户达到一定规模后,他们会根据自己的需求,在不同的服务之间进行尝试和优化,可能会选择自己托管,或者采取其他各种不同的方案。但我认为,拥有一个易于使用的参考实现,是开源生态系统所必需的。我不知道,我们还没有那么深入地考虑过这个问题。是的,我们还没有那么深入地考虑过这个问题。
关于为何之前没有将 API 作为业务。我认为,对我们而言,其中一个需要思考的问题是:“为什么我们之前没有把 API 作为一项业务来发展呢?” 我们为什么整体上没有发展云业务呢?我认为我们业务一个值得注意的方面是,将增量的 GPUs 分配给优化内容和动态的推荐,或者广告,一直以来都能带来更高的边际回报。完全正确。所以在目前这种情况下,我们认为 Llama 的成长是有价值的,并且我们认为拥有一个参考实现 API 对其成长也很有价值。所以我们认为这是需要存在的事物,但这种经济性考量也正是我不将其视为一项大规模业务的原因。我想如果这最终消耗掉巨量的 GPUs,那么一种观点是,如果它能盈利,那当然很好,我们就应该这么做,并继续我们所有这些推荐方面的工作。而且很显然,你永远无法完美预测应该构建多少 GPUs。
因此在实践中,我们总是在内部进行这些计算:“我应该给 Instagram Reels 团队更多的 GPUs,还是应该给其他团队更多的 GPUs 来构建他们正在做的事情?”,我猜测,在我们内部的 GPU 资源分配优先级上,API 业务会排在相当靠后的位置。但话虽如此,我们拥有庞大的集群,千兆瓦级的数据中心以及所有这些设施。所以,将其中的一小部分用于参考实现,以帮助人们简化上手使用开源 AI 的过程,这似乎是一件好事。不过,这仍然是宏观层面的考虑。我们会持续观察。我认为总的来说,在这类业务中,当人们发展壮大并扩大规模时,你是乐见其成的。
关于训练成本分担,我们和一些人谈过这个问题,但到目前为止还没有达成共识。随着成本持续攀升,情况可能会有所改变,但到目前为止,各个独立研发模型的项目数量实际上似乎仍在增加。所以,那些我曾预料会希望采用 Llama 作为开源标准并借此节省成本的公司,实际上反而转向并启动了新的项目来构建自己的模型,所以我们将拭目以待结果如何。我猜测在未来几年内,训练任务将会在千兆瓦级别的集群上运行,而且我确实认为将会出现行业整合。但我的财务规划是,假设我们自己承担这部分成本。所以,如果我们最终能够与其他人分担,那算是锦上添花,但我们并非必须如此。我认为这是对我们而言相对有利的一点。如果这有助于你的理解,我可以为你梳理一下这方面的商业逻辑。
2
Meta 的 AI 机遇
主持人提问:Meta 整体的开源策略是什么?尤其是 Llama 的开源,其经济回报体现在哪里,特别是当考虑到 Meta 可能需要根据自身情况对其进行调整时?这仅仅是一种品牌推广,还是因为研究人员喜欢开源?在 Meta 的 AI 发展中,哪些具体方面对你们而言至关重要?
扎克伯格:开源的决定是构建它的后续步骤。我们构建它并不是为了将其开源给开发者,我们构建它是因为我们相信我们需要它来打造我们想要的服务。然后,就引出了一系列问题,比如:“你需要处于最前沿吗?你可以落后六个月或者其他什么吗?”,我相信随着时间的推移,你会希望自己处于最前沿。尤其鉴于我们观察到的一些趋势——这里有几点。
第一,你开始看到一些专业化的趋势,所以不同的公司在不同的事情上表现更出色,并且专注于不同的领域,而我们的用例将会与其他公司略有不同。我认为以我们运营的规模来看,构建真正为自身使用场景量身打造的东西是合乎情理的。
这会让我们稍微偏离我刚才回答的问题。我基本上认为有四个主要的产品和商业机会是我们目前关注的,我将从最简单、可能也最容易实现的开始,再逐步谈到那些与我们目前状况相比更为长远的机会。
从这四个中最基础的开始:利用AI 来大幅提升广告业务的表现。改进推荐,让任何基本上想要达成特定业务成果的企业都可以直接找到我们,无需制作任何内容,无需了解其客户的任何信息。可以直接说:“这就是我想要的业务成果,这是我愿意支付的价格,我会将你们连接到我的银行账户,我会为你们能够实现的尽可能多的业务成果付费”。它基本上就像终极的商业 AI Agent,如果你思考广告的各个组成部分,包括内容创作,即创意素材,还有定向,以及效果衡量。可能我们最早开始构建的部分就是衡量,目的是让我们基本上可以拥有一种围绕着为人们交付成果,而不仅仅是展示印象数来组织的业务。然后,我们从基础的定向开始。
在过去的 5 到 10 年里,我们基本上已经发展到实际上不鼓励企业试图限制定向范围的程度。过去,企业会找到我们说:“我真的希望触达这个地区 18 到 24 岁的女性”,我们会说:“你可以向我们建议……但我向你保证,我们会以更低的成本找到更多的人。”如果他们真的想限制范围,我们提供这个选项。但我们此刻相信,在找到会与你的产品产生共鸣的用户方面,我们就是比你做得更好。所以,就有这么一部分。
但创意素材部分仍然存在,这通常是企业找到我们时,他们对于自己的信息、视频或图像有一个概念,而这些内容的制作是相当困难的,我认为我们已经非常接近解决这个问题了。或者我们干脆直接为他们制作。显然,他们总是可以提出建议,或者给出他们想要的创意素材,特别是如果他们真的想要精细调整的话。
但总的来说,我们将达到这样一个阶段:你是一家企业,你找到我们,告诉我们你的目标是什么,你连接到你的银行账户,你不需要任何创意素材,你不需要任何定向人口统计数据,你不需要进行任何衡量,只需要能够解读我们提供的结果报告。我认为这将是巨大的变革,我认为这是对广告这个类别的重新定义。所以,如果你思考一下如今广告占 GDP 的百分比,我预计这个百分比将会增长。因为它确实增长了,但我丝毫不会惊讶它能实现非常可观的增长。
第二点基本上是在面向消费者的平台和推荐系统上提升参与度。这其中的第一步就是更好地向人们展示已有的内容,这实际上就是 Reels 目前的运作方式。然后我认为接下来会发生的是,AI 将不仅仅是推荐内容,它实际上会帮助人们创作更多内容,或者 AI 自己直接生成内容。
你可以将我们的产品发展看作迄今为止经历了两个主要纪元。第一个纪元是,你拥有自己的朋友,基本上你和他们分享内容,也从他们那里获取内容;而现在,我们所处的纪元是,我们基本上在整个创作者内容领域之上叠加了一层。所以,那些来自你朋友、关注者以及所有你所关注的人的内容并没有消失,但我们在此基础上又增加了由创作者提供的海量内容,而我们正在推荐这些内容。
第二个纪元,我认为将会是铺天盖地的AI 生成内容。你并不会失去其他类型的内容,你仍然会拥有所有的创作者内容,也仍然会有一部分来自朋友的内容。但这将是可用内容数量的一次巨大爆发,并且非常个性化。我想指出一点,从宏观角度来看,随着我们迈向 AGI 的未来,生产力将得到极大提升,我认为你基本上会看到过去百年趋势的一种延续:随着生产力的增长,普通人花在工作上的时间会减少,而在娱乐和文化上的时间会增多。所以我认为,这些信息流类型的服务,就像人们获取内容的这些渠道一样,将会占据人们越来越多的时间。AI 越能帮助创作和推荐内容,其影响力就会越大。所以这大概是第二个战略方向。在我们讨论第三个战略方向之前,我会先回答你的问题。
主持人提问:除了您已阐述的广告业务提升和消费者平台参与度提升这两大 AI 机遇外,Meta 还有哪些重要的 AI 创收机会?考虑到生成式 AI 对元宇宙资产创建的推动作用,以及 Meta 应用内海量用户行为细节(如识别网红展示商品并链接购买)的潜在货币化价值,您为何仍然认为需要一个专门的聊天机器人和 Meta AI 应用这类 AI 原生项目?在 Llama 作为一个广受欢迎的开源项目背景下,当外部开发者对 Llama 模型提出特定功能需求时,Meta 如何平衡其最初为自身用例构建模型的初衷与满足开发者社区的期望,例如 Llama 4 Maverick 模型在某些基准测试中得分不理想但实际体验良好所反映出的设计取向?
扎克伯格:第三个重要的AI 创收机会将是商业消息。因为随着消息功能逐步构建起自身庞大的社交生态系统,如果你审视我们今天的业务就会发现,Facebook 的收入相当强劲,Instagram 的收入也相当可观,而 WhatsApp,我认为其用户规模已接近 30 亿——但其收入却远低于 Facebook 或 Instagram。但我认为,包括 WhatsApp、Instagram 在内的这些消息服务,它们本身就应该能构成非常庞大的商业生态系统。我认为其实现方式的雏形已经显现,因为商业消息在泰国和越南等国家实际上已经非常普及了。劳动力成本低。
所以我们看到,泰国和越南,我上次查数据的时候 (可能不完全准确) ,它们大概是我们收入贡献排名第六和第七的国家,或者类似名次,但肯定在前十。而如果你看这些国家的 GDP 排名,它们大概在三十多位。所以这就引人思考:“这到底是怎么回事?” 原因就在于商业消息——我的意思是,我看到一些数据,好像泰国 GDP 的大约 2% 是通过人们在我们的消息应用中进行交易所产生的。
那么,如何为世界其他地区解锁这一机遇呢?关键在于 AI,是AI 使得我们有可能在世界各地复制这种低劳动力成本的模式。现在有超过一亿的小型企业在使用我们的平台,而且我认为情况已经非常明朗:几年之内,世界上每一家企业基本上都会拥有一个邮箱地址、一个社交媒体账号、一个网站,以及一个能够处理客户支持和销售的 AI。一旦他们拥有了这些,并且这些工具能为他们带来转化——首先,我们可以将其作为一种极易快速搭建的产品提供给他们,而且是免费的。在我们开始为他们带来增量转化之前,我们甚至不会收取任何费用。然后,情况就会是:“你只需要启用这项服务,我们就会开始为你带去销售额,你只需为这些增量的销售额支付一定的费用。”
一旦这个飞轮开始运转,企业吸引用户进入这些聊天渠道的需求将会急剧上升。所以我认为,这就是我们将如何通过 WhatsApp、Messenger、Instagram Direct 等所有这些服务实现盈利的途径。这就是第三大支柱。
然后,第四个方向是所有更具创新性的、纯粹的AI 优先项目,比如 Meta AI。最终,如果 Meta AI 发展壮大,它会推荐产品,人们会为订阅等服务付费。目前,Meta AI 的月活跃用户已达到约十亿。
关于为何需要专门的AI 应用及模型开发平衡。我想,如果你看一下我们刚才讨论的四大商业机遇类别,它们是:提升广告体验、提升消费者在互动参与方面的体验、商业通讯,这基本上是要将我们所有通讯服务相关的业务发展到我们用 Facebook 和 Instagram 已经达到的那种规模。其次,第四个就是AI 原生的业务。所以我提到了 Meta AI,因为它规模最大,如今大约有十亿用户。
如今使用它的十亿用户遍布在我们的系列应用中,但现在我们也有了独立的应用程序。因此,对于那些想要专门体验的用户,他们就可以使用这款独立应用。但它也包括像在元宇宙中创建内容这样的功能,这些都属于 AI 原生的范畴。所以当我们进行财务规划时,我们并不需要所有这些方面都取得成功,就能让这项投入获得丰厚的利润。如果我们真能在其中两到三个领域取得重大突破,那么即便考虑到巨大的训练成本,我们的处境也会相当有利。
但我认为这就引出了一个问题:为了在上述每个领域都能真正做出世界级的工作,你需要构建一种端到端的体验,在此体验中,你要训练你所需要的模型,使其具备交付各项功能所需的能力。根据我迄今为止的所有经验,你确实希望能够一直深入到技术栈的最底层。Meta 是一家全栈公司,我们一直都在构建自己的基础设施、自己的人工智能系统和自己的产品。
随着时间的推移,这会是一个有趣的权衡。我们构建它,首要的、最重要的是为了满足我们自己的用例,然后我们再把它提供给想要使用它的开发者。Llama 4 Maverick 模型并非为任何开源基准测试而设计,我想这就是为什么当人们使用它时,会觉得:“这个模型感觉相当不错”,但随后在一些基准测试中,它的得分却不尽如人意,但这并不影响它本身是一款高质量的模型。
这其实挺有意思的。我们设计 Llama 4 的目标之一,就是让它比其他模型更具可引导性,因为我们有不同的用例。我们有 Meta AI,我们正在构建 AI Studio,我们希望你能将它用于商业通讯等各种场景。所以,Llama 4 在设计之初就被赋予了根本上更强的适应性,这与你采用像 GPT 或 Claude 这样的模型,然后在它们允许的范围内进行微调以适应不同任务的做法是不同的。
我记得好像有一个团队构建并引导了它的一个版本,使其在 LMArena 上表现得特别出色,它之所以能做到这一点,正是因为它具有可引导性。但我认为现在公开的那个版本根本没有针对 LMArena 进行优化,所以情况就变成了:“好吧,它的得分就是现在这样了”。
但总而言之,它是个好模型。您刚才提出的观点,我认为是对的:当我们为自己的用途设计它时,有些开源开发者所关注的方面,我们不会是主要的提供者。但开源的魅力就在于,其他人可以去完成那些事情。开源是一个生态系统,而不是单一的供应方。所以,我们可能在承担其中最艰难的部分,也就是进行那些成本极为高昂的预训练,完成大量的工作,然后将成果开放出来。我们现在也正在搭建基础设施,以便提供一个参考实现的 API,但我们并不打算包揽所有事情。对于其他公司而言,这里有巨大的机会去参与进来。我预计,就像 Linux 的发展历程一样,在其周围会涌现出许多其他的项目,来构建所有其他必要的功能、驱动程序以及各种不同的组件,从而使其能够满足开发者们的各种需求。Llama 未来也会是这样。
3
Meta AI应用旨在成为高度个性化、侧重语音交互的个人 AI 助手
主持人提问:您为何认为推出独立的 Meta AI 应用很重要?用户期望用它来做什么,它是一款主要用于完成功课的应用,还是更多地填补人们的空闲娱乐时间?Meta AI 如何让用户了解信息流算法对他们的认知,并允许用户与之互动反馈?与 ChatGPT 等现有 AI 工具相比,Meta 如何吸引用户尝试 Meta AI,尤其是在许多用户已将 AI 等同于 ChatGPT 的情况下?您是否担心,即便 Meta AI 功能在公司各应用中拥有庞大用户基数,独立的 Meta AI 应用在应用商店的排名和感知用户量上可能并不突出,从而引发类似“没人用 Meta AI”的误解?您认为 Meta 在构建个性化 AI 助手方面,能否从根本上比其他公司做得更好,特别是在发掘 AI 应用场景方面?
扎克伯格:我想有些人就是单纯想把它当作一个独立的应用程序来使用。
关于用户场景和个性化,您说的有对的地方。我认为 AI 本质上是一种通用技术,所以我觉得在设计体验时需要谨慎,避免过于狭隘。这有点像网页搜索,那些垂直搜索引擎始终没有真正流行起来,因为人们通常只想要一个通用的搜索工具。因此,我认为在这一点上需要非常小心。
但回到您关于我们优化目标的问题上,我们希望 Meta AI 成为您的个人 AI 助手。它高度个性化。除了记住您跟它聊过什么, Meta AI 还能通过您使用我们应用的过程了解您的信息。我觉得,很多人都非常想弄清楚 Instagram 和 Facebook 里的信息流算法究竟了解他们多少,并希望能够与这些算法对话。我认为,让用户能够询问算法对自己的了解程度、向算法提供反馈、用自然的方式与算法交流,这是一个非常值得探索的迷人方向。
我认为文本输入很有用,因为它具有私密性,你不需要大声说出来。但很多人确实更喜欢使用语音,语音交流更自然,尤其是在多轮互动中,对许多人来说,语音输入比打字快得多。因此,我们设计的体验,在根本上是强调个性化的,并且更侧重于语音交互。同时,正如您所说,我们也融入了其中的趣味元素。创造内容,以及看看其他人用 Meta AI 做了哪些有趣的事情,这本身就极具娱乐性。
你可以问它了解你哪些信息,它会向你解释。
这是一个更宏观的问题。我确实认为,作为一家公司,我们对于人们的各种需求可能相当关注。总的来说,人们渴望表达自我,渴望被理解,渴望感受到连接,渴望不孤独。我认为,在过去 20 年里,我们提供的产品在满足这些需求方面一直非常有效。
展望未来,我认为一个有趣的问题是:“AI 如何融入这一切?” 有一个有趣的社会学研究发现:普通美国人拥有的朋友数量少于三个,而他们希望拥有的朋友数量却多于三个。因此,理想情况下,你会帮助他们连接到合适的人,这显然也是我们努力在做的事情。当人们无法实际聚在一起时,可以通过我们的应用保持连接,与他人保持联系,结识新的朋友。但我确实认为,未来会出现这样一种趋势:你会围绕不同的兴趣点或事务与不同的人进行互动。
我个人认为,或许每个人都应该有一位像心理治疗师一样的倾诉对象,一个他们可以随时交流的人——不一定是全天候,但至少能在他们为某些问题担忧时可以与之交谈。而对于那些现实中没有这样的人们,我认为未来每个人都会拥有一个 AI 伙伴。当然,这并不会取代你现实中的朋友,但它很可能在某种程度上对许多人的生活起到补充作用。我想,在如何思考这类问题上,我们或许比那些仅仅关注纯粹机械化、生产力导向技术的公司有更深刻一点的理解。
我想我们对于其中的一些潜在风险,以及如何让 AI 对人们的社交互动产生积极而非消极的影响,也有更深入的理解。我个人非常关注的一点是,如何让 AI 帮助你更好地对待你的朋友。比如,有很多关于我所关心的人的事情,我可能记不住,我本可以更体贴周到。我们都可能遇到这样的情况:“我总是拖到最后一刻才做计划”,然后就会想:“我不知道现在谁有空,我也不想打扰别人”,诸如此类。一个能充分了解你所关心的人的近况和相关背景信息的 AI,将能够在这些方面为你提供帮助。
一个优秀的个性化AI,并不仅仅是了解一些关于你兴趣点的基本信息;一个好的 AI 助手或好的个性化体验,关键在于它要对你的思维方式拥有一种“心智理论”。这就像我们与所有朋友相处时那样。我们不会仅仅停留在“好吧,这是我的朋友 Bob,他喜欢某些东西”这种层面,你会深入了解这个人生活中正在发生什么,你的朋友们正在经历什么,他们面临的挑战是什么,以及这些不同因素之间是如何相互影响的。
我认为,其确切的 API 仍需仔细研究,因为这涉及到很多非常敏感的隐私问题。这在人际关系中也是如此,当你与他人建立联系,或者试图帮助他人解决问题时,会涉及到很多关于共享哪些背景信息,以及人们在不同事情上需要如何谨慎处理的问题,我们也需要让 AI 具备这种能力。但在我们谈到那一步之前,首先要做的,是开发出一种 AI,它要具备连贯的“心智理论”,能够深入理解你的世界以及其中发生的一切,而不是仅仅停留在表面,例如只知道“他喜欢综合格斗”,而是要真正理解“他内心究竟在想什么?”或“他身上究竟发生了什么?”——我认为这才是真正的基础性工作。
关于Meta 的独特优势,坦率地说,在某种程度上,我甚至不确定其他公司是否在尝试此举,因为我认为他们更专注于——我认为最明显的用例是围绕生产力提升。在某种程度上,Google 和 OpenAI 这些公司都在朝这个方向努力,而 Anthropic 似乎非常专注于构建软件 AI Agent。我认为这些领域,或者至少在这些领域取得成功的公司,将会成就巨大的商业价值。我并非评价这些公司的具体情况,每家公司都有其自身的优势和劣势。
但正如互联网不仅提高了我们的生产力,也增强了人与人之间的连接,丰富了我们的娱乐生活一样,AI 也将实现所有这一切。AI 不仅仅是带来某一项改变,它将变革一切。这个领域有很多值得关注之处,既会有掌握大量技术和资本的大公司入局,也会涌现许多新的创业公司。我长期思考和实践的核心问题便是:“如何在深厚技术与帮助人们建立连接的交叉点上构建技术?”。
目前大约有十亿月活跃用户已经在将 Meta AI 用于各种事务,但从根本上而言——我不知道,我们拭目以待。我认为并非所有这些尝试都需要成功,但其中一些必须取得重大的成功,而且我认为没有人能预知究竟哪些会成功。你必须对世界未来的发展方向有自己的判断和理论,然后去下一些赌注,观察哪些可行,接着要保持敏捷性,在前景好的方向上加倍投入。
正如你所说,通常你无法通过做与领先者相同的事情来超越他们,你必须做得更好,而有时,所谓的“更好”,可能就是让用户在他们已有的产品中无缝地使用这种体验。如果人们想给 Meta AI 发短信或打电话,那么在他们日常使用的短信和通话应用中实现这一功能,将会非常方便。
我认为在美国,人们可能低估了 Meta AI 的使用程度,因为他们低估了 WhatsApp 在世界其他地区的影响力。大多数使用 Meta AI 的用户是通过 WhatsApp 来使用的。在美国,WhatsApp 有大约 1 亿用户,这个数目不算小,但它还不是美国最主要的即时通讯平台,iMessage 仍然占据主导地位。如果你观察发展曲线,这种情况可能至少还会持续两到三年,直到 WhatsApp 超越 iMessage。但即便 WhatsApp 实现了超越,它也仅仅是超越了最后一个占据主导地位的即时通讯应用。然而,如果你放眼全球大多数国家,WhatsApp 几乎是人们所有的通讯方式。
如果你通过 WhatsApp 处理事务,并且你也希望拥有一个可以向 AI 发送消息的平台,这在逻辑上是说得通的。在很多这样的地区,许多人都在使用 Meta AI。现在,这对我们而言确实存在一个问题,那就是,美国恰好是最重要的市场,那么如果我们在这个市场的影响力相对不足,这对我们来说行得通吗?长期来看,可能不行。这是我们需要改进的地方,但我确实认为,这一点在今天可能被低估了。
4
AR 眼镜是承载 AI 与极致社交连接的终极形态
主持人提问:Meta 以其“反脆弱性”著称,例如在广告商抵制和苹果 ATT 政策冲击下反而可能扩大市场份额。那么,关税这类外部冲击是否会对 Meta 庞大的长尾广告商群体构成实质性影响?如果 Meta 持续实现长期目标,但这个目标中不包含一个真正的开发者平台,仅仅是作为一系列应用程序,这样是否可以接受?AR 眼镜和 VR 分别扮演什么角色,最终的梦想是眼镜吗?Meta 为何选择公开展示像 Orion 这样尚未准备好商业化出货的原型技术?
扎克伯格:我认为,从我们过去在经济衰退期的经验来看(我们经营公司时间够长,经历过数次这类周)当金融环境趋紧时,所有公司都会寻求将资源向真正有效的方面倾斜,以此优化预算。在市场营销领域,真正有效的是那些可以衡量成果的方法,而我们在这方面基本处于领先。因此,如你所言,在过去的困境中经历的各类衰退确实冲击了我们的业务和营收,但我们反而扩大了市场份额。
作为一家受控公司和创始人领导的公司,其优势之一在于可以着眼长远,承受短期阵痛,进行必要的投资,以便逐步创造更大的价值。当我看到某些经济衰退反而带来了市场份额的增长时,我就会采取行动,例如建设更多的 GPU 基础设施,以便更好地服务这些企业和用户。短期内,投资者可能会说:“你们的营收低于预期,而现在实际上还在增加支出,这是怎么回事?” 我们已经多次经历这样的周期,我们的股价下跌,而且是大幅下跌。是的,跌了三倍甚至更多。但我想,我们作为一家受控公司的战略优势在于,我从根本上无需为了保住职位而担忧季度业绩。我们公司拥有一个专注于最大化长期价值的董事会和公司架构。这,如果你看看所有那些捐赠基金或类似机构的运作理论,能够进行更长期的投资本身就是一种能带来 alpha 的源泉,随着时间的推移会产生更高的收益,我认为这就是我们公司所拥有的优势之一。
关于平台与产品,初期,我非常敬佩 Microsoft,那段经历塑造了我的想法:“打造一个开发者平台确实很酷”。是的,但这从根本上说,并非我们公司历史上的定位。目前,我确实看到了主要作为一家消费者公司和主要作为一家开发者公司之间的张力,所以我现在不太关注这一点。
当然,我们现在 Reality Labs 的所有项目中确实有面向开发者的部分,也就是我们的开发者平台。我们需要赋能开发者去构建内容,从而让设备变得更好。关于 Llama 项目,我们显然希望赋能大家去使用它,并尽可能让全世界都参与到开源中来,因为这会产生一种良性的飞轮效应:使用 Llama 的开发者越多,Nvidia 就会为 Llama 做越多的优化,这就会让我们所有的产品和服务变得更好,同时降低成本,因为人们会围绕我们的系统设计产品,并对其进行效率提升。这些都是好事。
但我想,我现在真正关心的是打造出最棒的产品。而我认为,要做到这一点,方法就是进行更深度的垂直整合。当我在思考未来为什么想做眼镜时,主要原因并非是为了拥有一个开发者平台,而是因为我认为这将是一个能够提供最佳体验的硬件平台,它能创造出那种临场感,以及技术传递社交连接的极致感受。而且我认为眼镜将是承载 AI 的最佳形态,因为有了眼镜,你可以让你的 AI 助手看到你所看到的、听到你所听到的,并且整天在你耳边与你交流,你可以对它耳语或进行任何互动。对于一个你希望它能掌握你生活中所有情境信息的个人 AI 而言,很难想象还有比这更好的形态了。
关于眼镜与VR 的定位,眼镜的市场将会大得多。现在全世界已经有大约十亿到二十亿人佩戴某种形式的眼镜了,就像你现在戴的这种。对我而言,难以想象十年后,每一副现存的眼镜,届时最起码不会升级成 AI 眼镜,而最理想的形态则是带有全息影像的 AI 眼镜。此外,我认为许多现在佩戴隐形眼镜的人将来会选择戴眼镜,因为这些功能太有价值了。这副没有。实际上,我平常戴隐形眼镜,我的视力非常差。不过,我最近开始戴这副眼镜,是因为在日常生活中佩戴 AI 眼镜真的非常有用。
这些都说得对。我确实认为 AR 眼镜和 VR 都将是巨大的市场,只是我认为眼镜会成为未来的手机,而 VR 将成为未来的电视。你想想看,我们显然不会在日常生活中随身携带电视,但普通人每天会花好几个小时看电视,而且我们也希望这种体验能够随着时间的推移变得越来越有沉浸感和吸引力。随着 VR 头戴设备形态和质量的提升,我认为它将会取代平板电脑,并且会取代很多电视之类的设备。通过 AR 技术将光子投射到现实世界中获得的全息影像的保真度,永远无法与你直接在屏幕上渲染像素所能达到的深度相提并论。这就好比 AR 只能向世界增加光子,它无法移除光子。而 VR 则不同,它隔绝了外部世界,你从一块空白的画布开始,可以随心所欲地创造。所以,我猜两者都会有市场。
目标是几年之内,我们还要看进展如何。我们希望获得反馈,我们喜欢在开放的环境中开发产品。这总是一种权衡:一方面,获得反馈也意味着你的竞争对手可以看到你的进展,但另一方面,它也能促进你自己的思考。人们为自己的工作感到自豪,所以能有一个展示成果的时刻,肯定会激励他们。但是,我认为开放式开发和封闭式开发各有其非常不同的优点和缺点。如果你真的有望凭借一己之力完成某项了不起的创举,那么在发布之前保守秘密是有其价值的。但我认为大多数事情并非如此,大多数事情都需要迭代、反馈和创意。而且我认为,在大多数情况下,公开地进行开发,并辅以长期的投入承诺,会比其他人更快地取得进展,并做出更好的工作。
在像 VR 和 AR 这样的领域,这个领域的其他公司,情况往往是这样:每当我们做出一些好的东西,他们就会重新启动他们的 AR 项目。有很多这样的传言,比如,Google 取消了他们的项目,然后又启动,再取消,再启动,诸如此类。就好比 Apple 曾决定不做眼镜了,结果一看 Ray-Bans 卖得不错,就又重启了他们的眼镜项目。我认为,从根本上说,我们将在这个领域持续投入 10 年或 15 年,坚持不懈地、公开地获取反馈。我们比他们更在乎这个领域,而且我们拥有世界上最优秀的人才在从事这项工作,因为我们已经用行动证明了这一点。
对于我们正在研究的 AI 问题,情况也会类似。也就是说,有些问题是大家都公认值得投入的好问题,而另一些问题在当前则相对边缘。比如一些围绕情感陪伴或在信息流中创造新型内容的应用,我认为人们还没有——目前还没有实际案例证明这些方向会成功。人们在 Meta AI 上也经常使用 Imagine 功能。不过,那个项目很好,是一件很酷的事情。是的,效果很好。这是一个足够广阔的领域,没有任何一家公司能够包揽所有酷炫的创新。而且我认为在这个世界上,如果别人做出了很酷的事情你都无法为之高兴,那你自己也会过得很不开心的。
文章来源:数字开物,本网站仅用于公益宣传,转载请注明文章作者及来源。如有侵权请联系我们及时删除。
打开微信,点击底部的“发现”,使用
“扫一扫”即可将网页分享至朋友圈。
点击右上角分享按钮