据国外媒体报道,英伟达创始人、首席执行官黄仁勋和科技杂志《连线》资深撰稿人劳伦·古德(Lauren Goode)周一在美国丹佛举行的第50届SIGGRAPH图形大会上进行一场公开的炉边谈话。双方在对话中探讨了加速计算和生成式人工智能如何变革行业,并未创新和发展创造新机遇。
黄仁勋在对话中指出,这场以视觉计算为基础的人工智能革命正在显著提升人类的创造力,并且加速计算技术在提高能效方面也展现出巨大潜力。他预测,未来每个人都将拥有人工智能助手,企业内部的每个职位都将受益于人工智能技术。他强调,加速计算技术能够显著提高计算效率,同时节省能源,对社会而言,加速各种应用的开发将有助于全球能源使用的减少。
英伟达在SIGGRAPH图形大会上发布了一系列新的NIM微服务,包括OpenUSD、3D建模、物理模拟、材料科学、机器人技术、工业数字孪生和物理人工智能等,旨在增强开发者的能力。特别是通过DGX Cloud集成Hugging Face的推理即服务,进一步提升了开发效率。
黄仁勋和古德讨论了视觉计算如何推动了从计算机游戏到数字动画,再到GPU加速计算,以及当前由工业规模人工智能工厂驱动的生成式人工智能的发展。这些技术进步相互依存,例如,机器人技术需要先进的人工智能和逼真的虚拟环境进行训练。黄仁勋解释,机器人技术的发展需要三台计算机:一台用于人工智能训练,一台用于在物理精确的模拟环境中测试人工智能,以及一台内置于机器人中。他强调,几乎所有行业都将受到这些技术变革的影响,无论是提高科学计算的能效以更好地预测天气,还是与创作者合作生成图像,或为工业可视化生成虚拟场景,自动驾驶汽车都将通过生成式人工智能得到改变。
黄仁勋宣布,他们将推出数字智能体(Digital Agents)的概念,即数字人工智能(Digital AIs),这将增强企业中每个职位的工作。他特别指出,客户服务是人工智能技术最重要的应用之一,并预测未来客户服务可能仍然是人类主导,但会有人工智能的辅助。黄仁勋总结说,所有这些新技术都将像任何新工具一样,提升人类的生产力和创造力,他鼓励人们想象这些工具将能够讲述的故事。
以下为此次炉边对话的精华版内容:
古德:SIGGRAPH图形大会自1974年创办以来一直是计算机图形学领域的重要会议。英伟达自上世纪90年代起,其技术在推动图形学发展中发挥了关键作用。今天,英伟达在SIGGRAPH图形大会这样的会议上扮演着重要的角色。
黄仁勋:SIGGRAPH图形大会的焦点已经从单纯的计算机图形学扩展到了包括生成式人工智能和仿真技术在内的更广泛领域。英伟达的发展历程始于计算机图形学,并且这一领域的进步为我们今天的成就奠定了基础。我为你制作了一部卡通,它展示了计算机行业的重要里程碑,以及英伟达是如何一步步发展到今天的。
从IBM System 360的诞生,到犹他茶壶(纽维尔茶壶,计算机图形学界广泛采用的标准参照物体)和光线追踪技术的发明,再到1986年的可编程着色技术,这些都是计算机图形学发展的关键节点。1993年,英伟达成立;1995年Windows PC的出现彻底改变了个人电脑行业。2001年,英伟达推出了第一款可编程着色GPU,这一创新极大地推动了公司的发展。
英伟达的核心是加速计算技术。我们相信,通过加速计算,可以解决传统计算机难以处理的问题。我们首先将这一技术应用于计算机图形学,这是一个计算密集型且持续增长的领域。计算机图形学的应用推动了我们的研发投入,从而加速了公司的增长。1993年的这一决策被证明是非常正确的,它引领了我们在加速计算领域的创新。
我们一直在探索加速计算的潜力,CUDA的推出是一次革命性的突破。我们不断推广CUDA,确保我们的GPU与各种应用程序兼容。2012年,我们首次接触人工智能,AlexNet的出现标志着深度学习在计算机视觉领域的重大突破。我们意识到,深度学习是一种全新的编程方式,它能够解决许多之前无法解决的问题。这一认识促使我们全面转向深度学习的研究。
2016年,我们推出了专为深度学习设计的DGX-1超级计算机。当时,埃隆·马斯克(Elon Musk)的OpenAI成为DGX-1的首位客户。2017年,Transformer模型的出现彻底改变了现代深度学习。2018年,在SIGGRAPH图形大会上,我们宣布了RTX,这是世界上第一个实时交互式光线追踪平台,它的推出标志着我们显卡系列从GTX向RTX的转变。
我们的研究一直与SIGGRAPH图形大会紧密相连。今年我们有20篇论文聚焦于生成式人工智能和仿真技术的交叉领域。英伟达对SIGGRAPH图形大会的热情从未减退,我们将继续在这一领域进行创新和研究。
古德:去年在SIGGRAPH的主旨演讲中,你提到2018年的RTX光线追踪技术是计算机图形学与人工智能相遇的重要时刻。但这种相遇实际上已经发生了一段时间。那么,2018年的RTX技术究竟有何重要之处呢?
黄仁勋:2018年的RTX技术,我们加速了光线追踪和边界框检测的过程,并使得使用并行处理器加速光线追踪成为可能。即便如此,我们当时的光线追踪速度大约是每秒5帧,如果是1080p分辨率的话。显然,视频游戏和实时图形的需求远不止于此。
在线观众可能有些人并不熟悉我们领域。让我来解释一下,光线追踪技术实际上是计算机图形学中一种模拟光线与物体相互作用的实时方法。传统上,渲染过程非常缓慢,有时甚至需要动用超级计算机来处理几个像素点。然而,随着RTX技术的出现,我们得以加速这一过程,尽管它实现了交互性和实时性,但速度上仍不能满足视频游戏的高标准。我们意识到,要达到视频游戏的要求,我们需要一个巨大的飞跃,可能是20倍甚至50倍的性能提升。
为此,我们团队发明了DLSS技术,这是一种仅渲染一个像素,同时利用人工智能推断出其他像素的技术。基本上,我们训练了一个人工智能,让它根据所见到的内容来填充剩余的画面。现在,得益于人工智能的帮助,我们能够在4K分辨率下以每秒300帧的速度完成全光线追踪和路径追踪模拟。
从2018年到2022年,我们见证了ChatGPT的问世,这是人工智能领域的一个革命性突破,也是历史上增长最快的服务之一。我想强调的是,自ChatGPT以来,行业研究人员已经学会使用人工智能来学习并理解图像、视频、3D化学、蛋白质、物理、热力学、流体动力学、粒子物理学等的深层含义。现在,我们不仅可以学习这些内容,还可以生成它们。这意味着,现在可以从文本生成图像、3D图像、视频等,生成式人工智能已经成为现实。我们正处于一个革命性的时代,几乎所有行业都将受到这一变革的影响。
从1964年开始,软件编程是由工程师编写代码。现在,我们有了机器学习来编程,开发能够解决以前难以想象的问题的软件。随着生成式人工智能的出现,软件开发迎来了全新的方式。安德烈·卡帕西(Andre Karpathy)是一位杰出的研究者,在斯坦福大学时首次提出了软件1.0和软件2.0的概念。现在,我们正迈向软件3.0,这将是一个使用预训练模型、基础模型的新时代。软件开发可能会变得像组建一个由不同人工智能能力的专家组成的团队,一些专家使用工具,一些能够生成特殊事物,还有一个擅长推理的通用人工智能将这些人工智能连接起来,共同解决问题。因此,可以说,软件3.0的时代已经到来。
古德:在近期的交流中,我注意到你对生成式人工智能工具的发展前景持乐观态度。尽管目前这些工具还存在着诸如幻觉效应、输出质量不尽人意等问题,有时用户得到的并非他们期望的结果,而且还伴随着较高的能耗。在这样的背景下,你乐观的理由是什么呢?是什么因素让你相信生成式人工智能将变得更加有用和可控?
黄仁勋:ChatGPT取得的重大进步在于采用了基于人类反馈的强化学习方法。这种方法利用人类的参与来生成正确或最佳答案,确保人工智能的输出与我们的核心价值相一致,或者符合我们希望人工智能展现的技能。这无疑是一个突破性进展,使得ChatGPT能够向所有人开放使用。
此外,自那以后还有更多突破性的技术出现。例如,“护栏”(Guard Rrailing)技术,它引导人工智能将精力和回应集中在特定领域,防止人工智能漫无目的地讨论各种问题,而是只专注于它经过训练、具有深入了解的任务。
第三项突破是检索增强生成技术(Retrieval Augmented Generation ),它通过向量化或嵌入数据来理解数据的含义。举个例子,这可以是你撰写过的所有文章和论文,从而形成一个关于你的权威人工智能。这个人工智能可以成为你的聊天机器人。我所有的写作和言论都可以被向量化,并转化为一个语义数据库。当人工智能需要回应时,它会先分析你的指令,然后从该向量数据库中检索相关内容,并在生成过程中加以利用和增强。这样的技术进步,让我们有理由相信生成式人工智能将变得更加精准和高效。
古德:你是否认为这是至关重要的因素之一?
黄仁勋:这三个要素的结合,真正使我们得以在文本领域取得突破。而如今,我们正在探索如何将这一技术应用于视觉领域,这无疑是一项激动人心的进展。SIGGRAPH一直以来都在图像和生成技术方面有着深入的研究。如果我们观察当今的生成式人工智能,只需给出一个提示,它便能迅速响应。以英伟达开发的Edify AI模型为例,这是一个将2D文本转换为2D图像的多模态模型。我们与GTI合作,利用他们的数据库来训练这一模型,实现了文本到2D图像的转换。我亲自体验了这一过程,仿佛我就是一个提示,而人工智能团队则像是一个创造性的伙伴。最终,一张幻灯片就这样神奇地呈现在我面前。
这可以是一个品牌方的提示语,比如在这个案例中的可口可乐,也可以是汽车、奢侈品,或者是任何其他东西。通过使用提示语,我们可以生成图像。然而,正如你所知,控制这个提示语并不容易,它可能会产生幻觉,生成的结果可能并不完全符合我们的预期。使用文字来微调这一过程是非常困难的,因为文字本身是低维度的,内容高度压缩,但又非常不精确。因此,我们现在面临的挑战是如何更精确地控制生成的图像。
为此,我们开发了一种新的方法,通过更多的条件来控制和对齐图像。我们创建了另一个模型,例如,允许我们将文本转换为3D图像的Edify 3D模型。合作伙伴可以与我们合作,我们使用他们的数据来为他们创建模型。这个模型完全基于他们的数据,只使用他们有权使用的数据进行训练。我们使用3D提示生成器,将其集成到Omniverse中。Omniverse是一个可以组合多种不同模态数据和内容的平台,无论是3D、AI、动画还是材料,我们都可以在这里进行创作。现在,你可以控制它,改变姿势、位置,或者任何你喜欢的细节。然后,您可以使用Omniverse中的图像来调节提示,这有点像是增强检索和增强生成的结合。现在,这是3D增强生成。Edify 3D模型是多模态的,它理解图像和提示,并将其结合起来,创造出新的图像。这样,我们就可以使用生成式人工智能作为合作伙伴,以我们喜欢的方式精确地生成图像。
古德:这种技术如何转化为现实世界中的实践?它又是如何应用于机器人技术等领域的?
黄仁勋:在此,我想向你展示一段非常精彩的视频。这段视频是由WPP和Shutterstock携手一些世界级的知名品牌共同完成的杰作。让我们来播放这段视频,展示一个在繁忙环境中,空无一物的房间中凭空创造出一张桌子的奇迹。这难道不是令人叹为观止的一幕吗?事情的经过是这样的:我们教会了人工智能如何使用USD开放标准进行交流。视频中的女孩正在与Omniverse对话,Omniverse随即生成了USD(通用场景描述),并利用USD搜索功能找到了其数据库中的3D对象目录。接着,它使用文字描述来构建场景,然后利用生成式人工智能的增强功能来调节和生成整个创作过程。这样一来,你的工作不仅能够被更加精确地控制,而且你还可以与他人进行合作,因为无论是在Omniverse还是在3D空间中,合作都变得更加容易。相比之下,在2D空间中进行合作则显得较为困难。因此,我们现在能够在3D环境中进行合作,增强整个生成过程。
古德:这个充满技术气息的房间里,我想象着在座的各位不仅仅是技术专家,还有许多故事讲述者。这里聚集了许多拥有博士学位的专业人士,他们对举手提问可能感到犹豫,但我相信,如果他们提出问题,那一定会非常有趣。面对这样的技术展示,我看到了令人惊叹的成果:我们正在加速渲染过程,甚至能够无中生有地创造出图像。同时,我也知道许多人在思考,这些技术进步对我们的工作意味着什么?我们应该如何界定技术是在增强人类能力还是在取代人类的工作?我认为,这是我们需要深思的问题。
黄仁勋:工具的作用在于促进和协作。我们在这里发明的工具,最终都会成为促进我们工作的手段。这些工具要么加速我们的工作,要么与我们协作,使我们能够完成更出色的工作,甚至是以前不可能完成的工作。我相信,你们很快会看到,生成式人工智能现在比以前更容易控制。我们已经能够通过使用增强检索和增强生成来更好地控制文本生成,减少幻觉现象。现在,我们正在使用Omniverse和生成式人工智能来更好地控制图像生成,减少幻觉。这些工具帮助我们提高生产力,完成我们原本无法做到的事情。
对于世界上所有的艺术家,我想说,拥抱这个工具,尝试一下。想象一下你将能够用这些工具讲述怎样的故事。至于工作,我认为我们所有人的工作都将发生变化。我的工作也将改变,未来我将引导许多人工智能进行工作。每家企业中的每个职位都将拥有作为助手的人工智能。我们的软件程序员现在已经有了帮助他们编程的人工智能,所有的软件工程师都有帮助他们调试软件的人工智能。我们有人工智能帮助芯片设计师设计芯片。没有人工智能,就没有Hopper,Blackwell也不可能实现。本周,我们向世界各地发送Blackwell的工程样品。没有生成式人工智能,我们所做的所有工作都不再可能。我们的IT部门正在帮助员工提高生产力,供应链团队正在优化供应,尽可能提高效率。数据中心团队正在使用人工智能管理数据中心,尽可能节省能源。
古德:你之前提到了Omniverse。是的,它不是新事物,但是出现了更多生成式人工智能融入Omniverse,帮助人们创建这些模拟或数字孪生的构想。
黄仁勋:本周我们宣布了Omniverse的新进展。现在,Omniverse不仅理解文本到USD,还拥有一个语义数据库,能够搜索所有3D对象。正是这样,那位年轻女士才能够用语言描述场景,并要求填充许多树木,然后系统就根据她的描述,用3D树木填充了场景。完成之后,这个3D场景会进入一个生成式人工智能模型,将其转化为逼真的模型。如果你希望福特卡车不经过增强,而是使用实际的品牌真实数据,系统也会尊重这一点,并在最终场景中保留它。
我们讨论的重点是,公司中的每一个团队都将拥有人工智能助手。最近有很多关于我们正在建设的基础设施是否真正促进了公司生产力的问题。我刚刚给出了一个例子,展示了没有生成式人工智能,英伟达的设计将不可能实现。我们使用它来改变我们的工作方式,我们还用它来创造新产品和技术,无论是实现实时光线追踪,还是我们现在可以想象的Omniverse,帮助我们创造更大的场景,或者是我们的自动驾驶汽车工作,还是我们的机器人技术,所有这些新能力都离不开它。
本周我们在这里宣布的另一个概念是数字智能体--数字人工智能,它们将增强公司中每一个职位。人们发现的最重要的用例之一是客户服务。每一个团队、每一个公司、每一个行业都有客户服务。今天,客户服务是由人类完成的,但在未来,我猜测仍然会有人类参与,但人工智能将在其中发挥作用。这样做的好处是,你将能够保留所有客户服务智能体的经验,并捕获那些机构知识,然后你可以将其用于分析,以便为你的客户提供更好的服务。
我刚刚向你展示了Omniverse增强的图像生成,这是一种检索增强的生成式人工智能。我们创建了一个基本上位于云端的客户服务微服务,它将在今天或明天可用,你可以尝试使用它。我们将其连接到一个数字人类前端,基本上是人工智能的输入输出,它能够说话、与你进行眼神交流,并以富有同情心的方式进行动画表现。你可以选择将聊天机器人或人工智能连接到数字人类,或者将数字人类连接到我们的检索增强生成客户服务人工智能。无论你喜欢哪种方式,我们都是一个平台公司,无论你想使用哪一部分,它们都是完全开源的,你可以自由使用自己喜欢的任何部分。如果你喜欢我们为渲染美丽面孔而创建的令人难以置信的数字人类渲染技术,这需要使用路径追踪的次表面散射,这一突破确实非常了不起,它使我们能够使用人工智能进行动画制作。
古德:面对如此强大的技术,我们不得不深思其伦理问题。当这些工具被释放给开发者和图形艺术家时,它们也将进入广阔的世界。我们是否应该要求那些外观极为逼真的聊天机器人明确告知用户其非人类的身份?如果机器人的外观和行为过于接近人类,以至于人们开始将其与真实人类混淆,我们又该如何保护用户的情感不受伤害,避免他们因情感上的脆弱而受到伤害?这些问题需要我们在技术发展的同时,认真考虑并制定相应的伦理准则和使用规范。
黄仁勋:尽管目前的数字人技术仍带有机械化的特点,但这并非全然是件坏事。毕竟,在可预见的未来,我们仍将与机器人共存。我们开发的这项数字人技术已经相当逼真,尽管它仍然是一个机器人,但这并不是一个糟糕的方向。实际上,在许多应用场景中,与人类的互动远比简单的文本框更具吸引力,无论是提供陪伴,还是在医疗保健领域为出院的病人提供咨询。例如,帮助老年人,或者作为教育孩子的虚拟导师,这些应用场景都能从更接近人类的交互方式中获益。这样的技术能够更好地与用户建立情感联系,提供更加丰富和深入的交流体验。
古德:今天你多次提到的这些内容,显然都是围绕软件开发展开的,而这些软件都依赖于英伟达的图形处理单元(GPU)。然而,归根结底,它们的核心还是软件。英伟达正在向软件堆栈的更高层次迈进。与此同时,一些在生成式人工智能领域的公司和开发者,尽管他们目前专注于软件和云服务,但他们也在寻求向硬件堆栈的更深层次发展。他们可能正在研发自己的芯片或张量处理单元(TPU),这些产品与英伟达的产品形成了竞争。那么,这种软件战略对于英伟达来说,在其保持行业领先地位以及实现人们对其增长预期方面,究竟有多重要呢?
黄仁勋:我们始终是一家软件公司,这一点至关重要。原因在于,加速计算与通用计算不同。通用计算可以处理任何C语言程序或Python程序,并几乎可以让所有程序有效运行。然而,当你试图加速流体动力学等复杂计算时,你必须深入理解其算法,以便能够重新设计并加速它们。这就需要设计专门的加速器,并在GPU上设计计算单元,使其能够理解并加速这些算法。通过重新设计整个技术堆栈,我们能够显著提升应用程序的性能,例如将应用程序加速20倍、40倍、50倍甚至100倍。我们最近在谷歌云平台上运行PANDAS——全球领先的数据科学平台,通过NVIDIA GPU,我们实现了比通用计算快50到100倍的加速。
在过去的10到12年中,我们在深度学习领域取得了巨大的进步,加速了一百万倍。这使得创建大语言模型成为可能,极大地降低了成本和能耗。这些进步并非偶然,而是通过设计新型处理器、新型系统,如张量核心GPU和mvlink交换机织物,这些在人工智能领域都是革命性的创新。当然,系统本身、算法、分布式计算库,如我们广泛使用的Megatron和张量RTLM,都是关键的算法。如果你不理解这些算法,就很难设计出整个技术堆栈。
古德:在英伟达的未来蓝图中,软件生态系统扮演着至关重要的角色。那么,究竟哪个部分是其中最为关键的呢?
黄仁勋:在英伟达的软件生态系统中,每一个创新领域都依赖于一种新的库,我们称之为领域特定库(DSL)。例如,在生成式人工智能领域,我们有名为QNN的DSL;在SQL数据处理中,我们有QDF,它使得数据帧的处理更加高效。无论是使用SQL还是PANDAS,CDF技术都让我们能够显著加速数据处理过程。在量子仿真领域,我们有K Quantum;在计算光刻领域,我们有K LITHO,它助力行业推进下一代芯片制造技术的发展。
随着每一个新DSL的引入,我们都将加速计算的能力拓展到了一个新的市场。这不仅仅是开发一个加速器那么简单,它需要全方位的合作,包括库的完整技术堆栈、架构设计、市场推广策略以及开发者和生态系统的共同建设。只有这样,我们才能成功开拓一个新的领域。因此,构建NVIDIA的未来不仅仅是关于硬件的加速器,更关键的是构建一个完整的技术生态系统。
古德:的确,英伟达确实已经获得了诸多顺风相助。然而,对于未来这些优势是否将持续助英伟达一臂之力,你持有怎样的一种乐观态度呢?
黄仁勋:实际上,尽管我们似乎拥有了许多顺风,但我对这些趋势是否会持续向我们有利的方向发展持有审慎的乐观态度。在我们看来,行业的走向并非自然而然地向我们倾斜;我们必须主动塑造未来——特别是在加速计算领域。众所周知,世界渴望通用计算的简便性,毕竟它易于使用,软件每年自动提速,几乎无需思索,每五年性能提升十倍,十年则百倍。然而,物理极限如原子大小不可缩减,传统CPU架构的发展潜力已经耗尽,我们无法再依赖于通用计算的便利性去实现技术飞跃,特别是在深度学习、量子模拟、分子动力学和流体动力学等领域。
因此,我们创造了加速计算架构来应对这些挑战。但这是一场逆流而上的战斗,因为通用计算是一条容易的道路,我们已经走了60年,为什么不继续走下去呢?加速计算之所以成为可能,是因为在能源日益稀缺、CPU性能提升曲线不再上升的当下,我们能够提供前所未有的性能提升。这需要我们采取不同的方法,而这就是我们所致力于的。
每次我们想要开拓新市场,就面临巨大挑战。数据处理占据了全球计算量的三分之一,几乎每家公司都在进行数据处理,而大多数公司的数据都以表格形式存在。创建一个针对表格数据格式的加速库是极其困难的,因为表中可能包含浮点数、64位整数、字母数字组合等各种数据类型。我们必须找到计算所有这些数据的方法。
几乎每次我们扩展到新领域,比如机器人技术、自动驾驶汽车,甚至是数字生物学和基因测序,都需要我们深入学习并理解必要的算法,以便开拓市场并理解其下的计算层。这样我们才能提供卓越的成果。每次我们开拓新市场,都需要重新发明计算的各个方面,这是一个不断学习和创新的过程,绝无轻松可言。
古德:能源问题至关重要。生成式人工智能对能源的需求日益增长。据研究显示,单次ChatGPT查询所消耗的电力接近于进行一次谷歌搜索的十倍。目前,全球数据中心的能源消耗大约占到1%至2%,有预测指出,这一比例可能在十年内增至3%至4%,甚至6%。从2015年到2019年,数据中心的工作量已经翻了三倍。面对如此迅速增长的能源需求,我们必须思考,是否有足够的能源来支持我们构建和发展的愿景?
黄仁勋:值得注意的是,虽然数据中心的能源消耗在增加,但它们也在推动能源效率的提升。例如,英伟达的Blackwell加速器备受期待,因为它在不增加能耗的前提下,显著提高了应用程序的运行速度。这正是在能源消耗不变的情况下,如何通过技术创新实现成本效益的典范。此外,随着加速计算的兴起,我们正逐渐从传统的CPU处理转向更节能的计算方式。无论是数据处理、文本完成、语音识别还是推荐系统,全球范围内的数据中心都在向加速计算迁移,以期节省能源。加速计算在执行相同处理任务时,能够节省高达20倍至50倍的能源。
从更宏观的视角看,生成式人工智能的终极目标并非仅仅是训练模型,而是在于推理应用。理想情况下,我们创建的新模型将用于预测天气、发现新材料、优化供应链,从而减少能源消耗和浪费。因此,生成式人工智能的长远影响将是通过提高生产力、促进新科学发现、使事物更加节能高效。
最后,随着技术的发展,数据中心的地理分布也将发生变化。未来,我们可能会看到数据中心建在世界各地能源过剩的地区,而不仅仅是靠近现有电网的人口密集区域。随着太阳能等可再生能源的利用,我们将有更多机会将数据中心迁移到能源丰富的地方,从而更有效地利用全球能源资源。
古德:我初次听闻这样的说法:人工智能不在乎它“上学”的地点,这确实引人深思。确实,这值得我们深思。在计算碳排放的过程中,除了直接的能源消耗,还必须考虑整个供应链的影响,这涉及到整个生产和运营链的每一个环节。透明度在这一过程中至关重要。
黄仁勋:我们应该避免将能源远距离输送到数据中心,而应直接在数据中心所在地利用当地能源。完成这一过程后,我们可以得到一个高度压缩的模型,它实质上是所有消耗能源的集中体现。我们可以将这个模型带回,用于进一步的研究或应用。接下来,让我们探讨一下技术发展的下一个浪潮。当然,第一波浪潮无疑是加速计算。虽然今天我们的讨论是在采访者的引导下进行,但作为首席执行官,我有责任向在座的各位介绍我们正在进行的工作。这些工作不仅对我们公司至关重要,也对整个行业的发展具有深远的影响。我们需要向这个群体传达我们所做的努力,这些努力真正关键且意义重大。
古德:开源确实非常重要,它的影响力是巨大的。如果没有开源,这些行业和众多公司将如何能够参与到人工智能的发展中来?看看这些公司和不同的行业,他们如今都在使用LLM 2,而LLM 3.1刚刚发布,人们对它充满期待。我们已经实现了人工智能的普及,并让每一个行业都能参与其中。
黄仁勋:我想强调的是,第一波人工智能浪潮是加速计算。它通过减少能源消耗,使我们能够在不增加能源需求的情况下满足持续增长的计算需求。首要任务是加速一切,这使我们能够实现生成式人工智能。当然,生成式人工智能的先驱包括许多知名的公司,如OpenAI、Anthropic、谷歌、微软等,他们在这方面做出了巨大贡献。接下来,我们没有讨论的人工智能浪潮是企业级应用,其一个重要应用是客户服务。我们希望赋予每一个组织创造他们自己的人工智能的能力,使每个人都能被增强,并拥有一个协作的人工智能,这将赋予他们力量,帮助他们更高效地工作。
紧随其后的人工智能浪潮是物理人工智能,这是一个非常了不起的领域。在这里,我们将需要三台计算机:一台用于创建人工智能,一台用于模拟人工智能,它们都利用合成数据生成技术;还有一个地方,人工智能机器人、人类机器人或操作机器人可以学习如何完善它们的人工智能。当然,第三台计算机是实际运行人工智能的计算机。这是一个涉及三台计算机的复杂问题,我们为此创造了三台计算机,并为此制作了一个视频,帮助你更好地理解这一点。
我们所做的工作包括每一台计算机的每一个部分,无论你是想使用软件堆栈、顶部的算法,还是仅仅是计算基础设施,或者是机器人的处理器,或者是运行在其上的功能性安全操作系统,或者是运行在其上的人工智能和计算机视觉模型,或者是计算机本身,这整个技术堆栈的每一层都是开放的,为机器人开发者提供了无限可能。
文章来源:腾讯科技,版权属于原作者,本网站仅用于公益宣传,转载请注明文章作者及来源。如有侵权请联系我们及时删除。
打开微信,点击底部的“发现”,使用
“扫一扫”即可将网页分享至朋友圈。
点击右上角分享按钮