NVIDIA狂飙AI ,市值暴涨,PC性能提升60倍!40系SUPER显卡发布,4899元碾压上代旗舰
【新智元导读】今年的CES大会上,NVIDIA依然给全世界震撼不停。正式下场AI PC,性能直接飙涨60倍;40系SUPER显卡,已全面碾压上代旗舰;AI NPC甚至能跟屏幕外的玩家直接开启实时对话,这也太科幻了……
一年一度的CES2024上,NVIDIA又给了全世界亿点点震撼。
GeFroce RTX40SUPER系列显卡,全新的AI PC,Generative AI模型等全新AI模型和工具,以及AI NPC……NVIDIA甩出的各种王炸级的产品和应用,再次击穿全球用户的想象力!
正如发布会所说:在这个新世界,每一次游戏、每一个瞬间、每一处细节都至关重要。
从史诗般的单人冒险,到激烈的多人对决,NVIDIA都带给了我们超越极限的体验。
这次,NVIDIA还带给我们一个惊喜,就是AI PC的概念,它能让开发者的效率大增,带领玩家们进入完全不同的新境界。
而最新RTX40SUPER系列显卡,在满足传统游戏玩家对于极致游戏画面的追求之外,还能充分发挥Tensor核心加速AI运算的能力,让PC上执行AI应用的体验,也事半功倍。
NVIDIA还更新了NVIDIA ACE AI NPC服务,赋能游戏厂商,让用户能够体验到接近与真人沟通的游戏中NPC的互动游戏体验。
而除了传统服务游戏玩家的新产品和服务,针对AI PC,NVIDIA也协同合作伙伴,推出了一系列针对AI应用和游戏开发者的效率工具和硬件设备。
新时代的AI开发体验,就是这么丝滑流畅!
随着CES大会上的一系列发布,NVIDIA美股涨超6%再创纪录新高。
「人工智能PC」时代来临!
这次,NVIDIA和各大OEM一起,推出了全新AI-Ready的RTX笔记本电脑。PC计算,从此将迎来新时代。
这次推出的笔记本,包括机身纤薄至16毫米的14英寸设备,到功能超强的18英寸设备。
得益于强大的RT Core和Tensor Core,每台RTX笔记本电脑,都做到了AI-Ready。
生产式AI的爆发,让PC走进AI顺理成章,AI PC也成为诸多大厂关注的一个焦点。
去年9月,英特尔CEO基辛格曾喊出了AI PC的概念。而且按英特尔的设想,AI PC正在加速前进,2025年将会有上亿台具备AI智能模块的PC问世。
而NVIDIA也在这次的CES2024上,彻底从幕后走到台前,让自己从最大的AI算力提供商,转变为最为强大的AI应用和硬件的综合解决方案提供商。
这一年爆火的生成式AI带来的机遇,让NVIDIA判断:它将永远改变我们与游戏互动的方式。
NVIDIA创始人兼首席执行官黄仁勋表示:
生成式AI是计算史上最重要的平台转变,它将改变包括游戏在内的所有行业。NVIDIA拥有超过1亿台RTX AI PC和工作站的用户基础,为开发者和玩家提供保证,让他们尽享生成式AI的魔力。
能在PC上本地运行生成式AI,对于隐私、延迟和成本敏感型应用都至关重要。
但这往往需要用户具备大量AI系统安装基础,而且如果没有合适的开发者工具来调优PC平台的AI模型,PC端本地运行AI模型的体验也会很糟糕。
为满足这些需求,NVIDIA正通过其整个技术栈提供创新,不断改善PC用户和开发者的体验。
现已有超过500款游戏和应用支持RTX ,让AI PC的体验更进一步。
RTX GPU能以最高性能运行各种应用,充分释放PC上生成式AI的潜力。
其中,RTX GPU中的Tensor Core可显著加速工作和娱乐应用中要求最严苛的AI功能,成为了AI PC体验的最强大硬件保障。
而且NVIDIA与合作伙伴发布全新RTX AI笔记本电脑,可以为用户带来开箱即用的生成式AI体验。
与使用NPU相比,RTX AI笔记本电脑的AI性能可提升20-60倍。
可以想象,在PC新时代,我们的生活将全方位被改变。
RTX40SUPER超级首秀
在RTX40系列显卡上市两年之后,黄老板再次按照惯例,推出了3个型号SUPER级显卡。
4K性能猛兽:GeForce RTX4080SUPER
针对想要畅玩4K游戏的高端玩家,NVIDIA这次推出了支持4K全景光线追踪游戏的GeForce RTX4080SUPER。
对于追求最高分辨率下极致性能的玩家,GeForce RTX4080SUPER只排在GeForce RTX4090之后,它的性能可达3080Ti的两倍。
相比于RTX4080,它搭载了更多CUDA核心和世界上最快的GDDR6X显存,速度高达23Gbps。
RTX4080SUPER的性能比不支持DLSS帧生成技术的GeForce RTX3080Ti快1.4倍,在传统光栅化游戏中也能提供惊人性能。
凭借836AI TOPS,DLSS帧生成带来额外性能提升,RTX4080SUPER性能是RTX3080Ti的2倍。
GeForce RTX4080SUPER将于1月31日开售,起价人民币8099元。
除了游戏和直播,RTX40SUPER系列在提升工作效率和创意应用方面也表现出色。
例如Blender这样的3D应用程序,新一代显卡的运行速度可比上一代提高70%之多。
在最新的生成式AI应用中,RTX40SUPER系的性能也明显超过了RTX3080Ti——在Automatic1111WebUI上使用Stable Diffusion XL生成1024x1024分辨率的图像,速度提高了1.7倍。
同样,在Stable Video Diffusion中,RTX4080SUPER生成视频的效率提升了1.5倍,能够通过ComfyUI快速创作出25帧的视频内容。
2K极致体验:GeForce RTX4070Ti SUPER
对于追求2K游戏极致体验,偶尔有4K游戏要求的玩家,NVIDIA推出了GeForce RTX4070Ti SUPER。
与RTX4070Ti相比,它拥有更多核心,显存容量增至16GB,显存位宽为256bit,显存带宽大幅提升至672GB/s。
相比起上一代RTX3070Ti,RTX4070Ti SUPER直接快了1.6倍。而在DLSS3技术的加持下,性能更是提升了2.5倍。
GeForce RTX4070Ti SUPER将于1月24日开售,起价人民币6499元。
不是80买不起,只是70SUPER更有性价比
GeForce RTX4070SUPER,显得性价比高得多。
它不仅在核心数量上比RTX4070多了20%,而且在游戏中的性能甚至超过了上一代次旗舰RTX3090。
虽然性能强于RTX3090,功耗却更低。
在DLSS3和帧生成特性的加持下,它对3090的性能领先优势将扩大到了1.5倍。
GeForce RTX4070SUPER也是上市日期最早的40SUPER系列显卡,将于1月17日开售,起价人民币4899元。
这些游戏,将全面支持光追
与此同时,NVIDIA宣布,《暗黑破坏神IV》(Diablo IV)将全面支持光追和DLSS3。
而《Pax Dei》和《地平线:西之绝境》(Horizon Forbidden West)等新游戏也将支持DLSS3技术。
借助DLSS,游戏画面中接近90%的像素可由AI生成,将全景光线追踪的速度提升至原来的4倍,同时提供更好的图像质量。
全新的画质,已经不足以用「震撼」两个字形容了!
光追技术将在今年三月登录「暗黑破坏神IV」,等待玩家们的,将是无限的惊喜。
RTX 生成式AI,革新体验
NVIDIA潜心布局AI领域十多年,尤其是2018年推出的革命性RTX GPU将AI运算的加速推到了全新高度。
而近期发布的一系列针对Windows平台的软件加速库,配合这次推出的全新PC级RTX GPU,可以充分发挥其中的Tensor核心的潜力,让每一台RTX电脑直接化身为性能强大的AI PC效率平台:
- 用NVIDIA RTX Remix轻松重制经典游戏
借助即将上线的RTX Remix平台,MOD爱好者可以轻松增强游戏素材,使用功能强大的AI工具自动增强材质,快速创建支持光线追踪和DLSS的令人惊艳的RTX重制版游戏。
具体来说,RTX Remix对经典的DirectX8和DirectX9游戏(采用了预设的渲染流程)进行现代化升级——不仅加入了路径追踪技术、DLSS超采样技术、AI增强的纹理效果,而且还允许玩家自行设计元素。
像「上古卷轴3:晨风(Morrowind)」这类经典的游戏在运行时,会将绘图请求(渲染指令)发送到GPU。
而RTX Remix Runtime则会截取这些绘图请求,将其解析为独立的资产,并将这些资产重新组合为同一场景。
这样,RTX Remix可将资产和场景转换为被广泛采用的USD开放式3D框架。
由于RTX Remix基于NVIDIA Omniverse平台构建,这些USD游戏素材可以轻松导入到RTX Remix应用或任何其他 Omniverse应用或连接器中。
比如各种常见的游戏行业标准应用:Adobe Substance3D Painter、Autodesk Maya、3ds Max、Blender、SideFX Houdini和Epic Games的虚幻引擎。
当资产从Omniverse连接器同步到Remix的界面时,游戏Mod团队可以协同改进和替换资产,并实现每次修改的可视化。
这一强大的工作流将改变Mod社区处理其制作游戏Mod的方式,为开发者提供统一的工作流,让他们能够在重置各种不同游戏时延续使用已掌握的技能,而无需学习大量专有工具。
RTX Remix游戏Mod开发完成后,用户便可轻松导出Mod并在线与其他游戏玩家共享。
游戏玩家可下载该Mod,将其与.exe文件一起放入游戏目录并启动游戏。
NVIDIA RTX Remix Runtime可以完成其余工作,将旧版渲染API和系统替换为RTX Remix Runtime的64位Vulkan渲染器,并实时在后台升级视觉效果。
最重要的是,NVIDIA RTX Remix游戏Mod可与从Nexus Mods、Mod DB或其他网站下载的现有游戏Mod配合使用,让拥有丰富Mod内容的游戏即时实现光线追踪升级。
- 「Chat with RTX」:轻松利用RAG将LLM与自己的数据相连
这次,NVIDIA还发布了一款全新的程序Chat with RTX,让用户可以把自己的文档、视频或其他数据和LLM相连。
利用检索增强生成(RAG)、TensorRT-LLM和RTX加速,用户可以查询自己定制的聊天机器人,快速获得上下文相关的答案。
注意,在这个过程中,全部数据都是在用户的Windows RTX PC或工作站上本地运行的,因此延迟会非常低,数据安全性也能得到保障。
- TensorRT迎来重大更新
NVIDIA TensorRT是一款专为高性能深度学习推理任务设计的SDK,它整合了深度学习推理优化器和运行环境,可提供更低的延迟和更高的吞吐量。
在MLPerf Inference这一机器学习领域的基准性能测试中,TensorRT正是NVIDIA取得全面胜利的幕后功臣。
在大语言模型领域,TensorRT-LLM可以将模型的性能提升8倍之多。
并且,在降低总体拥有成本(TCO)约5.3倍的同时,将能耗减少了将近6倍。
同样,对于Windows11PC来说,人工智能的引入使其成为了技术历史的一个里程碑,为游戏玩家、内容创作者、主播、办公人员、学生乃至日常电脑使用者带来了革命性的体验。
前段时间,NVIDIA推出了专为Windows设计的TensorRT-LLM——一个用于加速LLM的开源库,让开发者可以充分利用RTX GPU的Tensor核心。
具体来说,TensorRT-LLM for Windows不仅将LLM的推理速度提升了5倍,而且还可让诸如Mistral7B这类模型,可以在配备有8GB以上显存的30系和40系GPU上运行。
这意味着,即便是在那些体积小巧的Windows设备上,也能体验到快速而准确的大语言模型本地处理能力。
在CES2024上,NVIDIA再次宣布——TensorRT-LLM将正式为最近爆火的「小模型」Phi-2提供支持。
在文生图领域,Stable Diffusion XL(SDXL)Turbo和LCM是最为常用的Stable Diffusion应用方式。
就在最近,NVIDIA为Stable Diffusion WebUI TensorRT扩展加入了对SDXL Turbo和LCM的支持。与之前最快的实现相比,它们的性能可在TensorRT的加持下提升60%之多。
目前,Stable Diffusion WebUI TensorRT已经全面支持Stable Diffusion1.5/2.1、SDXL、SDXL Turbo、LCM-LoRA加速以及优化的LoRA。
值得注意的是,对于体积较大、计算要求较高的SDXL和SDXL Turbo,推荐使用至少配备了12GB显存的GPU来确保最优的性能。
项目地址:https://github.com/NVIDIA/Stable-Diffusion-WebUI-TensorRT
- NVIDIA AI Workbench & NVIDIA AI Enterprise
前段时间,为帮助开发者利用PC级的性能和显存快速创建、测试和微调生成式AI模型,NVIDIA重磅发布了一款统一且易用的工具包——NVIDIA AI Workbench。
而在本月底,AI Workbench将正式推出测试版,提供对Hugging Face、GitHub和NVIDIA NGC等热门资源库的流畅访问、简化用户界面,使开发者能轻松复制、协作和迁移项目。
对于专业级的AI开发人员,NVIDIA也准备了非常多的新软件和开发工具,帮助他们高效率地在配备RTX GPU的移动工作站上运行NVIDIA AI Enterprise软件,包括TensorRT和NVIDIA RAPIDS。
其中,RAPIDS由一系列开源软件库和API组成,专为在GPU上完整执行数据科学流程而设计,可将数据分析和模型训练的时间从数天缩短到几分钟,大大简化了这一过程。
AI NPC真的来了
除了和往年一样专门为玩家定制的SUPER级显卡,这次NVIDIA还更新了此前就惊艳了所有人的AI NPC技术,玩家的体验,已经被提升到前所未有的级别!
看,游戏里的这个NPC,正在跟玩家进行实时对话,告诉玩家自己最近正在一个新GPU上测试一项很酷的游戏技术。
这惊人的场景背后,正是NVIDIA最新推出的NVIDIA Avatar Cloud Engine(ACE)微服务。
它可以让开发者将最先进的生成式AI模型,加入到游戏和应用的虚拟数字人物里,让它们变得栩栩如生。
开发者可以通过新的ACE微服务,利用NVIDIA Audio2Face(A2F)等AI模型,以及NVIDIA Riva自动语音识别(ASR)构建交互式虚拟数字化身。
其中,前者能从声音来源制作表情丰富的面部动画,后者可开发定制的多语言语音和翻译应用,以供虚拟数字人物使用。
具体来说,玩家首先输入语音,系统会将语音传递给自动语音识别模型,将语音转化为文本,然后,系统会将得到的文本输入LLM,生成角色的回复。
接下来,系统会通过文本转语音模型,将文本回复转换为语音回复,将其传递给动画模型,生成逼真的口型同步动画。最后,系统将在游戏场景中渲染动态角色。
在过去,游戏中的 NPC(非玩家角色)通常只能按照预设的脚本和面部动画来响应玩家,这使得玩家与 NPC 的交互往往显得公式化、短暂,因而大部分玩家很快就会失去兴趣。
现在,很多游戏大厂都开始采用ACE来改变玩家与NPC的交互方式,这其中就包括Convai,Charisma.AI,Inworld,米哈游,网易游戏,掌趣科技,腾讯游戏,育碧和UneeQ。
网易高级副总裁,雷火事业群负责人胡志鹏表示:
多年来,NVIDIA一直是游戏技术的先锋,提供新的创新方法来创建游戏。NVIDIA正在通过采用游戏人工智能技术,让游戏变得更加智能和可玩,最终创造出更加身临其境的体验。
腾讯游戏表示:
这无疑是AI在游戏领域的里程碑。NVIDIA ACE和腾讯游戏甘做引路人,为游戏塑造独一无二、个性鲜明且互动自然的虚拟数字人物及互动方式。
为了展示ACE技术如何革新NPC与玩家的互动方式,NVIDIA与Convai合作,对在Computex大会上首次展出的NVIDIA Kairos演示进行了扩展,加入了许多新特性,并整合了ACE的微服务。
在Kairos的最新版本中,Riva ASR和A2F被大量应用,显著提升了NPC的交互能力。
,时长02:26
借用Convai的新框架,游戏角色现在可以基于和玩家的对话识别并操作物体,比如捡起并运送物品到指定地点。
此外,NPC还能引导玩家达成任务目标,在游戏世界中自由移动。
目前,Audio2Face和Riva自动语音识别服务现已上线,开发者可以将这些服务独立地集成进他们的游戏开发流程中。
数十年来,NVIDIA在PC领域一直处于领先地位,凭借1亿多颗RTX GPU推动了AI PC时代的到来。
大模型过去一年如火如荼地发展,让NVIDIA再次看到了AI PC的诸多可能。
生成式AI正在成为最新科技发展的拐点,而NVIDIA则是这一重大科技转型的核心,RTX加速生成式AI为AI PC体验提供动力。
RTX40SUPER系列显卡发布,RTX 生成式AI工具、用于构建AI模型的PC开发工具、AI NPC,都将让游戏玩家、开发者、设计师等在PC上更好地借用AI的强大的能力。
AI PC时代,NVIDIA再次抢夺了先机。
- 0000
- 0000
- 0000
- 0000
- 0000