欧易数字货币交易所 更快、更好、更强

性能暴涨400%!英特尔发布5nm最强AI芯片Gaudi3,英伟达危险了吗?

“牙膏蓝厂”终于迎来翻身日。

就在刚刚,北京时间4月9日23点半,美国亚利桑那州Intel Vision 2024会议上,芯片巨头英特尔(Intel)发布性能最强的新一代Gaudi3 AI 加速芯片,以及全新的下一代英特尔至强6处理器等产品。

其中,英特尔Gaudi 3 AI芯片采用台积电5nm工艺,支持128GB HBMe2内存。相比上代产品,英特尔Gaudi 3带来4倍(400%)的BF16 AI计算能力提升,1.5 倍的内存带宽以及 2 倍的网络带宽提升。

同时,在AI模型算力中,相比于英伟达H100 GPU,Gaudi3 AI芯片的模型训练速度、推理速度分别提升40%和50%,平均性能提高 50%,能效平均提高40%,而成本仅为H100的一小部分。

相比最新英伟达H200,Gaudi3 AI芯片的推理速度竟然也提升30%。堪称最强 AI 芯片。

英特尔预计,Gaudi 3将于2024年第二季度起出货,戴尔、惠普、联想、超微电脑等企业将成为首批客户。

英特尔CEO基辛格(Pat Gelsinger)表示,“创新技术正在以前所未有的速度发展,每家公司都在加速成为AI公司,这一切都需要半导体技术提供支持。从PC到数据中心再到边缘,英特尔正在让AI走进千行百业。”

实际上,随着ChatGPT爆火,AI 模型、数据、算力基础设施成为生成式 AI 技术发展的三大要素。

据Gartner数据显示,2024年,企业在生成式 AI 方向上预期支出达400亿美元,到2027年这一数据增至1510亿美元。与此同时,到2026年,企业对生成式 AI 使用程度达80%,同时至少有50%的边缘计算部署将与AI、机器学习(ML)等方向有关。

然而,AI 技术的全部潜力并没有完全释放出来。仅10%的企业组织去年推出面向生产的生成式 AI 方案;同时,有46%的的专家指出,基础设施是将大模型产品化的最大挑战。

因此,英特尔希望能够利用长期的 AI 技术积累,通过开放生态系统的力量,乘上 AI 热潮。与英伟达部分类似,英特尔也将提供一整套 AI 算力基础设施方案,从而“解锁”企业 AI,推动生成式 AI 的广泛应用和快速商业化,有望帮助企业应对 AI 项目时所面临的挑战。

基辛格在会上表示,到2030年,半导体市场规模将达1万亿美元,而 AI 是其中的主要推动力。

从整体路线图来看,AI PC、Edge AI(边缘)、Data Center AI(数据中心)将成为英特尔三大重要的计算生态系统,比英伟达覆盖面积更广,加上其开放、可扩展的软件和算法特性,广泛适用于多个 AI 领域,从而推动英特尔持续为企业客户打造全新 AI 方案。

具体到技术产品层面,此次Intel 产业创新开幕活动上主要公布五个方向的重要进展:

1、首先是英特尔Gaudi3。新一代Gaudi 3 AI加速器专为高性能、高效率的生成式 AI 计算而构建,每个加速器都具有独特的异构计算引擎,由 64 个 AI 定制和可编程TPC和 8 个 MME 组成,每个Gaudi 3 MME 都能够执行 64000个并行运算,支持128 GB HBMe2 内存容量、3.7 TB 内存带宽和 96 MB 板载静态随机存取内存 (SRAM) 。同时,每个Gaudi 3当中都集成24个200 Gb以太网端口,提供灵活且开放标准的网络。而Gaudi 3 的PCIe 功率为600w,带宽为每秒 3.7TB。

英特尔 Gaudi 3 AI加速器于在今年二季度进行首批供货,而预计将于 2024 年第三季度全面上市,英特尔 Gaudi 3 PCIe 附加卡预计将于 2024 年第四季度上市。

2、全新英特尔至强6处理器品牌,应用于数据中心、云和边缘场景。

其中,与第二代至强处理器相比,配备能效核(此前代号为Sierra Forest)的全新至强6处理器每瓦性能提高2.4倍,机架密度提高2.7倍,客户能以近3:1的比例替换旧系统,大幅降低能耗,预计将于2024年第二季度推出;而配备性能核的英特尔至强6处理器,可将下一个令牌(token)的延迟时间最多缩短6.5倍,能运行700亿参数的Llama2模型,预计不久后推出。

3、预览下一代英特尔酷睿Ultra处理器。英特尔宣布将推出下一代酷睿Ultra客户端处理器家族(代号Lunar Lake),将具备超过100 TOPS平台算力,以及在神经网络处理单元(NPU)上带来超过46 TOPS的算力,从而为下一代AI PC提供强大支持。据悉,英特尔预计将于2024年出货4000万台AI PC设备。

4、面向网络互连层面的新品部署。与NVLink一样重要,通过超以太网联盟(UEC),英特尔公布面向AI高速互联技术(AI Fabrics)开放技术的以太网解决方案,利用高速互联技术支持AI模型训练和推理,产品组合包括英特尔AI网络连接卡(AI NIC)、集成到XPU的AI连接芯粒(Chiplet)、基于Gaudi加速器的系统,以及一系列面向英特尔代工的AI互联软硬件参考设计。

5、全面更新的边缘计算和Tiber业务组合。英特尔还发布新的Edge芯片产品,包括酷睿TM Ultra、酷睿TM、凌动处理器以及面向Edge的英特尔ArcTM GPU,预计所有新品将于本季度上市,应用于包括零售、工业制造、医疗保健等关键领域,并将于今年获得英特尔Tiber边缘平台的支持。另外,英特尔还发布Tiber业务解决方案组合,以简化企业对生成式 AI 软件服务的部署工作,预计Tiber方案将于今年第三季度全面推出。

英特尔披露,截至目前,英特尔边缘计算处理器销量达2亿块,已边缘部署超过9万个解决方案。

另外,英特尔还宣布联合Hugging Face、RedHat、SAP、VMware等15家公司,将共同创建一个开放、多供应商的生成式AI系统平台,通过RAG(检索增强生成)技术,提供运行大量现存专有数据源得到增强版开放大模型。

英特尔强调,公司不仅将提供包括硬件、软件、框架和工具,而且希望设备制造商、数据库提供商、系统集成商、软件和服务提供商等参与其中,推动英特尔AI开放生态系统的构建,以及将生成式AI技术进行场景落地。

总体来说,基于英特尔5nm Gaudi3 AI芯片,以及至强6处理器和软件栈,该公司正逐步构建 AI 领域的算力基础设施生态,全面挑战英伟达以及现有 AI 芯片市场格局。

英特尔方面去年7月对钛媒体App表示,市场需要替代品。客户非常欢迎英特尔Gaudi方案在向大众部署 AI 方面发挥重要的领导作用。“几十年来,英特尔一直致力于把新的技术普及、普惠到各行各业。通过降低进入门槛,提高市场参与度,从而加快创新速度。”

“未来,每一家公司都成为一家 AI 公司。”基辛格称。

那么,前有OpenAI、微软、亚马逊“造芯”,后有英特尔“弯道超车”,英伟达真的危险了吗?

黄仁勋前段时间这段话其实表达的非常明确:“数据中心需要你运营它。购买和销售芯片的人考虑的是芯片价格。运营数据中心的人考虑的是成本,我们总拥有成本(TCO)非常好。即使竞争对手芯片是免费的,他们也不如我们,客户也不会买。我们的目标是增加更多的价值。但这背后需要很多努力,我们必须不断创新、我们不能把任何事情视为理所当然、我们有很多竞争对手。”

事实上,AI 芯片是一个不断向前“奔跑”的高技术行业。它没有垄断,只有不断创新提供更大价值,才有可能让企业持续保持领先地位。因此,无论是英伟达还是英特尔,他们都有非常强大的市场竞争力,也都有望成为 AI 加速计算市场的“领先者”。

英特尔强调,未来公司将在 AI 浪潮中全力引领创新,为各行各业带来前所未有的价值。