首页 关于我们 智慧教育 服务支持 解决方案 新闻动态 投资者关系

新闻动态

你的位置:kaiyun·开云(中国)官方网站 入口 > 新闻动态 > 开云官网切尔西赞助商其瞎想指标惟有一个:处理海量数据-kaiyun·开云(中国)官方网站 入口

开云官网切尔西赞助商其瞎想指标惟有一个:处理海量数据-kaiyun·开云(中国)官方网站 入口

发布日期:2025-10-20 08:16    点击次数:173

开头:内容编译自 AWS开云官网切尔西赞助商。

就像东谈主类生计的好多基本因素(电、自来水、非凡的腹黑)相同,计较机芯片亦然那种你不会去想的东西,因为它照旧融入到你肤浅生活的方方面面。

在智妙手机上动荡屏幕?芯片。在不雅看您最可爱的节目?芯片。在开车?芯片。使用食物加工机制作薯片?芯片。相关词,大多数东谈主对这个位于好多当代开垦中枢的基本构造块知之甚少,因此他们错过了通盘天下。

在亚马逊,自 2015 年收购专科微电子公司 Annapurna Labs 以来,咱们一直在为 AWS 数据中心构建和瞎想芯片。咱们的硬件和软件工程师在从芯片瞎想到奇迹器部署的每个开发阶段进行相助。咱们不是构建芯片,将其集成到系统中,然后再编写软件,而是开发通盘系统并从新运行责任,为咱们试图加快的特定类型的责任负载创建愈加定制的芯片。

这种垂直整合、系统优先的念念维模式恰是咱们芯片的诀要。咱们将向您展示它是怎样竣事的。

什么是芯片?

计较机芯片是一块薄如晶圆的半导体材料薄片,世俗由硅制成,内嵌电子电路。您不错将其视为电子开垦内的决议者。

通盘芯片,不管是用于智妙手机、条记本电脑如故用于查验东谈主工智能的芯片,外不雅齐大同小异,而且齐继承先进期间制造而成。但它们的瞎想主义各不疏导,各有不同。

举例,智妙手机芯片功能种种,不错惩办音尘传递和网页浏览等多种功能,同期尽可能蔓延电板寿命。比较之下,像 AWS Trainium 这么的定制东谈主工智能芯片则领有庞大的计较能力,其瞎想指标惟有一个:处理海量数据,助力生成式东谈主工智能的发展。

在曩昔的几十年里,芯片变得越来越精密和庞大。跟着工程师们竭力从这些细小的元件中榨取越来越庞大的处理能力,芯片也变得越来越复杂。

这种处理能力很猛进度上依赖于芯片以接近光速的超高速传输数据的能力。若是数据从 A 点到 B 点需要跨越哪怕是少量点特殊的距离,齐会对全体性能产生不利影响。

这意味着芯片架构师需要认真念念考怎样"优化"芯片蓝图或平面图,以最大放胆地减少世俗交换信息的组件之间的空间。

就芯片而言,特殊的接地长度可能惟有单个原子的长度,比东谈主类头发的宽度短数千倍,这使得咱们的架构师险些莫得任何容错空间。哪怕是最细小的漏洞,齐可能使方法延误几个月致使一年。计议到价值数百万致使数十亿好意思元的开垦和材料,不丢丑出,芯片的瞎想和制造绝非评释不及或心虚之东谈主所能胜任。

那么,说到 AWS 的 Trainium 芯片,它的作用就在于查验机器学习模子。Trainium 旨在高慢东谈主工智能非凡具体的条目,这需要极其庞大的芯片来处理海量数据。

一块 Trainium 芯片每秒不错完成数万亿次计较。具体来说,一个东谈主数到 1 万亿就需要 31700 多年的时刻。

但要真实了解 Trainium 等芯片的庞大功能和复杂性,您必须撤销高层视角,仔细不雅察。

让咱们放大一下。

若是芯片是一座城市

为了更好地贯串 Trainium 芯片的责任旨趣,咱们不错将其想象成一座城市:硬件是建筑环境,数据流是货品和东谈主员的流动,电力通过地下网罗运输到需要的方位。

因此,芯片瞎想师的念念维方式很像城市野心师,仅仅范畴小到险些无尽。他们可能计议若缘何最好方式接洽交通笨重区域和东谈主流量较少的区域,怎样确保交通系统尽可能高效运行,怎样为不同需求区域提供合理的巨匠程序均衡,或者怎样最大放胆地降古板源毒害。世俗情况下,他们计议的所以上通盘方面,致使更多。

若是将 Trainium 芯片比作一座城市,它将包含不同的区域,每个区域齐奇迹于特定的功能。

芯片的中枢是其笨重的"市中心"——脉动阵列(the systolic array)。这里是活动最世俗的方位,密集的计较日夜不竭地运行。

脉动阵列内容上是一个由数千个专用计较单位构成的网格,这些单位像城市街区相同罗列,每个单位齐能同期执行计较。这些单位以有节律的脉动模式将数据传递给相邻的单位——雷同于腹黑泵血的方式——因此该阵列得名"脉动阵列"。

脉动阵列不竭进行 MAC 运算,即"浮点乘法和累加计较" 。这是一种基本算术计较,一步执行两个运算:乘法和累加。

就像市中心的摩天大楼最大放胆地附近垂直空间来容纳数千名工东谈主相同,脉动阵列密集地封装计较单位,以同期处理数十亿个东谈主工智能操作。

这个区域永不竭歇。它不竭地计较、处理,并将恶果传递给相近的单位。在岑岭时段,数据流动如同岑岭时段的行东谈主,只不外速率超乎寻常,妥洽性也号称完好。

为通盘市中心供电的是数十亿个晶体管,它们罗列在比邮票还小的区域。这些袖珍开关的作用雷同于交通讯号灯,只不外它们每秒不错变化数十亿次。它们通过导通或阻断电流来律例电流,并用数字讲话暗示为" 1 "或" 0 "。

当数十亿个晶体管以这种方式协同责任时,它们不错执行计较,从而使从千里浸式视频游戏到语音助手的一切成为可能。

莫得高效的交通系统,任何城市齐无法高效运转,咱们的 Trainium 社区也不例外。数据通过被称为"数据总线"的专用旅途和网罗在芯片里面和芯片之间传输

就像谈路、高速公路和巨匠交通系融合样,它们传输信息的方式与城市交通网罗将东谈主们送入和送出市中心的方式疏导。

接洽脉动阵列和内存的高流量区域需要雷同"高速公路"的广漠数据总线,以便快速传输多数信息。与此同期,接洽监控系统的低流量数据总线可能更像较窄的"胡衕"。

正如城市野心东谈主员瞎想交通系统以幸免交通拥挤相同,AWS 工程师也会优化数据旅途以确保处理顺畅。当出现信息瓶颈时,性能就会受到影响——就像岑岭时段的拥挤会降速通勤速率相同。

天然计较在市中心进行,但数据却驻留在芯片的存储单位中,或者就咱们的主义而言是"外围区域":高效的存储空间,可容纳东谈主工智能处理所需的海量数据集。

它们关于确保市中心收缩阵列获取所需的信息至关认真。而且它需要快速获取这些信息。

存储单位被罗列在计策位置。世俗造访的数据被放弃在围聚脉动阵列的位置,而较大的数据集则可能位于较远的位置。

操心区与市中心的距离决定了数据检索和处理的速率,就像您的通勤时刻取决于您居住的方位与责任地点的距离相同。

参预地下:中介层。

两个计较中枢芯片(市中心脉动阵列)和四个高带宽内存堆栈(外围区域)齐位于称为中介层的顶部,中介层位于 Trainium 芯片的底部。中介层在计较中枢和内存芯片之间成就认简直接洽(微不雅电通路),使数据巧合在芯片间无缝流动并惩办电力传输。

就像城市地下的基础程序——电力线、水管和光纤铺设其中——相同,中介层创建了一个看不见却至关认简直运载和电力运输系统,将资源精确地运输到需要的方位。正如市中心世俗比住户区需要更多的电力相同,芯片瞎想东谈主员将更多的电力运输到计较密集型区域,同期在需求较低的区域检朴能源。

恰是这个网罗使得不同芯片上的数十亿个晶体管巧合像在一块硅片上构建相同进行通讯,极地面彭胀了芯片瞎想的物理可能性。

咱们的旅程在单个芯片的城市规模处收尾,但值得花少量时刻再次削弱并念念考当这些芯片接洽起来造成更大的系统时会是什么花式 - 就像城市怎样互连结洽以造成更大的大齐市区相同。

在 AWS 数据中心,一台 Trainium 奇迹器不错容纳 16 块芯片。AWS 目下将其中四台奇迹器接洽在沿途,造成一个称为" UltraServer "的奇迹器。这使得 64 块互连的芯片巧合协同责任,显耀加快复杂计较,并为下一波生成式东谈主工智能提供能源。

当你将其乘以数十万个芯片和多个数据中心时,你最终可能会得到天下上最庞大的用于查验东谈主工智能的计较机之一开云官网切尔西赞助商,这一切齐要归功于最空洞的议论——以及在微不雅表率上实施的伟大创意。