Cerebras Systems, ASV bāzēts uzņēmums, uzsāka lielāko mikroshēmu, integrējot vairāk nekā 1,2 triljonus tranzistoru un izmēru 46 225 kvadrātmilimetros. Jaunā Cerebras Wafer Scale Engine (WSE) mikroshēma ir optimizēta AI un ir 56,7 reizes lielāka nekā lielākā grafikas apstrādes vienība, kuras izmērs ir 815 kvadrātmilimetri un kurā ir 21,1 miljards tranzistoru. Jaunais Cerebras vafeļu mēroga dzinējs (WSE) nodrošina 3000 reižu lielāku ātrumu ar mikroshēmu un nodrošina 10 000 reižu lielāku atmiņas joslas platumu. Lielāks mikroshēmas izmērs nodrošina ātrāku informācijas apstrādi un pat samazina laiku līdz ieskatam jeb “apmācības laiku”, kas ļauj pētniekiem pārbaudīt vairāk ideju, izmantot vairāk datu un atrisināt jaunas problēmas.
Cerebras WSE ir paredzēts AI un satur fundamentālus jauninājumus, kas sekmē jaunāko sasniegumu sasniegšanu, risinot vairākus gadu desmitus vecus tehniskus izaicinājumus, kuriem ir ierobežots mikroshēmas izmērs - piemēram, savienojums starp tīkliem, raža, enerģijas piegāde un iepakošana. WSE var paātrināt aprēķinus un saziņu, kas samazina treniņu laiku. WSE ir 56,7 reizes lielāks silīcija laukums nekā lielākajai grafikas apstrādes vienībai. Turklāt WSE var nodrošināt vairāk kodolu, lai veiktu vairāk aprēķinu, un vairāk atmiņas ir tuvāk kodoliem, tāpēc serdeņi var darboties efektīvi. Visa komunikācija tiek glabāta pašā silīcijā, jo tā milzīgais serdeņu klāsts un atmiņa ir iestrādāta vienā mikroshēmā.
Cerebras WSE mikroshēma satur 46 225 mm2 silīcija, un tajā ir izvietoti 400 000 AI optimizēti, bez kešatmiņas, bez galvas, skaitļošanas kodoli un 18 gigabaiti vietējas, izplatītas, ļoti ātras SRAM atmiņas. Mikroshēmai ir 9 petabaiti sekundē atmiņas joslas platums, kur kodoli ir savienoti kopā ar smalkgraudainu, visu aparatūru, ar mikroshēmu savienotu sakaru tīklu, kas nodrošina kopējo joslas platumu 100 petabitus sekundē. Tas nozīmē, ka WSE zema latentuma sakaru joslas platums ir ārkārtīgi liels, un tas ļauj kodolu grupām sadarboties ar maksimālu efektivitāti, un atmiņas joslas platums vairs nav šaurā vieta. Vairāk vietējās atmiņas, vairāk kodolu un zema latentuma liela joslas platuma audums kopā veido optimālo arhitektūru AI darba paātrināšanai.
Cerebras WSE mikroshēmas īpašības:
- Palielināti kodoli: WSE integrē 400 000 AI optimizētus skaitļošanas kodolus, kurus sauc par SLAC (Sparse Linear Algebra Core), kas ir programmējami, elastīgi un optimizēti retai lineārajai algebrai, kas ir pamatā neironu tīkla aprēķinam. SLAC programmējamības funkcija nodrošina, ka kodolos var viegli palaist visus neironu tīkla algoritmus mainīgajā mašīnmācīšanās jomā. WSE kodolos ir iekļauta Cerebras izgudrotā retās ražas novākšanas tehnoloģija, kas paātrina skaitļošanas veiktspēju nelielās slodzēs (slodzēs, kas satur nulles), piemēram, dziļu mācīšanos.
- Uzlabota atmiņa: Cerebras WSE integrē vairāk vietējās atmiņas un vairāk kodolu, kas ir vairāk nekā jebkura mikroshēma, kas nodrošina elastīgu, ātru aprēķinu ar zemāku latentumu un ar mazāku enerģiju. WSE ir aprīkots ar 18 GB (gigabaitiem) mikroshēmas atmiņu, kurai var piekļūt ar tās kodolu vienā pulksteņa ciklā. Šī vietējās galvenās atmiņas kolekcija liek WSE piegādāt kopā 9 petabaitus sekundē atmiņas joslas platumu, kas ir par 10 000 X vairāk atmiņas joslas un 3 000 X