Compania de cipuri Tenstorrent, condusă de Jim Keller, a lansat procesorul Wormhole de generație următoare pentru sarcini de lucru bazate pe inteligență artificială, despre care se așteaptă să ofere performanțe bune la un preț accesibil.Compania oferă în prezent două plăci PCIe suplimentare care pot găzdui unul sau două procesoare Wormhole, precum și stații de lucru TT-LoudBox și TT-QuietBox pentru dezvoltatorii de software. Toate anunțurile de astăzi sunt destinate dezvoltatorilor, nu celor care utilizează plăci Wormhole pentru sarcini de lucru comerciale.
„Este întotdeauna o satisfacție să punem mai multe dintre produsele noastre la dispoziția dezvoltatorilor. Sistemele de dezvoltare a lansărilor care utilizează plăcile noastre Wormhole™ pot ajuta dezvoltatorii să scaleze și să dezvolte software de inteligență artificială multi-cip”, a declarat Jim Keller, CEO al Tenstorrent.Pe lângă această lansare, suntem încântați să vedem progresele pe care le facem cu dezactivarea benzii tape și punerea la punct a produsului nostru de a doua generație, Blackhole.”

Fiecare procesor Wormhole conține 72 de nuclee Tensix (cinci dintre care suportă nuclee RISC-V în diverse formate de date) și 108 MB de SRAM, oferind 262 FP8 TFLOPS la 1 GHz cu o putere termică proiectată de 160 W. Placa Wormhole n150 pe un singur cip este echipată cu 12 GB de memorie video GDDR6 și are o lățime de bandă de 288 GB/s.
Procesoarele Wormhole oferă scalabilitate flexibilă pentru a satisface nevoile diverse ale sarcinilor de lucru. Într-o configurație standard a unei stații de lucru cu patru plăci Wormhole n300, procesoarele pot fi combinate într-o singură unitate care apare în software ca o rețea centrală Tensix unificată și extinsă. Această configurație permite acceleratorului să gestioneze aceeași sarcină de lucru, să fie împărțită între patru dezvoltatori sau să ruleze simultan până la opt modele diferite de inteligență artificială. O caracteristică cheie a acestei scalabilități este că poate rula local fără a fi nevoie de virtualizare. Într-un mediu de centru de date, procesoarele Wormhole vor utiliza PCIe pentru extindere în interiorul mașinii sau Ethernet pentru extindere externă.
În ceea ce privește performanța, placa Wormhole n150 cu un singur cip de la Tenstorrent (72 de nuclee Tensix, frecvență de 1 GHz, 108 MB SRAM, 12 GB GDDR6, lățime de bandă de 288 GB/s) a atins 262 TFLOPS FP8 la 160W, în timp ce placa Wormhole n300 cu două cipuri (128 de nuclee Tensix, frecvență de 1 GHz, 192 MB SRAM, 24 GB GDDR6 agregat, lățime de bandă de 576 GB/s) oferă până la 466 TFLOPS FP8 la 300W.
Pentru a pune în context cei 300W de la 466 TFLOPS FP8, îi vom compara cu ceea ce oferă liderul pieței de inteligență artificială, Nvidia, la această putere termică. Nvidia A100 nu acceptă FP8, dar acceptă INT8, cu o performanță maximă de 624 TOPS (1.248 TOPS când este dispersă). Prin comparație, Nvidia H100 acceptă FP8 și atinge o performanță maximă de 1.670 TFLOPS la 300W (3.341 TFLOPS când este dispersă), ceea ce este semnificativ diferit de Wormhole n300 de la Tenstorrent.
Există însă o problemă majoră. Wormhole n150 de la Tenstorrent se vinde cu amănuntul la 999 de dolari, în timp ce n300 se vinde cu 1.399 de dolari. Prin comparație, o singură placă grafică Nvidia H100 se vinde cu 30.000 de dolari, în funcție de cantitate. Desigur, nu știm dacă patru sau opt procesoare Wormhole pot oferi performanța unei singure H300, dar TDP-urile lor sunt de 600W, respectiv 1200W.
Pe lângă plăci, Tenstorrent oferă stații de lucru prefabricate pentru dezvoltatori, inclusiv 4 plăci n300 în varianta mai accesibilă TT-LoudBox bazată pe Xeon cu răcire activă și varianta avansată TT-QuietBox cu funcție de răcire cu lichid Xiaolong (bazată pe EPYC).
Data publicării: 29 iulie 2024