Kierowana przez Jima Kellera firma Tenstorrent, produkująca układy scalone, wypuściła na rynek procesor Wormhole nowej generacji przeznaczony do zadań związanych ze sztuczną inteligencją. Oczekuje się, że zapewni on dobrą wydajność w przystępnej cenie.Firma oferuje obecnie dwie dodatkowe karty PCIe, które mogą pomieścić jeden lub dwa procesory Wormhole, a także stacje robocze TT-LoudBox i TT-QuietBox dla programistów oprogramowania. Wszystkie dzisiejsze ogłoszenia są skierowane do programistów, a nie do tych, którzy używają płyt Wormhole do komercyjnych obciążeń roboczych.
„Zawsze cieszy nas, że więcej naszych produktów trafia w ręce deweloperów. Systemy rozwoju wersji wykorzystujące nasze karty Wormhole™ mogą pomóc deweloperom skalować i rozwijać wieloprocesorowe oprogramowanie AI” — powiedział Jim Keller, CEO Tenstorrent.Oprócz tego wprowadzenia na rynek, z niecierpliwością czekamy na postępy, jakie osiągnęliśmy dzięki wypuszczeniu taśmy i uruchomieniu naszego produktu drugiej generacji, Blackhole.”

Każdy procesor Wormhole zawiera 72 rdzenie Tensix (pięć z nich obsługuje rdzenie RISC-V w różnych formatach danych) i 108 MB pamięci SRAM, zapewniając 262 FP8 TFLOPS przy 1 GHz z mocą cieplną 160 W. Karta jednoprocesorowa Wormhole n150 jest wyposażona w 12 GB pamięci wideo GDDR6 i ma przepustowość 288 GB/s.
Procesory Wormhole zapewniają elastyczną skalowalność, aby sprostać zróżnicowanym potrzebom obciążeń. W standardowej konfiguracji stacji roboczej z czterema kartami Wormhole n300 procesory można połączyć w jedną jednostkę, która pojawia się w oprogramowaniu jako zunifikowana, szeroka sieć rdzeniowa Tensix. Ta konfiguracja pozwala akceleratorowi obsługiwać to samo obciążenie, podzielone między czterech programistów lub uruchamiać do ośmiu różnych modeli AI jednocześnie. Kluczową cechą tej skalowalności jest to, że może działać lokalnie bez potrzeby wirtualizacji. W środowisku centrum danych procesory Wormhole będą używać PCIe do rozbudowy wewnątrz maszyny lub Ethernetu do rozbudowy zewnętrznej.
Jeśli chodzi o wydajność, jednoprocesorowa karta Wormhole n150 firmy Tenstorrent (72 rdzenie Tensix, częstotliwość 1 GHz, 108 MB pamięci SRAM, 12 GB pamięci GDDR6, przepustowość 288 GB/s) osiągnęła 262 FP8 TFLOPS przy poborze mocy 160 W, natomiast dwuprocesorowa karta Wormhole n300 (128 rdzeni Tensix, częstotliwość 1 GHz, 192 MB pamięci SRAM, agregacja 24 GB pamięci GDDR6, przepustowość 576 GB/s) zapewnia do 466 FP8 TFLOPS przy poborze mocy 300 W.
Aby umieścić 300 W z 466 FP8 TFLOPS w kontekście, porównamy to z tym, co lider rynku AI, Nvidia, oferuje przy tej mocy projektowej termicznej. A100 Nvidii nie obsługuje FP8, ale obsługuje INT8, z maksymalną wydajnością 624 TOPS (1248 TOPS przy rozproszonym). Dla porównania, H100 Nvidii obsługuje FP8 i osiąga maksymalną wydajność 1670 TFLOPS przy 300 W (3341 TFLOPS przy rozproszonym), co znacznie różni się od Wormhole n300 Tenstorrent.
Istnieje jednak jeden poważny problem. Wormhole n150 firmy Tenstorrent kosztuje 999 USD, podczas gdy n300 kosztuje 1399 USD. Dla porównania, pojedyncza karta graficzna Nvidia H100 kosztuje 30 000 USD, w zależności od ilości. Oczywiście nie wiemy, czy cztery czy osiem procesorów Wormhole może faktycznie zapewnić wydajność pojedynczego H300, ale ich TDP wynosi odpowiednio 600 W i 1200 W.
Oprócz kart Tenstorrent oferuje gotowe stacje robocze dla deweloperów, w tym 4 karty n300 w tańszym modelu TT-LoudBox z procesorem Xeon i aktywnym chłodzeniem oraz zaawansowanym modelu TT-QuietBox z funkcją chłodzenia cieczą Xiaolong z procesorem EPYC.
Czas publikacji: 29-07-2024