Jim Keller, firma Chip, Tomstorrent, wydała swój procesor Nowej Generacji dla obciążeń AI, który, jak się spodziewa, zapewni dobrą wydajność w przystępnej cenie.Firma oferuje obecnie dwie dodatkowe karty PCIE, które mogą pomieścić jeden lub dwa procesory tunelowni, a także stacje robocze TT-GOUDBOX i TT-QUietbox dla programistów. Wszystkie dzisiejsze ogłoszenia są skierowane do deweloperów, a nie tych korzystających z tablic tuszenicznych do obciążeń komercyjnych.
„Zawsze satysfakcjonujące jest przekazanie większej liczby naszych produktów w ręce programistów. Systemy rozwoju z wykorzystaniem naszych kart Wormhole ™ mogą pomóc programistom skalować i opracować oprogramowanie AI z wieloma chipami”, powiedział Jim Keller, dyrektor generalny TenStorrent.Oprócz tego premiery cieszymy się, że poczyniamy postępy z taśmą i ulepszeniem naszego produktu drugiej generacji, Blackhole. ”

Każdy procesor tunetu zawiera 72 rdzenie tensix (z których pięć obsługuje rdzenie RISC-V w różnych formatach danych) i 108 MB SRAM, dostarczając 262 FP8 TFLOPS przy 1 GHz o mocy konstrukcyjnej termicznej 160 W. Karta N150 Single-Chip N150 jest wyposażona w pamięć wideo 12 GB GDDR6 i ma przepustowość 288 GB/s.
Procesory tuszelstwa zapewniają elastyczną skalowalność, aby zaspokoić różnorodne potrzeby obciążeń. W standardowej konfiguracji stacji roboczej z czterema kartami Woutomhole N300, procesory można połączyć w jedną jednostkę, która pojawia się w oprogramowaniu jako zunifikowana, szeroka sieć podstawowa TENSIX. Ta konfiguracja pozwala akceleratorowi obsłużyć to samo obciążenie, podzielić na czterech programistów lub jednocześnie uruchomić do ośmiu różnych modeli AI. Kluczową cechą tej skalowalności jest to, że może działać lokalnie bez potrzeby wirtualizacji. W środowisku centrum danych procesory tuszelstwa używają PCIE do rozszerzenia wewnątrz komputera lub Ethernet do rozszerzenia zewnętrznego.
Pod względem wydajności, karta tunestotrwałego N150 z pojedynczym tubylem NOSTorrent (72 rdzenie tensix, częstotliwość 1 GHz, 108 MB SRAM, 12 GB GDDR6, 288 GB/s szerokość przepustowości) 262 FP8 TFLOPS przy 160W, podczas gdy Dual Chip Wormhole N300 (128 Tensix Cores, 1 GHZ, 192 MB SRAM, SRAM, SRAM, SRAM, SRAM, SRAM, Zgadzone 24 GB GDDR6, 576 GB/s przepustowość) dostarcza do 466 FP8 TFLOPS przy 300 W.
Aby umieścić 300 W 466 FP8 TFLOPS w kontekście, porównamy to z tym, co lider rynku AI Nvidia oferuje przy tej mocy projektowej. A100 NVIDIA nie obsługuje FP8, ale obsługuje INT8, z szczytową wydajnością 624 wierzchołków (1248 wierzchołków, gdy jest rzadkie). Dla porównania, H100 NVIDIA obsługuje FP8 i osiąga szczytową wydajność 1670 TFLOPS przy 300 W (3341 TFLOPS w rzadkich), co znacznie różni się od tuby tuby tubylannamurkowego Nystorrent.
Jest jednak jeden poważny problem. Woutomhole N150 NetStorrent sprzedaje za 999 USD, podczas gdy N300 sprzedaje za 1 399 USD. Dla porównania pojedyncza karta graficzna NVIDIA H100 sprzedaje za 30 000 USD, w zależności od ilości. Oczywiście nie wiemy, czy cztery lub ośmiu procesorów tunefikowanych może faktycznie zapewnić wydajność pojedynczego H300, ale ich TDP wynosi odpowiednio 600 W i 1200 W.
Oprócz kart, TenStorrent oferuje gotowe stacje robocze dla programistów, w tym 4 karty N300 w bardziej przystępnej cenie TT-GOUDBOX z aktywnym chłodzeniem oraz zaawansowaną funkcję chłodzenia płynnego Xiaolong opartego na EPYC z Xiaolong).
Czas po: 29-2024 lipca