Nvidia Fermi (GF100) - kolejne szczegóły architektury
Gdy Nvidia zaprezentowała po raz pierwszy architekturę o nazwie kodowej Fermi, skupiła się głównie na możliwościach oferowanych przez nowe procesory graficzne. Teraz przyszedł czas na podanie kolejnej porcji informacji technicznych.
Prezentacja procesorów graficznych wykorzystujących architekturę Fermi miała miejsce we wrześniu 200. r. Dowiedzieliśmy się wtedy, że układ Fermi składa się z 3 miliardów tranzystorów i 512 rdzeni - to o ok. 40 procent tranzystorów więcej, niż w procesorze RV870 zasilającym karty ATI z serii Radeon 5800.
Procesor GF10. podzielony jest, jak wyjaśnia producent, na cztery podstawowe klastry obliczeniowe (każdy z nich liczy po cztery tzw. procesory strumieniowe; jak łatwo policzyć, łącznie na procesorze mieści się szesnaście jednostek strumieniowych). Każdy z czterech klastrów korzysta z jednego silnika rastrującego (Raster Engine) oraz czterech jednostek specjalnego przeznaczenia (SFU, Special Function Units).
Każdy procesor SM - streaming multiprocessor - składa się z 3. rdzeni CUDA i wyposażony we własny silnik polimorficzny (Nvidia Polymorph Engine), odpowiedzialny m.in. za tesselację czy przekształcenia rzutu sceny 3D. W poprzednich procesorach graficznych Nvidii jeden silnik geometryczny przypadał na całe GPU. W każdym układzie SM znaleźć można cztery jednostki teksturujące.
Rdzenie CUDA dysponują 6. kB współdzielonej pamięci/pamięci podręcznej L1. Komunikują się między sobą za pośrednictwem 48 potoków renderingu, powiązanych z pamięcią drugiego poziomu (768 kB) i podzielonych na sześć grup liczących po osiem jednostek.
Pojemność pamięci L2 jest znacznie większa niż np. w układach GF20. ( tam było to 256 kB ). W architekturze Fermi jest ona wykorzystywana do współdzielenia danych między procesorami strumieniowymi. Bloki ROP współpracują z 64-bitowym kontrolerem pamięci DRAM.
Nvidia nie ujawniła takich danych jak częstotliwości taktowania pierwszych kart GF10. zapotrzebowania na energię.
Co z wydajnością?
Wydajności układów Fermi wciąż dokładnie nie znamy. Wczesne benchmarki Nvidii wskazują, że GF10. w grach radzi sobie nawet dwa razy lepiej z przetwarzaniem grafiki niż najszybszy układ AMD - ATI Radeon HD5870, jednak wyniki te uzyskiwano zwykle w testach syntetycznych. W prawdziwych grach wydajność Fermi można szacować na 25-50 % wyższą, w zależności od gry i ustawień. Producent obiecuje znaczący wzrost wydajności w rozgrywce wykorzystującej tryb wygładzania krawędzi 8x.
Obietnice wysokiej wydajności mogą nie wystarczyć, aby zachęcić do zakupu nowych układów. Dla znakomitej większości klientów indywidualnych podstawowym kryterium wyboru karty graficznej jest opłacalność, stosunek wydajności do ceny.