Intel Core i7 920

Procesori | 31.12.2008. | 0 komentara - Enis Šahinović

Intel Core i7 procesori bazirani na novoj Nehalem arhitekturi napokon su dostupni na našem tržištu. Intel najavljuje značajno poboljšanje performansi u odnosu na Penryn procesore, donosi integrisani DDR3 memorijski kontroler, QPI i novi socket, no da li je Core i7 procesor koji preporučujemo u ovom trenutku?

Uvod, cache hijerarhija i SSE 4.2

Nakon što je Intel najavio predstavljanje Nehalem arhitekture, odnosno Core i7 serije procesora, mnogi analitičari su smatrali da je ovo predstavljanje preuranjeno s obzirom da iz tržišne perspektive ne postoji prava potreba za novom arhitekturom zbog činjenice da Intelovi procesori i dalje imaju prednost u performansama koju čuvaju još od predstavljanja Conroe/Core arhitekture u 2006. godini. Jedan od glavnih razloga zbog kojih se Intel odlučio na novu arhitekturu je omogućavanje modularnosti i skalabilnosti iz prostog razloga jer su prethodni procesori dizajnirani kao dvozegreni te se za dobivanje procesora sa više jezgri koristila njihova kombinacija u jedno pakiranje što je dovelo do problema u brzini komunikacije između jezgri, memorije i čipseta.

 corei7logos

Uz predstavljanje Nehalem arhitekture, Intel je uspio da preko osobine modularnosti omogući manipulaciju nad brojem jezgri, L3 cache memorijom, memorijskim kontrolerom i podrškom za željeni tip memorije, brojem QPI linkova i memorijskih kanala i slično, te na taj način odgovori potrebama tržišta, odnosno skalira performanse po potrebi. Intel je, također, odlučio da slijedi svoju tik-tak poslovnu politiku na osnovu koje nakon predstavljanje nove arhitekture slijedi revizija u naprednijem tehnološkom procesu pa onda ponovo nova arhitektura itd.

 tick-tock

Ova poslovna politika se ogleda upravo u predstavljanju Conroe (tak) arhitekture u 2006. godini, potom reviziji iste arhitekture pod kodnim imenom Penryn (tik) u 2007. godini (45nm), nakon čega smo dobili novu arhitekturu Nehalem (tak) u 2008. godini, a za 2010. godinu je zakazana revizija ove arhitekture pod nazivom Westmere (tik) u 32nm tehnološkom procesu.

core_i7_cpu1m 

Priču o Nehalem procesoru najbolje je početi sa dimenzijama same jezgre te brojem tranzistora. Manje upućeni čitaoci vjerovatno očekuju jezgru manje površine uz povećanje broja tranzistora u odnosu na Penryn procesore, no to ovdje nije slučaj. Penryn i Nehalem procesori izrađeni su u istom proizvodnom procesu, 45nm, no za razliku od Penryna koji ima jezgru površine 214mm² te oko 820 miliona tranzistora, Nehalem CPU ima jezgru površine 263 mm² te „samo“ 731 miliona tranzistora.

 

Do toga je došlo zbog integracije memorijskog kontrolera i QPI linka o čemu ćemo nešto više otkriti poslije, a zbog istih razloga, Intel je morao napustiti LGA775 socket te predstaviti socket LGA1366, što definitivno nije oduševilo proizvođače ploča sa velikim brojem LGA775 ploča na lageru.

 

Trenutno su dostupna tri Core i7 procesora: 920, 940 i 965 Extreme Edition koji rade na frekvenciji od 2.66, 2,93 i 3.20GHz respektivno. Svi procesori imaju TDP od 130W te 8MB L3 cache memorije, dok su jedine razlike između Core i7 920/940 i 965 EE procesora QPI brzina od 6.4GT/s kod 965 EE u odnosu na 4.8GT/s kod 920/940 te otključan množilac kod najskupljeg procesora. Kodno ime prve serije Core i7 serije procesora je Bloomfield, no nemojte nam zamjeriti ukoliko ove procesore u nastavku članka referenciramo po imenu same arhitekture, odnosno Nehalem, budući da o ovoj arhitekturi pišemo skoro 2 godine. Trenutne preporučene cijene za navedene procesore su 284, 562 i 999 američkih dolara, što ih jasno stavlja među najskuplje desktop procesore na tržištu, odnosno samu Intelovu platformu čini znatno skupom zbog cijene neophodne DDR3 memorije i X58 ploča.

 

Iako je Intel ponudio procesore sa četiri jezgre prije AMD-a, zanimljivo je spomenuti kako su Bloomfield procesori zapravo prvi Intelovi procesori sa nativne četiri jezgre, odnosno bez korištenja standardnog pakiranja dvaju dvojezgrenih procesora. AMD je ovaj korak napravio sa predstavljanjem Phenom procesora. Svaka od jezgri ima vlastitu L1 (64KB) i L2 (256KB) cache memoriju, dok sve jezgre zajedno koriste dostupnih 8MB L3 cache memorije.

Intelova odluka da jezgrama ponudi samo po 256KB L2 cache memorije je pomalo iznenađujuća, s obzirom da su Penryn procesori na raspolaganju imali 3 ili 6MB L2 cache memorije za dvije jezgre. Prema Intelovim navodima, u slučaju povećanja kapaciteta cache memorije sa 256 na 512KB, došlo bi do povećanja broja ciklusa potrebnih za pristup, dok se sa 256KB situacija zadržala na „prihvatljivih“ 11 ciklusa (što je za 4 ciklusa brže u odnosu na Penryn).

 

Predviđa se da će u budućnosti dosta pažnje biti posvećeno ubrzanju i povećanju kapaciteta L3 cache memorije, dok će kapacitet L2 ostati u granicama koje je postavio Nehalem. Ipak, bez obzira na smanjivanje količine L2 cache memorije, nije došlo do vidljivog pada u performansama, no nije došlo ni do povećanja performansi u aplikacijama koje bi efikasnije mogle iskoristiti L2 cache. L3 cache i memorijski kontroler su odvojeni te se upravljaju preko uncore frekvencije.

 

Kao i kod AMD-a, termin core se koristi za dio procesorske jezgre i L1/L2 cache, dok uncore predstavlja dio koji zauzimaju memorijskih kontroler i dijeljena L3 cache memorija. U slučaju testiranog procesora, uncore radi na frekvenciji od 2.13GHz, dok 965 EE procesor ima uncore frekvenciju od 2.66GHz, a nad istom je moguće vršiti manipulaciju iz BIOS-a. Ipak, nemojte očekivati "vidljiva" povećanja performansi prilikom povećanja isključivo ove frekvencije.

SSE 4.1 set instrukcija predstavljen je s Penryn procesorima, a s obzirom da je uz Nehalem arhitekturu dodatno sedam novih instrukcija, Intel je ovaj set, logično, nazvao SSE 4.2.

 sse1m 

  

Među novim instrukcijama nalaze se Accelerated String and Text New Instructions (STTNI) te Application Targeted Acceleration (ATA) instrukcije čija imena jasno daju do znanja da su namijenjene ubrzanju XML parsiranja, omogućavanju bržih pretraga, prepoznavanja itd.

 

Novost vezana za Nehalem arhitekturu je dodatak drugog TLB (Translation-Lookaside Buffer) nivoa (small page, 512 unosa) za kod i podatke te povećanje kapaciteta TLB-a. TLB se najlakše može opisati kao buffer za virtualno mapiranje memorijskih adresa na fizičke pa se, logično, povećanjem TLB-a ujedno omogućava efikasno korištenje veće količine memorije, a dobra vijest je da se oba TLB nivoa koriste i prilikom omogućavanja SMT podrške, odnosno u situaciji kada operativni sistem četverojezgreni procesor vidi kao procesor sa osam jezgri.

 

Određene promjene vezane su i za Macrofusion tehnologiju koja je predstavljena ranije. Korištenjem ove tehnologije, moguće je dekodiranje više instrukcija tokom jednog ciklusa. Osim toga, Intel je izvršio određene dorade Loop Stream Detectora.

 loopstreamdetector

Ovaj detektor ima za cilj pronalaženje loopova unutar programskog koda te njihovo spašavanje u okviru specijalnog buffera kako bi se ubrzalo izvršavanje, odnosno izbjegla česta pretraga unutar cache memorije. Razlika u odnosu na Core 2 procesore odnosi se na poziciju ovog detektora (28 mikro operacija) koji je ovaj put smješten iza faze dekodiranja, što znači da spašava samo dekodirane loopove.

Izaberite željenu stranu teksta:

Komentari
Ukupno komentara: 0

  • Želim primati obavijest na email za nove komentare
Sadržaj recenzije