BLOG main image
전체 글 (101)
나의일상 (12)
내가즐기는것들 (15)
컴퓨터관련 (10)
AP뉴스받아쓰기 (4)
여러가지정보모음 (7)
요즘세상이야기 (33)
퍼온이야기들 (19)
블로그코리아에 블UP하기 믹시
Visitors up to today!
Today hit, Yesterday hit
daisy rss
tistory 티스토리 가입하기!
2008. 5. 18. 10:32

먼저 여러분들에게 한번 묻겠습니다

 

 

고급형/고가형 그래픽카드란 도대체 무엇입니까?

 

 

보급형 그래픽 카드에서  처리하기 어려운 과부하가 걸리는 고사양 게임에서

 

고화질/고해상도/고성능의 옵션을 적용하여 더 빠르고 원활한 게임 이미지를

 

 처리하기 위하여 고급형 그래픽 카드를 구입하는 것입니다

 

 

램은 왜 더 고용량 램을 끼울까요?

 

 

힘들고 어렵고 과부하가 걸리는 3D작업/렌더링/과부하 인코딩/고사양 게임/시뮬레이션

 

등 프로그램에서  원활하고 부드러운 작업을 위해서  고용량의 램을 증설하는 것입니다

 

 

 

그렇다면 고급형 CPU란 무엇입니까?

 

 

보급형 CPU가 처리하기 어려운 힘들고 어렵고 과부하가 걸리는 무거운 작업과 무거운 운영체제 무거운 프로그램등을 원활히 돌리기 위해서 고급형 CPU를 사용하는 것입니다

 

 

AMD와 인텔 두 회사 모두 고급형 CPU와 보급형 CPU를 나누는 기준은 완전 동일합니다

 

 

 

어렵고 힘들고 과부하 작업인 고해상도 게임/3D작업/과부하 인코딩/시뮬레이션/분자 모델링등의 작업에서 빠르고 효율적으로 처리하는 CPU가 더 고급CPU이며 더 좋은 CPU인 것입니다

 

 

 

 

가격이 2배나 넘게 차이나는 유명한 싸구려 셀러론CPU와  펜티엄CPU의

 

비교는 아주 쉽습니다

 

 

어렵고 힘들고 과부하가 걸리는 작업을 얼마나 능률적으로 처리 해내는지가 셀러론 CPU와 펜티엄 CPU의 차이입니다

 

 

 

저해상도/저화질/저옵션 게임이나 가볍고 쉬운 프로그램을 돌리기 위해서 고급형 CPU와 고급형 그래픽 카드를구매할 필요가 있을까요?

 

 

그냥 보급형 CPU와 보급형 그래픽 카드를 저렴하게 구매해도 저해상도/저화질/저옵션 가벼운 게임은 충분히 모두 게임이 돌아갑니다

 

 

 

컴퓨터에 대해서 아시는 분은 위에 애기가 무슨 애기인지 충분히 아실겁니다

 

 

 

 

그렇다면 AMD와 인텔의 쿼드코어 프로세서중 어떤 CPU가 더 고급형 CPU이며 더 빠른 CPU 인지의 판단은 유저 여러분들에게 맡기겠습니다

 

 

 

한번 자세히 읽어 보시기 바랍니다

 

 

이번에 새롭게 B3스테핑으로 수율과 성능이 한단계 업그레이드 되어

출시되는 쿼드코어(코어 4개)AMD 페넘 9850BE블랙 에디션(2.5GHZ)의 성능이 어떤지

한번 알아보는 시간을 가져보기로 하겠습니다


현재 2008년 4월 인텔의 가장 최상위 고급형 CPU는 인텔 쿼드익스트림

QX9770(3.2GHZ)로 가격은 공시가격으로 140만원정도에 이릅니다



참고 INTEL 쿼드익스트림 QX9650(3.0GHZ)-->평균가격 110만원

그리고 또한 듀얼코어 CPU중에 하나인 인텔 코어2듀오 울프데일 E8500(3.16GHZ/L2 6MB)에  대해서도 이번 테스트에 비교 테스트상 같이 집어넣었습니다


이것은 현재 나오는 최신형 프로그램이나 최신형 게임에서 듀얼코어 CPU와 쿼드코어 CPU가 프로그램에서 어떤 변화가 일어나는지 같은 클럭에서 테스트하는 용도로

사용하기 위함이었습니다


또한 비슷한 CPU클럭에서 어떤 프로세서의 ARCHITECTURE가 더 우수하며

각 회사의 CPU가 어떤 장단점을 갖고 있는지 알아보기로 하겠습니다



가격기준

- Intel 코어2 쿼드익스트림 QX9770 (3.20GHz/FSB 1600MHZ) 1399달러(평균가격 140만원)

- Intel 코어2듀오 울프데일 E8500 (3.16GHZ/FSB 1333MHA) 270달러 (한국 평균가격 33만원)

- AMD 페넘 9850BE 블랙에디션 (2.50GHz/FSB 4000MHZ) 235달러 (한국 평균가격 24만원)




TEST SETUP


Hardware

- Intel Core 2 Quad QX9770 (3.20GHz/FSB 1600MHZ(FSB 1.6GHZ)/L2 12MB) LGA775

- Intel Core 2 DUO E8500 (3.16GHZ/FSB 1333MHZ(FSB 1.3GHZ)/L2 6MB) LGA775

- AMD Phenom QUAD 9850BE (2.50GHz/FSB 4000MHZ(FSB 4.0GHZ)/L2 2MB/L3 2MB)


- DDR2 4G PC2-8500 2X2048MB (2Gx2) CL5


- ASUS M3A32-MVP Deluxe (AMD 790FX)


- Gigabyte GA-X48-DQ6 (INTEL X48)


- SAMSUNG 500GB*2 7200RPM (SATA II)


- GeForce 8800 GT (512MB)


Software


- Microsoft Windows Vista Ultimate (64-bit)




 
사용자 삽입 이미지



PHOTOSHOP CS3(PHOTO FILTERING)


사진작업 유틸로 유명한 포토샵입니다


포토샵 같은 경우 버전에 따라서 CPU의 처리속도가 달라지는데

PHOTOSHOP CS3에서는 그래프에서 보는것과 같이 듀얼코어

CPU인 인텔 울프데일 E8500이 175MB 사진파일을 필터링하는데

228초가 걸려 가장 빠른 사진필터링 작업을 보임을 알수 있습니다


그다음순으로 쿼드코어인 인텔 요크필드 QX9770는 230초가 걸리고

AMD 9850BE(OC 3.2GHZ)같은 경우 259초가 걸리는 순으로 사진필터링

작업을 마치었습니다


포토샵CS3 같이 듀얼코어만 지원하는 구형 프로그램에서

쿼드 코어 이상을 지원하는 최신형 프로그램으로 바뀔때 CPU의 성능과 코어갯수에

따라서 CPU의 속도가 어떻게 변하는지를 중점적으로 보시기 바랍니다


(사진작업 프로그램 같은 경우 응용프로그램에 따라서는 쿼드코어 CPU를

지원하는 프로그램도 있으니 포토샵만 보고 혼동하지 마시기 바랍니다)



포토샵 CS3 분석


A.포토샵 CS3 버전 같은 경우 듀얼코어 CPU에 최적화된 프로그램임을

그래프에서 알수 있다


B.포토샵CS3버전은 현재로써는 쿼드코어 프로그램을 지원하지

않음을 그래프에서 확인 할수 있다



C.포토샵에서 사진 필터링 작업 같은 경우

인텔 울프데일 E8500(3.16GHZ/FSB 1333MHZ/L2캐쉬 6MB)

VS 인텔 요크필드 QX9770(3.20GHZ/FSB 1600MHZ/L2캐쉬 12MB)


에서 알수 있듯이 포토샵은 캐쉬의 양이나 대역폭에 민감하지 않음을 알수 있다

이것은 사진 필터링 작업 같이 가볍고 쉬운 작업인 경우 L2캐쉬나 대역폭에

작업 시간이 적게 영향을 받음을 그래프에서 확인 할수 있다


D.인텔 쿼드코어 QX9770이나 AMD 쿼드코어 9850BE(3.2GHZ)같은 경우 듀얼코어에 최적화된 프로그램에서는 오히려 속도가 약간 더 떨어지는 현상을 확인할수 있다

사용자 삽입 이미지
사용자 삽입 이미지
 

3DMAX 렌더링




3DS MAX

그래프에서 보다시피 MR-LIGHT 갤러리 렌더링에서는 AMD 페넘9850BE(OC 3.2GHZ)가

105초가 걸려 가장 렌더링 시간을 보입니다


반대로 드래곤 캐릭터 렌더링에서는 인텔 요크필드QX9770이

345초의 렌더링 시간으로 가장 빠르고요



반면에 인텔 듀얼CPU 코어2듀오 울프데일 E8500같은 경우

현존하는 듀얼코어 CPU중 비싼 가격을 형성함에도 불구하고


쿼드 코어 지원 프로그램인 3DS MAX에서는

쿼드코어 CPU에 비하여 2배 가까이 속도가 느린것을

그래프에서 확인 할수 있습니다



이것은 포토샵 작업과는 정반대로 쿼드코어를 제대로 지원하는

프로그램에서는 듀얼코어 CPU에 비하여

쿼드코어 CPU가 훨씬 빠른 속도를 내는 것을 3D MAX 그래프에서

확인 할 수 있습니다





3DS MAX 분석

FSB--> AMD 페넘 FSB 4.0GHZ(4000MHZ) VS INTEL 쿼드익스트림 FSB 1.6GHZ(1600MHZ)



A.3DMAX같은 경우 쿼드코어 CPU의 알고리즘을 프로그램상에서

지원함을 그래프에서 확인할 수 있다




B. DRAGON 렌더링 같은 경우 QX9770이 렌더링 시간이 짧게 걸려

가장 빠른것을 알 수 있다



이것은 DRAGON 캐릭터 렌더링 같은 경우 초당 많은 데이타 정보가

이동하지 않음을 알 수 있다


C.반대로 MR-LIGHT GALLERY 렌더링 같은 경우 AMD 9850BE(OC 3.2GHZ)

이 렌더링 시간이 짧게 걸려 가장 빠른 것을 알수 있다


이것은 MR-LIGHT 렌더링 같은 경우 렌더링 작업시 초당 많은 데이타

정보가 순간적으로 이동함을 알수 있다




D.동시에 많은 DATA 정보가 이동할때 AMD 9850BE가 4000MHZ(FSB 4.0GHZ)


이상의 광대역 전송폭을 가져서 QX9770의 1600MHZ(FSB 1.6GHZ)의 대역폭을 가지는


인텔에 비하여 AMD 페넘 프로세서가  부하가 걸리거나 무거운 작업에서


훨씬 유리함을 위에 그래프에서 알수 있다




E.3DMAX같은 경우 이미지에 따라서 순간적으로 CPU 코어가 적은 렌더링 작업을


할수 밖에없는 이미지 같은 경우 인텔 QX9770이 빠른 렌더링 시간을 갖는다


그러나 반대로 초당 순간에 프로세서가 많은 렌더링 작업을 할수 있는 이미지


같은 경우 AMD 9850BE(OC 3.2GHZ)가 가장 빠른 렌더링 작업 속도를


갖는 것을 2가지 그래프에서 비교해서 알수 있다



F.듀얼코어 울프데일CPU같은 경우 쿼드코어 CPU에 비해서 2배 가까이 느린

렌더링 시간을 갖는 것을 3DMAX 프로그램에서 확인 할수 있다

이것은 3D MAX 렌더링 작업 같은 경우 CPU코어갯수가 늘어날수록 FSB대역폭이 늘어날

수록 또한

FPU나 ALU및 연산속도가 늘어날수록 빠른 렌더링 시간을 갖는것을 도표에서 알 수 있다




사용자 삽입 이미지

ALZIP



대한민국에서 가장 국민적으로 사랑받는 압축 프로그램중에 하나인

ALZIP입니다


알집같은 경우 아직 멀티코어 프로세서를 제대로

지원하지 않는 유틸리티입니다


그러나 압축유틸리티 같은 경우 CPU의 데이타처리능력과 시스템 전체의

데이타 처리 능력을 알수있는 좋은 프로그램 중에하나입니다

집이나 회사나 학교에 구형컴퓨터와 신형컴퓨터 2대를 가지고 계신다면

직접 파일압축/압축 해제를 해본다면 구형과 신형컴퓨터 사이에 몇배에 다다르는

압축속도와 압축해제 속도를 직접 느끼실수 있습니다



ALZIP 압축 속도 분석


A.AMD9850(OC 3.2GHZ)가 가장 빠른 압축 생성 시간인 647초의 시간을

가짐을 알수 있다


이것은 CPU하나만 쓰는 싱글코어 작업 속도임에도 불구하고 AMD 차세대 CPU의

 

높은 대역폭인 FSB 4000MHZ이상의대역폭에서 그원인을 찾을 수 있다




B.싱글 코어 CPU 한개만 작동하는 ALZIP 프로그램 같은 경우


듀얼코어 울프데일 E8500이 가장 이론적으로는 더 빠른 압축 시간을


가져야 함에도 불구하고


AMD 페넘 98050BE(OC 3.2GHZ)보다도 더 속도가 늦게 나온것은


인텔 프로세서의 데이타 전송폭(FSB)이 작음에서 기인한다



이것은 인텔 쿼드익스트림 QX9770같은 경우 CPU내부에서 DATA정보를 살짝 더 빠르게

만들어내도 데이타 전송폭이 작다면 결코 AMD 9850BE(3.2GHZ)보다도 속도가

낮을 수 밖에 없음을 위에 그래프는 증명한다



C.인텔 울프데일 E8500같은 경우 위에 CPU중 가장 적은 대역폭과 L2캐쉬 용량으로 인하여 알집 프로그램에서 가장 속도가 느리다



 
사용자 삽입 이미지

WINRAR MULTI-CORE PERFOMANCE



유명한 압축프로그램인 WINRAR입니다


ALZIP에서와 마찬가지로 WINRAR에서도 쿼드코어 AMD 페넘 9850BE(OC 3.2GHZ)가


가장 빠른 압축 성능을 보임을 알수 있습니다


그다음으로 INTEL 요크필드 QX9770(3.2GHZ)이 뒤를 이었고 듀얼코어 CPU인


인텔 울프데일 E8500(3.16GHZ)는 CPU의 코어갯수 2개로 인해


쿼드코어(4개) CPU에 비하여 절반 가까운 성능 밖에 내지 못함을 알수 있습니다



WINRAR 멀티코어 성능 분석


A.WINRAR 멀티코어 성능에서 알수 있는점은 바로 AMD의 네이티브 쿼드코어의

장점을 분명하게 알수 있다는 점이다


AMD 페넘 프로세서같은 경우 네이티브 쿼드 코어 설계로 인하여

급조된 쿼드코어CPU인 인텔 요크필드나 켄츠필드 프로세서에 비하여

CPU 코어 4개가 서로 협동하는 작업에서는 프로세서 코어간에 효율적으로

상호 유기적인 작업을 하는것을 그래프에서 확인 할 수 있다



B. 가볍고 쉬운 유틸리티 작업에서는 인텔의 짝퉁 쿼드코어 CPU나

AMD의 네이티브 쿼드코어 CPU나 성능차이가 거의 나지가 않지만

제대로 쿼드코어 알고리즘을 지원하고 어렵고 무거운 작업으로 갈수록

원다이 쿼드코어 CPU인 페넘 프로세서가 제힘을 발휘함

WINRAR MULTI-CORE PERFOMANCE 그래프는 증명한다



C.듀얼코어 CPU인 인텔 울프데일 E8500(3.16GHZ)같은 경우 듀얼코어 CPU중에서는

 

비싼가격에도 불구하고 쿼드코어 CPU 지원 프로그램에서는 급격한 하락 현상을 보이는


것을 그래프에서 확인 할수 있다




사용자 삽입 이미지

H264인코딩작업



요즘에 FULLHD(풀 HD)지원 고화질 LCD TV가 전세계적으로 점점 점유율이


높아져 가고 있는 상황에 있고 2008년 현재 꽤 많이 보급이 된 상태이며


점점 판매가 호조를 보이고 있는 실정입니다



이런 세계적인 추세에 따라서 근래에는 디스크 용량이 큰 초고화질

블루레이 플레이어가 유행하게 되었고 1920*1080해상도에 이르는 거대한 FULLHD 포맷의 영화나 TV프로그램이 시중에 많이 유통되게 되었습니다



그러나 FULLHD 원본파일 같은 경우 용량이 너무 커서 이것을 압축시키게

되는데 그중에 유명한 파일 포맷인 H264포맷으로 압축하게 될때의

걸린 시간을 측정한 그래프입니다



2시간 03분 12초짜리 분량의 고화질 FULLHD(1920*1080 해상도 /MPEG-2포맷)

 

 

미디어 파일을 H264포맷으로 압축하게 될때의 시간을 측정했습니다



인코딩 분석



A.보통 인코딩이라는 작업을 생각하면 인텔의 이미지를 떠올리며

 

인텔의 강세를 보여온 인코딩 작업에서의 시간 측정 결과이다


그러나 그래프에서 보다시피 AMD 페넘 9850BE(OC 3.2GHZ)이 3시간 46분 23초가

걸려 가장 빠른 인코딩 시간을 갖는것을 그래프에서 확인 할수 있다



그 다음으로 4시간 3분 55초가 걸린 INTEL 요크필드 QX9770(3.2GHZ)가 뒤를 이었고



인텔 울프데일 E8500(3.16GHZ)같은 7시간 11분 38초가 걸려

 

크게 뒤쳐지는 ENCODING 성능을 갖는것을 그래프에서 확인 할수 있다



B. 10개정도의 고화질 FULLHD 인코딩 작업을 한다고 한다면


AMD 페넘 9850BE(OC 3.2GHZ)이 INTEL 요크필드 QX9770(3.2GHZ)에 비하여


2시간~3시간 정도 더 빠르게 작업을 마치어 2개의 쿼드코어 CPU간에 크게


작업 시간이 벌어짐을 알수 있다



C.



하드디스크->램->노스브릿지->캐쉬->CPU->캐쉬->노스브릿지->램->하드디스크



위에서 보다시피 거대한 인코딩 작업 데이타가 FSB 대역폭을 따라 드나든다면


 

상하행선의 버스대역폭에 엄청난 데이타 부하가 걸림을 알수 있다



D.

인텔의 2009년에 나오는 신형 CPU에서 L3캐시 내장/메모리 내장 컨트롤러/네이티브 쿼드

등 AMD의 페넘 프로세서의 ARCHITECTURE를 중국처럼 대놓고 베끼는 것도 알고보면

 

인코딩같이 무거운 작업에서 캐쉬의 질/양/효율 그리고

 

FSB 버스 대여폭이 얼마나 중요한지 알수 있는 대목이다


무겁고 어렵고 힘든 작업으로 갈수록 AMD 페넘 프로세서의 K10 아키텍처의

 

 

거대한 광대역 전송폭이 왜 필요한가를 위에 그래프는 반증한다



E.

L3캐쉬 같은 경우 양날의검과도 같아서 캐쉬가 내장이 많이 될수록 에너지 소비는 많아

지지만 반대로 CPU 상호간에 빠른 데이타 전송력을 가져서 프로세서간에 긴밀한 상호협

동이 필요한 쿼드코어를 지원하는 프로그램에서는 제대로 된 속도를 내줄수 있게 된다



F.

AMD의 FSB 4.0GHZ이상에 이르는 광대역폭은 엄청난 데이타 부하가 걸리는

어렵고 힘든 작업에서 제대로 된 성능 보장을 이끄는 핵심 키포인트인것이다



G.인코딩 작업 같이 초당 CPU가 처리하는 데이타 양이 방대해지고 광활해 질수록 FSB대역폭은 중요하다


왜냐하면 CPU 코어가 4개/8개/12개/16개/20개 이렇게 증가할수록


CPU의 데이타 처리량이 엄청나게 증가한다면 결국 인텔 CPU의 현재 아키텍처로는


인코딩/3D 프로그램/3D게임/실시간 렌더링/과학연산/시스템 모델링/분자 동역학


같이 어렵고 힘든 작업으로 갈수록 CPU 코어가 늘어나는 만큼 시스템 FSB대역폭에서


부하가 걸리는 것은 자명한 것이다



H.인텔 쿼드익스트림 FSB 1.6GHZ(왕복 8차선) VS AMD FSB 4.0GHZ(왕복 20차선)


추석/설날(인코딩/과부하작업) 같이 고속도로에서 정체가 일어나는 경우 인텔 요크필드의


왕복 8차선의 도로 가지고는 데이타 처리가 꽉막혀서 엄청난 정체 현상이 생기는 것은 분


명한 것이다.


특히 CPU의 코어갯수가 4개-->8개-->12개로 대폭 늘어날수록 인텔의 현재 아키텍처로


는 인코딩같이 과부하가 걸리는 어렵고 힘든 작업일수록 FSB 대역폭이 그 성능을 막아서


성능에 분명한 한계적인 벽을 가져오게 되는것이다



특히나 서버 시스템같이 CPU를 수십개에서 수백개까지 동시에 꽃는 시스템이라면


인텔의 현재 플랫폼으로는 분명한 막다른 골목에


몰리게 되며 반대로 인텔과 AMD의 서버시스템이나 워크스테이션 성능비교 에서는 AMD

 

 

의 압승이 예견되는 것은 분명한것이다




 
사용자 삽입 이미지


BLUERAY(멀티미디어/고화질 영화/고화질 HDTV재생)



POWER DVD로 블루레이DVD 를 재생할때 CPU 점유율을 측정한 프로그램입니다

CPU점유율이 낮을수록 프로세서가 효과적으로 미디어파일을 재생하는 것입니다



분석



A.고화질 미디어 재생에서 CPU사용율이 낮다는 것은 그만큼 CPU간에 긴밀하게 상호 의사소통이 원활하게 된다는 것이다

가짜 쿼드코어인 인텔 요크필드같은 경우 코어가 2개로 쪼개져 있어서 CPU상호간에 협동작업이 제대로 되지 않음을 알수 있다


B. CPU사용율이 낮다는 것은 그만큼 남는 CPU자원을 가지고 멀티 태스킹 작업시 더욱 효율적인 작업을 할수 있다는 것을 의미한다



C.듀얼코어 CPU인 인텔 울프데일 E8500같은 경우 CPU 코어 갯수의 제한으로 인해 23.1%의 CPU점유율로 가장 높은 CPU점유율을 보인다


이것은 멀티 태스킹 작업시 그만큼 낮은 효율을 갖는다는 것을 의미한다





사용자 삽입 이미지

PREMIERE PRO2.0 인코딩작업

총 2시간 03분 12초짜리 분량의 고화질 FULLHD(1080P /MPEG-2포맷)

미디어 파일을 WMV9포맷(1080P/ FULL HD)으로 인코딩하게 될때의 시간을 측정했습니


인코딩하면 과거에는 인텔 CPU를 떠올렸지만 동클럭에서

최고의 인코딩 속도를 보여주는 것은 MAINCONCET와 인코딩과 마찬가지로

프리미어 프로2.0에서도 AMD 쿼드코어 페넘9850BE(OC 3.2GHZ)이 10시간 12분 58초의

인코딩 시간을 가지어 가장 빠르게 인코딩 작업을 마치는 것을 볼수 있습니다



그다음으로 인텔 요크필드 QX9770(3.2GHZ)이 10시간 16분 14초의

인코딩작업을 끝마쳤고 인텔 울프데일 E8500(3.16GHZ)같은 경우

17시간 49분 18초가 걸려 쿼드코어 CPU와는 크게 7시간 이상 인코딩

시간이 벌어지는 것을 그래프에서 확인 할수 있습니다


만약 10개정도의 FULL HD파일을 인코딩한다고 한다면 쿼드코어인

AMD 페넘 9850BE(OC 3.2GHZ)과 듀얼코어인 인텔 울프데일 E8500(3.16GHZ)

과는 70시간정도의 시간 격차가 벌어져서 인코딩을 하면 할수록

쿼드코어와 듀얼코어 CPU간에 인코딩 시간이 엄청 크게 벌어지는것을

알수 있습니다



프리미어 프로2.0 WMV9 인코딩 분석



A. 쿼드코어를 제대로 지원하는 프로그램에서는 동클럭에서 확실히 네이티브(오리지날)

쿼드프로세서가 듀얼 코어프로세서 2개를 이어붙인 가짜 쿼드프로세서에 비하여

속도가 빠른것을 확인 할수 있다




B. 쿼드코어를 지원하는 인코딩 프로그램에서는 듀얼코어와 쿼드코어간에

작업 시간이 엄청 크게 벌어지는 것을 그래프에서 확인 할 수 있다



C.

 

AMD 페넘 9850BE(OC 3.2GHZ) FSB 4GHZ

VS 인텔 요크필드 QX9770(3.2GHZ) FSB 1.6GHZ



알수 있듯이 마찬가지로 대역폭이 크게 인코딩작업에서 중요함을 알 수 있다



D.대역폭이 왜 중요하나 하면 워크스테이션/서버컴퓨터/작업용 고급형 컴퓨터에서

코어 갯수가 4개-->8개-->12개-->....로

늘어날수록 AMD 페넘 9850BE 프로세서와 인텔 요크필드 QX9770(3.2GHZ)간에 시간격차는 엄청나게 더욱 크게 벌어지게 된다



왜냐하면 상하 대역폭이 적은 인텔 요크필드 QX9770(3.2GHZ) 같은 경우 요크필드를

메인보드에 8개를 박아 넣어서 32(4코어*8개=32개코어)개의 CPU코어를 만든다고 하더라도 상하 대역폭의 문제로 인하여 원활히 데이타를 처리하지 못하고 엄청난 병목현상이 예상되기 때문이다



코어 갯수가 늘어날수록 처리 되는 데이타 양은 수백 퍼센트씩 증가하는데


인텔 요크필드 아키텍처로는 그 엄청난 데이타 양을 소화할 능력이 없기 때문에


전체적인 시스템 속도가 느려지는 것은 분명한 것이다



E.


반대로 AMD 페넘 9850BE(OC 3.2GHZ)같은 경우 네이티브 쿼드프로세서에


L3캐시를 내장하고 4.0GHZ이상의 엄청난 FSB대역폭을 가져서 페넘 프로세서


8개를 메인보드에 박아넣어서 32(4코어*8개=32개코어)개의 CPU코어를 만든다면


인텔 요크필드 QX9770(3.2GHZ)보다도 넓은 대역폭으로 인한 빠른 멀티코어 프로세싱이


가능한것은 분명한것이다




 
사용자 삽입 이미지


사이언스 마크 2.0



사이언스 마크같은 경우 과학적 분석/작업/시스템 모델링/수학적인 계산/분자 모델링

/분자 동역학/세포 모델링 등 다양한 과학적 작업에서의 성능 평가를 하여


FPU성능 및 ALU성능/메모리 대역폭/다양한 과학적 작업/암호해독작업등 에서의 종합적인 성능을 측정하는 프로그램입니다



AMD 페넘 9850BE(OC 3.2GHZ) 2164점을 얻어 가장 높은 종합점수를

기록하였습니다



그다음으로 인텔 요크필드 QX9770(3.2GHZ) 2047점을 얻어 2위를

차지하였고 인텔 울프데일 E8500(3.16GHZ)같은 경우 1876점을 얻어

마지막 순위를 기록하였습니다





분석



A.AMD 페넘 9850BE(OC 3.2GHZ)같은 경우 쿼드코어를 제대로 평가해 내지 못하는

사이언스 마크 2.0에서도 가장 높게 점수가 나온 원인은


FPU의성능+시스템 대역폭+메모리 액세스 시간+L3캐쉬 내장+메모리의 대역폭

등 다양한 시스템의 발란스적인 요소에서 1위를 차지한 것이다


B.반대로 인텔 울프데일 E8500(3.16GHZ) 같은 경우 1876점으로 크게 점수가 쳐지는

원인으로는 사이언스 마크가 주로 듀얼코어 작업을 테스트하지만

특정 테스트에서는 3개 이상의 쓰레드를 동시에 처리하는 작업에서 점수가 떨어진 것이 주

된 원인으로 작용하였다



C.

사이언스 마크2.0같은 경우 듀얼코어기반 성능 평가 시스템이라 완벽하게

쿼드 코어CPU를 분석해 내지는 못하나 전체적인 컴퓨터의 밸런스를

평가하는데 중요한 테스트 프로그램이다





 
사용자 삽입 이미지

사용자 삽입 이미지


사용자 삽입 이미지




위에서는 사이언스 마크2.0으로


대략의 과학적 분석/작업/시스템 모델링/수학적인 계산/분자 모델링

/분자 동역학/세포 모델링/3D 작업 모델링 에서의 작업 속도를 대략 가늠해 보았습니다


그렇다면 실제 예전부터 슈퍼컴퓨터로 많이 작업해온 분자 동역학/분자 모델링에서의

속도는 어떻게 되는지 실제로 측정해 보기로 했습니다



예전에 필자가 인텔 펜티엄3로 분자 모델링을 시켜놓았습니다


그다음날 컴퓨터를 확인해보니 중간에 과부하로 컴퓨터가 멈춘것 같아 당황한 적이 있었습니다

컴퓨터가 다운된지(멈춘지) 알고 컴퓨터를 다시 껏다 켤려고 하였죠

그런데 자세히 보니 컴퓨터가 멈춘게 아니고 미세하게 분자를 모델링하고 있었던 것이었습니다


직접 분자 모델링과 분자 동역학을 해보니 왜 슈퍼컴퓨터가 필요하진 알겠더군요

실제로 작업시 대(大) 분자 같은 경우 1개의 모델링이나 분자동역학을 하는데로 몇백시간이 넘게 걸리는 분자도 있습니다



이런 분자 100개만 렌더링이나 분자모델링 혹은 분자 동역학을 해본다고 생각해 보세요

일반 컴퓨터로 작업하면 거대한 분자 100개만 작업하는데도 적게는 수십일에서 수백일이 넘게도 걸릴수 있습니다



작은 분자인 테스트 1번 작업같은 경우 인텔 요크필드 QX9770(3.2GHZ)이 37초가 걸려 가

장빨리 작업을 마칩니다



그리고 AMD 페넘 9850BE(OC 3.2GHZ)이 38초가 걸려 그다음을 잇고 인텔 울프데일

E8500(3.16GHZ) 는 51초를 마크합니다



그러나 분자가 커지고 작업이 더 어려운 테스트 2번 작업같은 경우 상황은 반전하여 뒤 바뀝니다

AMD 페넘 9850BE(OC 3.2GHZ) 2시간 48분 24초이 걸려 가장 빨리 작업을 끝마쳤고

인텔 요크필드 QX9770(3.2GHZ)이 3시간 17분 45초가 걸려 그뒤를 이었고

인텔 울프데일 E8500(3.16GHZ)같은 경우 5시간 35분 38초가 걸려 가장 늦게 작업을

마치었습니다



이번에는 분자가 훨씬 더 거대해지고 작업이 훨씬 어려운 테스트 3번작업을 실시합니다

AMD 페넘 9850BE(OC 3.2GHZ) 12시간 38분 03초이 걸려 가장 빨리 작업을 끝마쳤고

인텔 요크필드 QX9770(3.2GHZ)이 14시간 29분 35초가 걸려 그뒤를 이었고

인텔 울프데일 E8500(3.16GHZ)같은 경우 23시간 16분 27초가 걸려 가장 크게 늦게 작업을 마치었습니다



참고


분자동역학 간단 설명


molecular dynamics (MD) is a form of computer simulation

where in atoms and molecules are allowed to interact for a period of time

under known laws of physics, giving a view of the motion of the atoms.



분석



A.실제로 사이언스 마크 2.0의 점수가 반영이 되지만 실제 분자 모델링이나

분자 동역학 작업시 코어 개수에 따라서 실제 작업에서는

더욱 CPU간에 성능 차이가 매우 크게 벌어지는 것을 확인할수 있다




B.테스트 1번 그래프의 작은 분자 같은 경우 인텔 요크필드 QX9770(3.2GHZ)가 37초로 빠르게 작업을 마치고


AMD 페넘 9850BE(OC 3.2GHZ)가 38초가 걸려 2위

인텔 울프데일 E8500(3.16GHZ)가 51초를 걸려 3위를 마크한다

이것은 작은 분자 같은 경우 데이타 전송량이 크지 않으므로

FSB 대역폭이나 캐쉬의 양/효율 그리고 램과의 전송속도에 크게 영향을 받지 않는것을 알수 있다


오히려 코어의 갯수나 FPU/ALU의 성능 및 CPU의 클럭의 속도에 의존적임을 도표를 통해 알수 있다




C. 분자가 커지고 작업이 더 어려워진 테스트 2번 작업같은 경우

AMD 페넘 9850BE(OC 3.2GHZ)가 인텔 요크필드 QX9770(3.2GHZ)에 비해

거의 30분정도 작업 속도가 빠른것을 확인할수 있다



1.HTT(하이퍼 트랜스포트)의 광활한 대역폭

2.메모리 컨트롤러를 내장하여 RAM과의 상호 작용 속도의 증가

3.CPU간에 L3캐시로 연결되어 4개의 CPU가 유기적으로 작업이 가능



이러한 원인에 인하여 복잡한 작업/힘들고 어려운 작업으로 갈수록 AMD의

슈퍼 컴퓨터 디자인 프로세서의 엄청난 힘이 빛을 발하는 것이다



D.테스트 2번 그래프에서 보듯이 AMD 페넘 9850BE(OC 3.2GHZ)가 인텔 요크필드 QX9770(3.2GHZ)에 비하여

인텔 울프데일 E8500(3.16GHZ)같은 경우 2시간 이상 크게 속도가 쳐지는 결과를 볼 수 있다



E.분자가 더 거대해지고 작업이 훨씬 어려운 테스트 3번 작업같은 경우

AMD 페넘 9850BE(OC 3.2GHZ)가 인텔 요크필드 QX9770(3.2GHZ)에 비해 거의 2시간 가까이 작업 속도가 빠르다

이것은 인텔 요크필드 QX9770(3.2GHZ) 프로세서에서 L2 캐쉬가 어느정도 버퍼역활을 해주지만 FSB 1600MHZ(1.6GHZ)로 대역폭이 작아서 엄청난 병목현상이 생긴것을 의미한다


또한 인텔 쿼드 프로세서가 2개의 듀얼코어 프로세서를 이어붙인 급조한 쿼드프로세서라

CPU간에 상호 긴밀하게 협동작업을 제대로 못 해냈음을 3번 테스트 그래프는 증명한다



F.테스트 3번 그래프에서 보듯이 AMD 페넘 9850BE(OC 3.2GHZ)가 인텔 울프데일 E8500(3.16GHZ)보다 10시간 정도 엄청나게 빠르게 작업을 빨리 끝냄을 도표에서 확인 할 수 있다



G. AMD 페넘 9850BE(OC 3.2GHZ) VS 인텔 요크필드 QX9770(3.2GHZ)

작업이 더욱 거대해지고 작업량이 무거워질수록 두 cpu간의 작업 시간차이가 엄청나게 커진다



바로 인텔이 폄하하던

가. 네이티브 쿼드 프로세서

나. 공유 L3캐쉬

다. 메모리 다이렉트 아키텍처

라. 4.0GHZ이상의 FSB광대역폭

이러한 요소가 복잡하고 어렵고 힘든 과학적 작업에서 얼마나 중요한지 위에 그래프는 반증한다



H.인텔 울프데일 E8500(3.16GHZ)같은 경우 가벼운 작업에서는 제성능을

발휘하나 무겁고 어렵고 힘든 멀티코어 프로세싱 작업으로 갈수록 그 성능이 크게 뒤쳐지는 것을 그래프에서 확인 할 수 있다




 
사용자 삽입 이미지


언리얼 토너먼트 2004

지금으로부터 4년전 2004년쯤에 출시된 약간은 오래된 게임인 언리얼 토너먼트 2004입니다


오래전에 나온 게임치고는 듀얼코어 CPU를 지원하는 게임중에 하나입니다

언리얼2004 게임을 테스트에 집어 넣은 이유는 구형게임과 최신형 게임에서 듀얼코어와 쿼드코어CPU가 어떻게 작용하는지 그변화 추이를 보기 위해서 테스트 자료에 집어 넣었습니다



가장 빠른 프레임은 인텔 요크필드 QX9770(3.2GHZ)이 92.47프레임을 기록하였고

인텔 울프데일 E8500(3.16GHZ)이 91.68프레임을 기록하여 근소하게 뒤쳐졌습니다

AMD 페넘 9850BE(OC 3.2GHZ)같은 경우 80.75프레임을 기록하여 10프레임정도 프레임이 뒤쳐지는 결과를 보였습니다



분석

A.언리얼 토너먼트 같은 경우 4년전 출시한 구형 게임으로 쿼드코어를 제대로

지원하지 못함을 도표에서 확인 할 수 잇다

B.인텔 요크필드 QX9770(3.2GHZ)L2캐쉬 12MB/FSB 1.60GHZ

인텔 울프데일 E8500(3.16GHZ) L2캐쉬 6MB /FSB 1.33GHZ

에서 보듯이 4년전 출시한 구형 게임 같은 경우 초당 처리하는 데이타 량이 많지 않은 경우 대역폭이나 캐쉬의 양이 작아도 속도에 적게 영향을 받음을 그래프에서 확인 할

수 있다

C.구형 게임 같은 경우 CPU의 코어 갯수나 FSB의 대역폭/ 캐쉬의 양이나 효율

/메모리 대역폭/IO입출력 단자 속도 보다는 CPU의 IPC/클럭속도 및 FPU/ALU성능에

더 의존적임을 그래프에서 알수 있다



사용자 삽입 이미지
사용자 삽입 이미지
사용자 삽입 이미지


최신형 고사양 게임중에 하나인 로스트 플래닛입니다

SNOW맵과 CAVE맵에서는 최상의 설정조건(EXTREME CONDITION)에서 테스트를 진행하였고

EXTREME CONTION에서 약간 더 해상도를 높이고 화질을 높여서 해상도 1280*960을 주고 게임 테스트를 진행하였습니다

테스트에서 중점을 둔것은 테스트 화질 옵션이 올라가고 해상도가 올라갈수록 CPU의 능력에 따라 게임 속도가 어떻게 변화하는지 그과정에 포인트를 맞추었습니다



분석


A.SNOW 맵같이 가벼운 이미지를 처리해야 하는 경우


AMD 페넘 9850BE(OC 3.2GHZ)/인텔 요크필드 QX9770(3.2GHZ)


인텔 울프데일 E8500(3.16GHZ) 3가지 CPU 모두에서 쿼드코어 CPU나 듀얼코어 CPU나


거의 게임 속도 차이가 나지 않는 것을 확인할수 있다



B.그러나 CAVE맵같이 처리해야 하는 이미지가 고해상도로 올라가고 시스템에


부하가 많이 걸릴수록 쿼드코어와 듀얼 코어 CPU간의 게임 속도 차이가 엄청나게

벌어진다


쿼드코어 CPU를 제대로 지원하는 LOST PLANET 게임 같은 경우


AMD 페넘 9850BE(OC 3.2GHZ)이 94.3프레임을 마크해서 가장 빠른 속도를 보였고


인텔 요크필드 QX9770(3.2GHZ)이 92.5프레임을 마크 그리고 인텔 울프데일 E8500(3.16GHZ)이 57.2프레임을 마크해서 크게 뒤쳐지는 성능을 보이고 있다



C.특히 눈에 띄는 점은 광학처리증가/OBJECT의 세밀함/연산 이미지 갯수의 증가가

 

폭발적으로 늘어날수록


듀얼코어인 인텔 울프데일 E8500같은 경우  


90프레임에서 근처(SNOW맵)-->57프레임(CAVE맵)로 성능이 대폭 떨어지는 현상을 알 수 있다



D.

앞으로 갈수록 쿼드코어이상을 지원하는 최신형 게임이 계속 늘어나는 것을 감안할때

인텔 듀얼코어 울프데일8500의 현재 30만원이 넘는 가격은 조금 생각해 볼 문제이기도 하다



E.이번에는 로스트 플래닛을 1280*960(NO AA)에서 측정을 하였다


해상도를 더욱 높이고 퀄리티 옵션을 더주니 눈에 확띄는 점은 쿼드코어 CPU는

 

그대로 게임 속도를 유지하는 반면


듀얼 코어인 인텔 울프데일 E8500(3.16GHZ) 같은 경우


57.2프레임--> 35프레임으로 20프레임이상 게임 속도가 추가적으로 크게 떨어지는 것을


확인 할 수 있다



가장 빠른 CPU는 AMD 페넘 9850BE(OC 3.2GHZ)이 93프레임을 마크해서 가장 빨랐고



그다음으로 인텔 요크필드 QX9770(3.2GHZ)이 91프레임을 이었다




듀얼코어인 인텔 울프데일 E8500(3.16GHZ)같은 경우 고해상도로 올라가자

AMD 페넘 9850BE(OC 3.2GHZ)/인텔 요크필드 QX9770(3.2GHZ)에 비해서

절반의 속도로 못내는 35프레임을 마크하였다




 
사용자 삽입 이미지
사용자 삽입 이미지

COMPANY OF HEROES


컴퍼니 오브 히어로즈에서는 다이렉트X 9 --> 다이렉트X 10 그리고

해상도가 올라가고 옵션이 증가할수록 CPU 처리속도가 어떻게 게임속도에 작용하는지를

측정하였습니다




DIRECTX 9.0C를 적용하고 1440*900(옵션:중간 화질)을 적용했을때는


인텔 요크필드 QX9770(3.2GHZ)가 169프레임을 마크하여 가장 빠르고


그뒤를 AMD 페넘 9850BE(OC 3.2GHZ)이 153프레임 마크 인텔 울프데일


E8500(3.16GHZ)149프레임을 마크하고 있습니다


반대로 DIRECTX 10을 적용하고 1680*1050(옵션:고급 화질)을 적용했을때는


AMD 페넘 9850BE(OC 3.2GHZ)이 41프레임을 마크하여 가장 빠르고

인텔 요크필드 QX9770(3.2GHZ)가 38프레임을 마크하여 그뒤를 잇고

인텔 울프데일 E8500(3.16GHZ)이 가장 낮은 36프레임의 속도를 가집니다



분석


A.DIRECTX10 같은 경우 DIRECTX 9가 지원하지 못하는 광원효과나 REAL이미지효과


OBJECT의 세밀함  그리고 게임에서 실제같은 픽셀효과나 쉐이더효과/벡터 연산등 복잡한


효과를 CPU+그래픽카드(GPU)가 같이 협동적으로 처리해 내야 하는 더 어렵고 복잡한 연


산 작업을 해야 한다



B.

이런 DIRECTX10에서는 고화질로 갈수록 게임에 가중되는 데이타 처리량은 급속도로


늘어나게 되는데 쿼드코어를 지원하지 않은 게임에서도 AMD 페넘 9850BE(OC 3.2GHZ)이


가장 빠른것은 처리한 데이타를 효율적으로 전송하는 HTT 하이퍼 트랜스 포트 기술과


메모리 다이렉트 아키텍처에서 기인하는 바가 크다


데이타 량이 비약적으로 증가할수록 데이타의 전송도로의 폭이 왜 중요한지는 위에 그래프는 증명하고 있다


C.

반대로 DIRECTX9같이 DIRECTX10에 비해 광학 처리나 실제 이미지 효과가 적고 물체의 세밀함이 떨어지는 경우 순간 데이타 전송량이 작아서 데이타 전송폭이나 캐쉬의 양보다는 CPU의 클럭이나 ALU/FPU성능 및 클럭당 IPC 성능에 더욱 의존적이게 된다



D.

결론적으로 DIRECTX 9 같이 이미지 데이타/벡터 연산/광학처리/쉐이더 효과/픽셀효과 가 적은 경우에는

데이타량이 적은 경우 에는 CPU의 클럭속도나 FPU/ALU성능등에 의존적이다


그러나 복잡하고 어렵고 힘든 작업인 DIRECTX 10으로 갈수록 데이타 처리량이 엄청 빠른 AMD 페넘 프로세서가 게임 속도가 빠르게 나오게 되는 것이다





 
사용자 삽입 이미지
사용자 삽입 이미지

BIOSHOCK



다이렉트X10을 지원하는 바이오쇼크에서의 프레임 측정입니다


AMD 페넘 9850BE(기본클럭 2.5GHZ)에서 64,2프레임을 마크하여 오히려 가장 가격이 비싼 인텔 쿼드 요크필드 QX9770(3.2GHZ)의 63.7프레임 보다도 게임 속도가 더 빠르게 나옵니다

AMD 페넘 9850BE(OC 3.2GHZ)에서 68.9프레임을 마크하여 가장 빠른 속도를 보여줬고

2번째로 인텔 쿼드 요크필드 QX9770(3.2GHZ)가 63.7프레임 마크

마지막 CPU로 인텔 울프데일 E8500(3.16GHZ) 62.5프레임을 기록하였습니다



분석



AMD 페넘 9850BE(OC 3.2GHZ) FSB 4.0GHZ

인텔 요크필드 QX9770(3.2GHZ) FSB 1.6GHZ

인텔 울프데일 E8500(3.16GHZ) FSB 1.33GHZ



A.


CPU코어 속도가 그 게임에서 처리할수 있는 데이타 량의 거의

임계점에 다다르면 결국 처리는 FSB통로를 통하여 더 빨리


CPU+램+그래픽 카드 간에 상호 협동하여

정보를 처리하는 CPU가 게임 속도가 더 나온다는 결론에 이르게 된다




즉 HTT 하이퍼 트랜스 포트와 다이렉트 메모리 아키텍처 그리고

광대역폭을 가진 AMD 페넘이 훨씬 더 속도가 나오게 되는 것은 당연한 이치인것이다



B.최신형 게임을 지원하는 DIRECTX 10 같은 경우

CPU클럭 속도/FSB 대역폭/캐쉬 메모리의 양/효율 메모리 대역폭등 종합적인

퍼포먼스 능력이 게임 속도를 결정 짓는것을 도표에서 알수 있다



다이렉트 X 10같은 경우 초당 처리해야하는 광학 이미지나 좌표/벡터 그리고 사물의

움직임등 계산해야 하는 정보량이 폭발적으로 늘어남에 따라 CPU의 클럭속도나

IPC만이 중요한것이 아니라 실제 게임 체감속도나 게임 실제 속도에서 보듯이

FSB대역폭이나 HTT대역폭이 상당히 중요한 요소로 떠오른다



L2캐시나 L3캐시 같은 경우 내장할수록 어느정도 대역폭이 작은 것을 상쇄시켜주는

버퍼의 효과는 있지만 내장할수 있는 캐쉬의 양이 한정적이라는 점에서


결국은 버스대역폭(FSB)을 광활하게 넓히는 것이 DIRECT10같은 복잡하고

어려운 작업에서 더 효과적이라는 것을 그래프는 증명해준다



이것은 슈퍼컴퓨터 디자인 프로세서 CPU인 페넘의 진화된 아키텍처가 얼마나 효율적이고

복잡하고 어려운 작업에 효율적인지 그래프는 증명해 주고 있다



 
사용자 삽입 이미지
사용자 삽입 이미지

슈프림 커맨더



슈프림 커맨더 테스에서의 중점은 저해상도 기본화질에서 고해상도 고화질로

 

갈수록 CPU의 아키텍처가 게임속도에 어떤 영향을 미치는지를 테스트 하는데


중점을 두었습니다



SUPREME COMMANDER 의 1024*768해상도(옵션:기본화질)에서는

 

인텔 요크필드 QX9770(3.2GHZ) 초당 평균 55.17프레임을 마크하여 가장 빠르고


그뒤를 AMD 페넘 9850BE(OC 3.2GHZ) 52.43프레임을 기록하였고


골찌로 인텔 울프데일 E8500(3.16GHZ)이 44.58프레임을 마크하였습니다


그러나 SUPREME COMMANDER의 고해상도인 1680*1050(옵션:고화질)로 가자 상황은 급변합니다



AMD 페넘 9850BE(OC 3.2GHZ)이 초당 평균 38.23 프레임을 마크하여 1위를 탈환하고

인텔 요크필드 QX9770(3.2GHZ)는 34.35프레임을 마크하여 2위로 주저 앉습니다

마지막으로 인텔 울프데일 E8500(3.16GHZ)는 여전히 골찌인 29.64프레임를 찍어 줍니다




분석


A.슈프림 커맨더는 쿼드코어 프로세서를 어느정도 지원하는 것을 도표에서 알수있다



B. 1024*768해상도(옵션:기본화질)의 저해상도에서는 인텔 요크필드 QX9770(3.2GHZ)가

가장 속도가 좋았지만 고해상도인 1680*1050(옵션:고화질)로 갈수록 상황은 반전하여

AMD 페넘 9850BE(OC 3.2GHZ)프로세서가 속도가 더 빠르게 나온다



C.이것은 인텔 요크필드 QX9770(3.2GHZ)의 콘로 아키텍처의 한계를 드러내는 대목이다

인텔의 2009년형 CPU에서 페넘의 아키텍처를 중국처럼 대놓고 베끼는 것도 알고보면


결국은 인텔 콘로 아키텍처로는 고해상도 이미지나 고난이도 작업으로 갈수록 한계적인

 

벽에 부딪힐 수 밖에 없다는 것을 인텔도 분명히 알고 있는 것이다



D.결국 인텔은 과거의 펜티엄4의 넷버스트 아키텍처의 실패를 거울삼아 이제는

상대편 회사의 CPU 구조가 옳다면 그것을 적극 수용하는 자세가 분명하게 보이는 것이다

인텔로써는 다시 굴욕적인 역사를 다시 반복하고 싶지 않다는 의지가 2009년 인텔의

CPU에서 엿보이는 대목이다



E .앞으로 차세대 게임에서 8코어/16코어를 지원하는 게임이라면 페넘프로세서 2개(8코어)를 붙인것하고 인텔 콘로 4개(8코어)를 붙인 두 CPU를 비교하여


고해상도에서 게임을 테스트한다면


결국 인텔의 CPU는 FSB의 1.6GHZ정도의 한계로 인하여 고해상도 게임에서 성능 격차는

폭발적으로 두 CPU간에 더 벌어질수 밖에 없음을 알수 있다



사용자 삽입 이미지

FEAR



고사양 게임중에 하나로 유명한 F.E.A.R 입니다


AMD 페넘 9850BE(OC 3.2GHZ)이 128.4프레임을 기록하여 1위를 차지하였고

인텔 요크필드 QX9770(3.2GHZ)가 그뒤를 이어 112.3프레임을 기록하여 2위

인텔 울프데일 E8500(3.16GHZ)이 96프레임을 기록하여 마지막을 기록하였습니다



분석


A. F.E.A.R 같은 경우 쿼드 코어 프로세서를 지원하는 것을 그래프에서 확인할수 있다



B.가짜 쿼드코어 프로세서인 인텔 요크필드 QX9770(3.2GHZ)같은 경우 CPU코어 간에

긴밀히 협동작업을 못하여 AMD 페넘 프로세서보다는 게임 프레임 속도가 떨어지는 것

확인 할수 있다


C.AMD 페넘 9850BE(OC 3.2GHZ) 같은 경우 HTT광대역폭과 다이렉트 메모리 아키텍처

그리고 L3캐쉬 공유로 인한 CPU간의 긴밀한 협동작업으로 네이티브 쿼드 코어 프로세서의 장점을 유감없이 발휘하고 있다



D.인텔 울프데일 E8500(3.16GHZ) 같은 경우 쿼드 코어 CPU를 지원하는 게임에서는 로스트 플래닛과 마찬가지로 게임 속도가 떨어짐을 그래프에서 확인 할수 있다


E. 쿼드 코어 지원 게임 같은 경우 CPU의 클럭이나 FPU성능에도 의존적이나

데이타 용량이 증가할수록 HTT대역폭이나 FSB대역폭에 민감함을 게임에서 분명하게

알 수 있다



결론



차세대 플랫폼에서 코어 갯수가 점점 늘어나게 된다면 현재의 인텔 콘로 아키텍처는

CPU 2개를 이어 붙인 급조된 쿼드프로세서


FSB 속도와 대역폭의 제한

메모리 대역폭의 한계

L1/L2/L3캐쉬 접근속도의 저하

메모리와 CPU간의 통신의 제한

CPU 2개를 이어 붙인 급조된 쿼드프로세서



등으로 막다른 길에 놓이게 되는 것이다



인텔 콘로 아키텍처는 코어갯수가 적은 구형플랫폼에서는 적당하지만 결국은 CPU코어 갯수가 계속 늘어날수록 급격한 데이타 정체 현상을 보여 미래의 플랫폼에서는 적당하지 않다



앞으로 어플리케이션/응용프로그램/유틸리티/렌더링 프로그램/인코딩 프로그램/

 

컴퓨터 게임/3D 모델링/분자 동역학/분자 모델링 등 점점 멀티 코어 CPU 지원 프로그램이

 

늘어나고 CPU멀티 코어 알고리즘을 제대로 지원하는 프로그램이 나올수록 AMD K10 페넘

 

아키텍처가 점점 속도가 빨라지는 것은 당연한 것이다



CPU가 하루 이틀 쓰고 버리는 물건이 아니라면 시간이 지날수록 최신형 프로그램/ 최신형 게임에서 점점 빨라지고 64비트 윈도우 비스타에 최적화 되어 있는 AMD 페넘의 선택은 당연한 것이 아닌가?


고급형 CPU를 선택하는것은 저가형 CPU가 지니지 못하는 능력을 쓰기 위함이다


쿼드코어 CPU를 쓰는것은 복잡하고 어렵고 힘들고 난이도가 높고 순간적으로

 

부하가 많이 걸리는 작업을 위한 것이다


위에 수많은 그래프들은 AMD 페넘같은 경우


게임에서는 고해상도 및 HIGH QUALITY 옵션으로 갈수록 게임 속도가

빨라졌으며 저사양 작업이 아닌 어렵고 힘들고 복잡한 응용작업으로 갈수록 속도가 꾸준하게 높아지는 것을 확인할수 있다


K10 아키텍처는 쉽고 간단한 작업을 위한 CPU가 아니다

광대하고 방활한 작업 그리고 초고화질 다이렉트X 10을 위한 최고의

CPU가 AMD페넘인것이다


AMD페넘 CPU의 구조는 성공한 CPU인가? 묻는다면 답은 간단하다


 
사용자 삽입 이미지
사용자 삽입 이미지


위에 보다시피 2007년형 쿼드코어 AMD CPU의 기본구조와 2009년형 인텔의 차기 CPU의 기본구조는 완전히 똑같다




즉 AMD 페넘의 구조 자체가 차세대 CPU를 이끈다는 뜻인것이다


차세대 CPU의 구조가 이렇게 변한다면 결국에 차후에 나오는 최신형 게임이나

최신형 응용프로그램 같은 경우도 차세대 CPU에 맞추어서 구조에 맞추어서 변하는 것도 같은 이치이다



인텔의 2009년에 나오는 CPU가 완전 AMD 페넘의 구조가 완전 똑같다는 점을

상기한다면



AMD 페넘 프로세서의 구조는 성공작이라고 평가할수 있다


AMD 페넘 9850 시리즈는 쿼드 프로세서가 아니다

 

AMD 페넘 프로세서는 슈퍼컴퓨터 디자인 프로세서인것이다

 

 

바로 K10 아키텍처는 세계 최초로 서버컴퓨터나 워크스테이션에나 있는 슈퍼컴퓨터 디자인 CPU를 데스크탑 슈퍼컴퓨터 CPU로 전환한 아키텍처라는데 의의가 있다



위에 도표에서 보다시피 구세대 인텔 콘로 아키텍처는 CPU코어가 2개인 경우 같은 경우

어느 정도 성능을 내주지만 코어갯수가 4개-->8개-->12개-->16개-->...-->128개-->..

이렇게 코어 갯수가 폭발적으로 늘어날수록 콘로 아키텍처는 분명하게 현재의 대역폭

문제인 FSB 1.6GHZ에 의하여 막다른 벽에 놓이게 된다는 것이다




코어갯수가 늘어날수록 초당 순간적으로 처리하는 정보 DATA량은 폭발적으로 수백%씩 곱절로 늘어나는데 그 엄청난 정보량을 대역폭 1.6GHZ로 처리한다는 것은 코미디인것이다



캐쉬늘 박아넣는 양이 결국은 기술상 한정되어 있다면 캐쉬를 늘리면서도

FSB대역폭을 광대역으로 확장하는 것이 결국 멀티코어 CPU가 가야하는 길인것이다



이러한 점에서 AMD의 페넘 K10 아키텍처는 CPU가 가야할 미래 지향적인

관점을 제시했다는 점에서 또한 세계최초로 슈퍼 컴퓨터 아키텍처를 데스크탑 CPU로 전환했다는 점에서 분명한 역사적의의를 갖는 것이다


================================= 출처 : 다나와 커뮤니티


CPU끼리 이렇게까지 자세하게 비교가 되어있는 글은 정말 처음봤습니다..ㅋㅋ
너무나도 비교가 명확하고 알기쉽게 되어있어서 나중에도 보려고 퍼왔습니다..ㅋ
음... 퍼온게 문제가 된다면 바로 삭제하겠습니다.