윈디하나의 누리사랑방. 이런 저런 얘기

글쓴시간
분류 기술,IT
GDDR SGRAM, VRAM

※ 일반적인 메모리도 비디오용 메모리로 사용할 수 있지만 성능을 위해 좀 더 다른 메모리를 사용한다. 그래픽용 메모리는 프레임 버퍼로 사용되는데, 프레임버퍼는 일정한 주기로 데이터를 읽어 모니터로 전송해야 한다. 메모리는 읽고 쓰는 작업을 동시에 할 수 없기 때문에 주기적으로 읽어야 하는 그래픽용 메모리는 메모리 쓰기 작업에 사용될 대역폭이 적어진다. 이런 문제를 해결하기 위해 개발한게 그래픽용 메모리다. 읽기와 쓰기 각 한개의 컨트롤러를 가지고 있는 기존 메모리와 달리 읽을 수 있는 컨트롤러를 하나 더 가지고 있다.

※ VRAM: Video RAM. 1985년 IBM 에서 개발했다. DRAM 은 구조상 읽기와 쓰기를 동시에 실행할 수 없다. RAM 안의 정보를 초당 60번씩 읽어 DAC에 전달해 출력할 화면을 만드는 기기인 VGA에서는, 이 때문에 성능 저하가 일어났다. 그래서 읽기/쓰기를 위한 라인과 별도로 읽기 전용인 DAC 라인을 만들어 DAC에서의 데이터 읽기로 인한 성능 저하를 없앤 제품이 VRAM이다. 상당히 고가였다. 2D용 VGA의 프레임버퍼용 메모리로 주로 사용되었다. 하지만 프레임 버퍼용 메모리는 DDR2 메모리만 되어도 충분한 대역폭이 나오기 때문에 VRAM은 오늘날에는 사용하지 않는다.

※ GDDR: GDDR SGRAM(Synchronous Graphics RAM) 은 SDRAM(Synchronous Dynamic RAM)의 일종이다. 메모리에 비트마스크를 두어 두 곳에 동시에 읽기/쓰기 접근이 가능하도록 하고, 블록 쓰기를 지원해 대용량의 데이터 처리에 적합하도록 변경했다. 읽기 쓰기가 빈번한 고성능 GPU에 주로 사용된다.

※ GDDR4, GDDR5는 DDR3 기반이며, GDDR2, GDDR3는 DDR2기반이다. GDDR2와 GDDR4는 두곳에서 동시에 쓰기에 접근하지 못한다. 읽기만 두곳에서 동시에 접근 가능하다.
글쓴시간
분류 기술,IT

파이어폭스(Fireofx) 4, 인터넷 익스플로러(Internet Explorer) 9

사용자 삽입 이미지

모질라 불여우 4

불여우 4가 나왔습니다. 요즘 가히 브라우저 전쟁이군요. 사용자들이야 좋겠습니다만, 개발사들은 거의 사활을 걸고 하는듯 합니다.

사용자 삽입 이미지

사파리 5

최근 브라우저의 주된 키워드는 'GPU 가속'입니다. 작년까지만 해도 '자바스크립트 가속'이었는데 이번엔 GPU를 사용해 좀 더 빨리 보여주겠다는 겁니다. 파이어폭스 4와 인터넷 익스플로러 9도 확실히 빨라졌네요. [크롬 10] 못지 않게 빨라졌습니다. 아직 제가 주로 사용하는 브라우저는 파이어폭스입니다.

사용자 삽입 이미지

구글 크롬 10

브라우저는 레이아웃 엔진(텍스트인 HTML 코드를 그래피컬 하게 보여주는 기능을 하는 컴포넌트)에 따라 분류할 수 있습니다. [트라이던트 엔진]을 사용하는 [인터넷 익스플로러], [겍코] 엔진을 사용하는 [파이어폭스], [웹킷] 엔진을 사용하는 [사파리]와 [크롬], [프레스토] 엔진을 사용하는 [오페라]가 그것입니다. 오페라만 제외하고는 그 뿌리는 넷스케이프에서 개발한 모질라 엔진이죠. 전세계에서 사용되는 브라우저의 종류는 100여가지가 넘습니다. 그야말로 브라우저의 홍수네요.

현재 세계에서 가장 빠른 브라우저는 오페라로 알고 있습니다.

사용자 삽입 이미지

오페라 11

글쓴시간
분류 기술,IT

CPU L1, L2, L3 캐시

※ 현대의 상용 CPU는 모두 여러 레벨의 캐시(Cache)를 두고 있다. CPU의 캐시는 CPU에 비해 상대적으로 많이 느린 메모리로부터 데이터를 미리 가져와 코어(CPU에서 연산 기능을 하는 전자 회로를 모아놓은 영역) 옆에 저장해 놓음으로써, 코어가 데이터 입/출력 속도를 빠르게 처리할 수 있도록 한다. 코어에 얼마나 가까우냐에 따라 L1, L2, L3캐시로 나눈다. L은 Level 의 약어다.

사용자 삽입 이미지

캐시의 기본 원리. 출처: 위키피디아 "CPU 캐시"

- L1 캐시: 코어에 가장 가까우며 데이터 입출력 속도가 가장 빠르다. 인스트럭션 캐시(Instruction Cache, 명령어를 캐시)와 데이터 캐시(Data Cache, 데이터를 캐시)로 나뉜다. SRAM(Static RAM)을 사용하며 용량당 제조비용이 매우 비싸다. 인텔의 샌디브릿지 CPU에서는 코어당 32kB 인스트럭션 캐시와 32kB 데이터 캐시가 있으며, 3 클럭 만에 데이터를 가져올 수 있다.

- L2 캐시: L1캐시보다는 코어에서 멀리 존재하지만 그래도 메모리보다는 매우 빠르다. 보통 DRAM으로 구성된다. 샌디브릿지에서는 코어당 256 kB가 있으며, 8 클럭 만에 데이터를 가져올 수 있다.

- L3 캐시: L2캐시보다도 코어에서 멀리 위치하지만 역시 메모리보다는 빠르다. L3캐시가 없는 CPU 도 많다. L2캐시보다 더 느린 DRAM으로 구성된다. 보통 멀티 코어 CPU에서 코어간 캐시 데이터를 공유하기 위해(정확하게는 캐시 일관성(Cache Coherency)을 쉽게 구현하기위해) 사용하며, 서버급 CPU에서는 64MB이상 달려있는 경우도 흔하다. 샌디브릿지 데스크탑 CPU에서는 CPU당 8MB까지(4개의 코어가 공유) 있으며, 25 클럭 만에 데이터를 가져올 수 있다.

- L4 캐시: L3캐시보다도 코어에서 멀리 위치하며, 일반적으로 캐패시터 기반 DRAM인 eRAM으로 구성된다. (L2, L3는 게이트 기반 DRAM) 사실상 메모리(메모리는 캐패시터 기반 DRAM이다)인 셈으로 메모리와 다른건 단지 CPU안에 집적되어있다는게 다를 뿐이다. (그래도 메모리보다는 빠르다) 보통 CPU당 128MB이상 사용하곤 한다.

- Trace 캐시: L1 인스트럭션 캐시의 특별한 형태. 명령어를 캐시하는게 아니라 '디코딩된 명령어'를 '저장'해 놓는다. 일부 서버급 CPU나 펜티엄 4에서 사용되었으며 오늘날에는 사용하지 않는다.

사용자 삽입 이미지

샌디브릿지의 다이 포토 및 설명

※ 익스클루시브(Exclusive) 캐시 와 인클루시브(Inclusive) 캐시

- 인클루시브 캐시: 캐시 안의 데이터는 메모리의 일부를 그대로 가져온다. 메모리의 값이 변하면 캐시 메모리의 값도 변해야 한다. 인텔에서 채택하고 있는 방식이다.

- 익스클루시브 캐시: 캐시는 메모리와 동일하게 작동한다. 좀 더 복잡하다. 이런 캐시를 가진 CPU의 L2 캐시 메모리가 16MB고, 시스템에 1024MB가 설치되어있다면, 사용할 수 있는 총 메모리는 1040MB가 된다. (하지만 설계상 사용할 수 있을 뿐, OS에서 사용하지는 않는다) AMD에서 채택하는 방식이다.

Wolfdale 과 SandyBridge 의 L2, L3 캐시 비교: http://windy.luru.net/1188

글쓴시간
분류 기술,IT
물건을 돌려준 뒤에 받을 수 있는 금액
유실물법 제4조 (보상금) 물건의 반환을 받는 자는 물건가액의 100분의 5 내지 100분의 20의 범위내에서 보상금을 습득자에게 지급하여야 한다. 다만, 국가·지방자치단체 기타 대통령령이 정하는 공공기관은 보상금을 청구할 수 없다.<개정 1995.1.5>
- 인터넷의 의견을 종합해 보면

- 유실물을 습득하면 습득자는 물건을 돌려줘야할 의무를 지닙니다. 쉽게 말해 경찰서에 신고하면 됩니다.

- 물건을 찾아 돌려주면, 반환 받은 자는 물건 금액의 5~20% 정도를 돌려줘야할 의무가 있습니다. 안 주면 1개월 내에 청구 가능합니다. 또한 보관에 비용이 들어간 경우 보관료까지 청구할 수 있습니다.

- 여기서 '물건 금액'이란 '물건의 매각 대금'입니다. 현금은 100% 인정되고 수표 같은 건 인정 안됩니다. (수표는 분실 신고하면 매각이 안되기 때문에)
글쓴시간
분류 기술,IT/하드웨어 정보
Core2 Duo E8400

벼르고 벼르던거 드디어 득템. 가격은 줄 만큼 줬음. 중고로 15만. ㄲㄲ. LGA775(Socket T)라 조만간 단종이다. 인텔 플랫폼에는 별로 투자할 생각이 없었는데, 그래도 6MB L2캐시(코어당 3MB)는 앞으로도 데스크탑용 CPU에서는 절대 안 나올 거라고 생각하기 때문에 기념비적으로 하나 가지고 있으려 한거다. 나중엔 쿼드코어나 한번 질러 볼까나. ㅎㅎ

기존에 사용하던 E6750보다는 확실히 빨라졌다. 그런데 OpenSSL 벤치 해보면, CPU 클럭향상(2.66GHz → 3.0GHz)만큼 성능향상되어있다. 하지만 멀티 쓰레드를 사용하는 어플에서 성능 향상이 크고, 대용량 데이터를 다룰때 (데이터 베이스 프로그램)에서 역시 생각대로 빠르다.

사용자 삽입 이미지

Core2 Duo 이미지 및 다이 포토. 하단의 갈색 부분이 L2캐시 부분으로 CPU전체의 절반정도다.

요즘 CPU 다이 포토(CPU Die Photo)를 보면 코어 보다 캐시 영역이 더 크다. 대용량 캐시로 인한 성능 향상보다 제조비용이 더 크기 때문에, CPU제조사에서는 코어당 2MB가 넘는 L2캐시를 가진 데스크탑 CPU를 만들기 힘들다. (기술적으로 만들기 어려운게 아니라 수지타산이 안 맞는다는 거다. L2캐시가 두배가 되면, 성능은 일부프로그램에서 두배이상 좋아지지만, 대부분의 프로그램에서는 성능 차이가 없다. 하지만 제조비용은 두배 가까이 들어가고, CPU의 발열은 더 심해진다)

사용자 삽입 이미지


사용자 삽입 이미지


사용자 삽입 이미지

사용자 삽입 이미지
사용자 삽입 이미지
사용자 삽입 이미지
사용자 삽입 이미지

사용자 삽입 이미지

벤치마크 점수는 아래와 같다.

사용자 삽입 이미지


현재 나오는 샌디브릿지 Core i7(쿼드 코어)은 L3 캐시가 코어당 2MB, L2캐시는 코어당 256KB 다. 단 L3캐시는 코어끼리 공유하기 때문에, 하나의 코어가 8MB를 다 사용할 수도 있다.

L2캐시와 L3캐시는 캐시 성능만 따지면 속도 차이가 매우 크다. (L2캐시가 훨씬 빠르다) 여기에 제조 비용까지 따지면 둘의 값어치는 더 벌어진다. 필자가 L3캐시 늘인 것을 보고, '원가절감'이라는 단어가 먼저 생각난 이유다. 하지만 코어가 많아질수록 캐시의 속도보다 코어간의 캐시공유가 더 중요해지고 L3 캐시는 상대적으로 대용량으로 만들기 쉽기 때문에, 이런추세는 앞으로도 계속될것 같다.