윈디하나의 누리사랑방. 이런 저런 얘기

글쓴시간
분류 기술,IT
nVidia GB200 NVL72

GB200 의 이야기는 많은데 구체적으로 어떤건지는 잘 몰라서 찾아봤습니다.

GB200 은 1개의 Grace CPU 와 2개의 Blackwell GPU 로 이루어진 일종의 보드입니다.

사용자 삽입 이미지

nVidia GB200


이걸 NVL 을 사용해 36개 연결해 총 72 개의 Blackwell GPU 을 내장한게 GB200 NVL72 입니다.

사용자 삽입 이미지

nVidia GB200 NVL72


스펙은 아래와 같습니다. FP16 이 360PFLOPS 라는게 인상깊네요. 여기에 그 유명한 HBM3e 가 들어갑니다. 하나 가지고는 싶습니다.

사용자 삽입 이미지

스펙에는 안 나와있지만 GB200 NVL72의 TDP 가 140kW 으로 알려져 있습니다. 보통의 1U 서버 1대의 소비전력이 1kW 정도이고 1Rack(24U) 를 모두 채운다고 해도 24kW 인데, 140kW 라면 소비 전력이 높긴 하네요. 그래도 이전 세대보드 전성비는 좋습니다.
글쓴시간
분류 기술,IT
Stable Diffusion - 단풍

많은 눈이 지나고 단풍이 왔네요. 왠지 지금이 가을 같다는 느낌입니다. 이제야 주변에 낙엽에 떨어지고 있네요.

오래전부터 단풍이 예쁠 때 올리려던 이미지 하나 올립니다.

사용자 삽입 이미지


글쓴시간
분류 기술,IT
Arctic P12 Max

사용자 삽입 이미지
최근에 구매한 고성능 팬이다.

작동전압/전류: 12V / 0.29A
최소전압: 3.9V
팬크기: 120mm
팬두께: 25T
베어링: Hydrodynamic Bearing
회전속도: 3300RPM
풍량: 81.04CFM
풍압: 4.35 mmH2O
팬소음: 27dBA (0.6sone)
기타: PWM, 제로팬(5%)
케이블길이: 400 mm
무게: 184g


꽤 오래전부터 Arctic 의 제품을 주로 써와서 망설임없이 구매했다. 어차피 팬 컨트롤러 달아서 사용하기 때문에 소음도 크게 문제 없고 말이다.

- 팬 베어링 구조
사용자 삽입 이미지

- 제로팬
사용자 삽입 이미지

- 바람이 분산되지 않는다.
사용자 삽입 이미지
글쓴시간
분류 기술,IT/스테이블 디퓨전
Stable Diffusion - 메텔

필자가 본 에니에서, 아름다운 여인을 이야기할 때 빼놓지 않는 캐릭터가 바로 메텔이다. 은하철도 999 라는 에니메이션에 나오는 그 메텔 맞다.

털모자 샤프카와 털 코트 슈바, 흩날리는 긴 금발, 갈색 눈동자, 어딘가 슬퍼보이는 얼굴이 프롬프트다.
사용자 삽입 이미지

내가 생성하는 이미지에서는 메텔의 영향을 받은게 꽤 있다. 프롬프트를 변경하다 보면 이런 분위기를 내도록 하는 경우도 있으니깐 말이다. 그만큼 인상 깊었고, 이런 분위기의 여성을 좋아하는 편이기도 하다.

은하철도999의 줄거리는 대체적으로 암울하다. 원래 메텔은 메텔에 의해 희생된 아이들을 위한 속죄를 상징하는 인물이니 그렇다. 그래서 다른 에니에서 밝은 모습으로 나왔으면 하는 바램이 있다. 그래서 한번 제작해 보았다.

- 약간 현대적으로 재 해석한 메텔. 가장 맘에 든다.
사용자 삽입 이미지

- 작은 가게에서 점원으로 일하고 있는 숏컷 메텔
사용자 삽입 이미지

사용자 삽입 이미지

- 군대에서의 지휘관같은 인상을 보이는 메텔
사용자 삽입 이미지

짧은 스커트도 어울린다.
사용자 삽입 이미지

사용자 삽입 이미지
글쓴시간
분류 기술,IT
구형 VGA 8400GS 팬 교체

2009년에 구매했던 nVidia GeForce 8400GS 의 팬이 고장나서 작동하지 않았다. 발열이 해소되질 않기 때문에 사용하지 않고 있었는데, 갑자기 필요하게 되어서 부랴부랴 팬을 교체했다.

사용자 삽입 이미지

COOLERTEC CTV-OB9-LP

중고가격 만원도 안할 VGA의 팬이라 가능한한 저렴한걸로 구매하려 했지만, 안되었다. 저렴해도 5천원 이상이다.

홀간격 55mm이고, LP 타입의 VGA에서 사용할 수 있는 쿨러로 구매했다. 결국 COOLERTEC CTV-OB9-LP 으로 구매. 결제하려고 보니 8000원에 가까운 금액이라 망설여지긴 했지만 그냥 결제했다.

장착은 잘 되었지만, 팬를 VGA 의 팬 핀에 연결해도 쿨러가 돌지 않았다. 아무래도 VGA 가 고장난듯. 그냥 마더보드의 3핀에 끼워 넣었다. 다행이도 잘 돌아간다.

팬 소음은 제법 있어서, 전압을 낮춰서 사용하고 있다. 열은 조금 있지만 그래도 조용하니 좋다. 쿨러 고를 때에는 팬이 없는 것도 고려해봤지만, 8400GS G98 의 25W 의 TDP 를 식힐 수 있는 방열판은 꽤 크기 때문에 LP 규격에 맞는게 없어서 그냥 팬 있는 걸로 골랐다.

----

2024.11.24

팬 전극이 뒤바꼈다. 테스트기로 VGA의 팬 전극을 체크해보니 -12V 으로 나온다. 팬의 +, - 를 바꿔끼면 되는건데 그냥 안하기로 했다.
글쓴시간
분류 기술,IT

nVidia 의 최신 GPU 블랙웰에서 발열 이슈?

nVidia 의 최신 GPU 제품인 블랙웰 제품에서, 발열 이슈가 있다고 합니다. 하지만 글쎄요, 어차피 발열은 예상 되어있는게 아닌가 하네요. TDP 가 1000 W가 넘는다고 하는데, 그정도면 서버에서는 크게 문제되지 않을 정도의 발열입니다. 물론 한개의 칩만 사용하는건 아니고, 서버 룸에 공조 시설과 냉방 시설이 잘 되어있어야 문제가 안되겠지만요. 1000 W 가 크긴 하지만 이게 이슈가 되었다는게 조금 이상하긴 하네요. 게다가 이미 알고 있던거 아니였나요. 그래서 IDC에도 수랭이라던가 유랭이라던가 도입한다고 했구요. 칩당 1000W 정도면 수랭 필요하다고 생각합니다.

사용자 삽입 이미지

Stable Diffusion 으로 작성한 Blackwell. 검은 우물?


처음 AI로 그림그리는걸 시작했을때, 하드웨어 업그레이드 이후에 신경써야 할건 발열입니다. RTX 2060 12G 의 184W TDP를, 당시 가지고 있던 저가형 케이스로는 제대로 냉각할 수가 없었죠. 부랴 부랴 케이스 부터 큰 걸로 바꾸고 팬 바꾸고, VGA 수직 장착하고, CPU 쿨러를 수랭으로 바꿨습니다. 그래서 지금은 해보진 않았지만 400W TDP 정도까진 버티지 않을까 생각되네요.

세대가 거듭될 데이터센터에서 사용하는 GPU 는 발열이 많아지긴 하지만, 전성비는 계속 좋아지고 있습니다. 지금 제가 사용하는 4060Ti 도 예전의 2060 의 2배 정도 성능이지만 발열은 183W -> 165W 으로 더 낮아졌으니까요. 이번 블랙웰도 더 좋아졌을것이라고 생각합니다. 5060 나올때가 되면 아마 바꾸겠죠.

글쓴시간
분류 기술,IT
듀얼 채널과 램 타이밍

사용자 삽입 이미지


꽤 오래전에 듀얼 채널에 대한 글을 쓴 적이있는데, 이에 대한 다른 글이다.

듀얼채널(Dual Channel)

기본적으로 PC에서는 메모리를 듀얼 채널로 구성해야 하는데, 이때 주의사항이 조금 있다. 메모리의 타이밍에 대한 문제다.

① 메모리의 스펙은 흔히 용량, 속도, 타이밍으로 나타낸다. "32GB DDR4-3200AA" 라는 스펙은

DDR4 메모리
1600MHz 으로 작동
램타이밍 22-22-22-52-74

의 의미다.

하지만 메모리 스펙을 저장하는 SPD 칩에는 굉장이 많은 파라메터가 있다. 전문적인 메모리 SPD 조회 프로그램에서 조회해보면 굉장히 많은 데이터가 나온다. SPD 는 512 바이트의 데이터를 가지고 있고, 코드화 되어있기 때문에 데이터가 상당히 많다.

사용자 삽입 이미지

라이젠 마스터에서의 DDR4 DRAM 타이밍 속성


SPD 의 데이터는 JEDEC 에서 구매할 수 있는 문서에서 볼 수 있다. Serial Presence Detect 로 검색하면 된다.

SPD 를 설명한 문서다. https://www.simmtester.com/News/PublicationArticle/184

말하고 싶은건 메모리 모듈의 특성을 나타내는 파라메터는 많다는거다. 스펙이 전부가 아니다.

② 같은 스펙을 가졌더라도 SPD 에 있는 다른 파라메터들은 다를 수 있다. 아니 다르다.

이 값이 같은 경우는 동일한 스펙으로 제조된 제품만 그렇다. 삼성, 하이닉스에서 제조하는 모듈로, 제품 번호가 같으면 같은 속성을 가진다.

③ 듀얼채널로 구성하기 위해 같은 스펙의 메모리 (DDR4-3200 CL23)를 두개 끼웠지만, 세부 속성이 다른 경우 전체적인 성능은 느린쪽을 따라간다. 타이밍이 딱 맞아야 동시에 데이터가 전달되기 때문에 2배 대역폭이라는 이점이 두드러진다.

따라서 듀얼채널은 같은 속성을 가진 메모리를 사용해야 성능상의 효과가 더 좋다.

- XMP 가 적용된 쌍으로 판매되는 메모리들은 이 속성이 같다. 반대로 쌍으로 나오지 않은 XMP 메모리는 섞어쓰면 속성이 다르기 때문에 타이밍이 미묘하게 차이난다.

- 이렇게 써놓으니 사용하지 말라는 거 같은데, 어떠한 경우도 싱글채널보다 듀얼채널이 더 좋다. 단지 이왕 듀얼채널로 구성할것이라면 메모리 스펙을 동일한걸 사용해야하고, 메모리 쌍으로 판매하는 제품을 구매해 사용하거나, 삼성/하이닉스의 표준 모듈 중 제품번호가 같은걸 사용하라는 의미다.
글쓴시간
분류 기술,IT/스테이블 디퓨전
Stable Diffusion - 웨딩 드레스 #3

체크포인트를 바꿨다. 오랜만에 머지를 다시 했는데, 괘 괜찮게 나왔다. 8월 초에 한번 바꾸고 근 3개월 만이다. 그동안 몇번 머지를 시도했지만 기존것 보다 안 좋다고 판단되어서 사용하지 않고 있었다. 다행이도 이번엔 기존것 보다 잘 나왔다.

슬슬 SDXL 이나 SD3, FLUX.1 등으로 바꾸긴 해야 한다고 생각하긴 하는데 아직 못 바꿨다. PC의 업그레이드는 마쳤고, 지금은 SDXL 정도는 무난하게 사용가능하긴 하지만 아직 맘에 드는 그림체가 아니라서 못 바꾸고 있다. 하지만 꾸준히 SDXL 이나 FLUX.1 으로는 생성하고 있다. 웬지 아래와 같은 그림체가 안나와서 맘에 안들 뿐이다. 이러다가 직접 LoRA 를 작성해야 하는게 아닌가 생각하기도 한다.

사용자 삽입 이미지


사용자 삽입 이미지

사용자 삽입 이미지

사용자 삽입 이미지

사용자 삽입 이미지

사용자 삽입 이미지

사용자 삽입 이미지

사용자 삽입 이미지
글쓴시간
분류 기술,IT/스테이블 디퓨전
Stable Diffusion - 할로윈

4060Ti 구매한 후에 한번 생성해 보았다. HiRES fix. 부분이나 4배 업스케일링 부분에서는 확실히 많은 성능 향상을 체감할 수 있다. 반대로 작은 이미지, 예를 들어 512 x 768 정도의 이미지 생성에는 그렇게 성능향상을 못 느낀다.

사용자 삽입 이미지


사용자 삽입 이미지


사용자 삽입 이미지

사용자 삽입 이미지



글쓴시간
분류 기술,IT/스테이블 디퓨전
Stable Diffusion 3.5 Large

10월 22일에 Stable Diffusion 3.5 가 발표되었습니다.

- 총 3가지로 공개된다고 하네요.

① Stable Diffusion 3.5 Large: 80 억개 파라메터
② Stable Diffusion 3.5 Large Turbo: Large 의 ADD(Adversarial Diffusion Distillation) 적용 모델. 4 스텝 용.
③ Stable Diffusion 3.5 Medium: 25 억개 파라메터

우선 Large 와 Large Turbo 가 발표되었습니다. Medium 은 10/29 공개 예정이라 하네요.

- 앞서 발표했던 SD3 의 Medium 모델이 20 억개의 파라메터를 가졌고, SDXL 은 26 억개입니다. FLUX.1 Dev 가 120억개입니다. 파라메터가 많으면 더 좋은 이미지를 얻을 수 있는건 맞지만, 고사양을 필요로 하기 때문에 대중성에서는 떨어집니다. 많이 떨어지죠. 아직까지 SDXL 에서 벗어나지 못하는 이유기도 합니다.

사용자 삽입 이미지

SD 3.5 구조. SD3 와 거의 유사하다.


SD3.5 의 구조는 SD3 와 거의 같습니다. 다이어그램에는 CLIP 에서 256 토큰을 사용한다고 되어있는데 뭔지는 잘 모르겠네요.

FLUX.1 Dev 이 사용하기 어려워서 (이미지 생성 속도 때문에) 고민되었는데 Medium 은 이미지 생성속도가 SDXL 과 비슷한 정도일 것으로 생각되어서 사용해볼만 하겠네요.

※ 파라메터 수 비교

SD 1.4/1.5: 860M
SD 2.0/2.1: 865M
SDXL: 2.6B
SD3 Medium: 2B
SD3.5 Medium: 2.5B
SD3.5 Large: 8B
FLUX.1 Dev: 12B

- 2024.10 현재 가장 많이 사용되는 모델은 SDXL 입니다. SD3.5 나 FLUX.1 Dev 이 대중화되려면 조금 더 시간이 필요해 보이네요. 현재 소비자들이 많이 사용되는 GPU 가 3060, 4060, 1650, 2060 급의 GPU 인데 이정도 스펙에서는 SDXL 을 사용하면 쾌적하게 사용할 수 있으니까요. 저도 SD1.5, SDXL 이 주력입니다.