윈디하나의 누리사랑방. 이런 저런 얘기

글쓴시간
분류 기술,IT/스테이블 디퓨전
Stable Diffusion WebUI 가 v1.8.0 으로 업그레이드 되었다.

사용자 삽입 이미지

- 가장 눈에 띄이는건, Pytorch 버전과 Xformers 버전이 올라갔다는거. 9초 걸리던 생성시간이 8초대로 줄었다.

torch: 2.1.2+cu121 • xformers: 0.0.23.post1 으로 업그레이드 되었다.

- Generate 버튼 눌렀다가 다시 취소할때 뭔가 메시지가 나온다. 한참 기다릴 필요 없어서 좋다. 또한 Extra 에서 이미지 업스케일시 배경에 업스케일링 상태바가 출력된다.

사용자 삽입 이미지

- LoRA 설정 창에서 이미지 업데이트하면 바로 갱신이 안된다. 리로드를 눌러줘야 한다. 버그인듯. 조금 불편하군요.

- 지금 설치되어있는 LoRA 가 2000 여개가 된다. 앞으로 더욱 늘어날 텐데, 이걸 관리해주는 기능이 강화되었으면 한다. 하지만 "어떻게" 강화해야하는지는 잘 모르겠다. 나만큼 LoRA 많이 쓰는 사람도 많은거 같다.
글쓴시간
분류 시사,사회
대한민국 헌법 전문


사용자 삽입 이미지

유구한 역사와 전통에 빛나는 우리 대한국민은 3·1운동으로 건립된 대한민국임시정부의 법통과 불의에 항거한 4·19민주이념을 계승하고, 조국의 민주개혁과 평화적 통일의 사명에 입각하여 정의·인도와 동포애로써 민족의 단결을 공고히 하고, 모든 사회적 폐습과 불의를 타파하며, 자율과 조화를 바탕으로 자유민주적 기본질서를 더욱 확고히 하여 정치·경제·사회·문화의 모든 영역에 있어서 각인의 기회를 균등히 하고, 능력을 최고도로 발휘하게 하며, 자유와 권리에 따르는 책임과 의무를 완수하게 하여, 안으로는 국민생활의 균등한 향상을 기하고 밖으로는 항구적인 세계평화와 인류공영에 이바지함으로써 우리들과 우리들의 자손의 안전과 자유와 행복을 영원히 확보할 것을 다짐하면서 1948년 7월 12일에 제정되고 8차에 걸쳐 개정된 헌법을 이제 국회의 의결을 거쳐 국민투표에 의하여 개정한다.

- 대한민국 헌법 1조만 많이 보다가 전문을 보게 되었네요. 요즘 커뮤니티에서 회자되고 있습니다.

- 3·1 절이 왜 국경일 (기념일)이고 기뻐해야 하는 날인지에 대해 알려줍니다. 당시 "대한민국 임시정부"가 3·1 운동으로 건립되었다고 나와있습니다. 즉 3·1 운동은 정부를 설립하게 만든 운동이고 기뻐해야하는 날입니다.
글쓴시간
분류 기술,IT
CPU 마켓 셰어

AMD vs Intel 에서 시장 점유율(Market Share)를 보려면 AMD vs Intel Market Share를 보면 된다.

사용자 삽입 이미지

시장 점유율. 출처: https://www.cpubenchmark.net/market_share.html


예전 젠3 5000 번대가 출시된 2021.Q1 이 50.5% 으로 AMD 의 전성기였다. 2006년 Q1의 53.9% 가 최고였지만, 2006년 Q3 에 인텔에서 Core2 시리즈를 발매한 이후 계속 내리막길이었다가, Ryzen 시리즈를 발표한 2016.Q3 부터 반등하기 시작한다. 지금은 잠시 주춤해진 시기.

라이젠 화이팅!
글쓴시간
분류 기술,IT/스테이블 디퓨전
Stable Diffusion WebUI 4K 이미지 생성

사용자 삽입 이미지

nVidia 드라이버 업데이트로 언제부턴가 VRAM 이 부족하면 시스템 메모리의 50%까지 가져와 사용하도록 변경되었다.

이런 변경사항때문에 4K 로 바로 업스케일 가능한지 테스트해보았다.

※ 테스트 사양

메모리: VRAM 12GB, SYSTEM RAM 32 GB
SD WebUI: v1.7.0, "--xformers --no-half-vae" 옵션

※ 테스트

① 544 x 960 → 1088 x 1920 변환(Hires. fix)작업: 시간: 01m 56s, A: 8.40 GB, R: 12.71 GB, Sys: 12.0/12 GB (100.0%)
② 544 x 960 → 1632 x 2880 변환(Hires. fix)작업: 시간: 08m 43s, A: 15.93 GB, R: 25.72 GB, Sys: 12.0/12 GB (100.0%)
③ 544 x 960 → 2176 x 3840 변환(Hires. fix)작업: 실패. > 12m

A: 캐시 제외한 비디오 메모리 사용량
R: 토치 라이브러리의 최대 메모리 사용량
Sys: 비디오 메모리 사용량/총 비디오 메모리

※ 4K 를 바로 생성하려면 시스템 메모리 64GB 는 되어야 한다고 예상된다. 지금은 그냥 Extra 탭에서 업스케일링 하고 있다. 조만간 64GB으로 업그레이드할 생각이긴 하다.

※ 실패시에는 아래와 같은 문구가 나왔다. 마지막단계(생성 다 끝나고 VAE 사용하는 단계)에서 오류난다.

OutOfMemoryError: CUDA out of memory. Tried to allocate 7.97 GiB (GPU 0; 12.00 GiB total capacity; 18.51 GiB already allocated; 0 bytes free; 18.54 GiB reserved in total by PyTorch) If reserved memory is >> allocated memory try setting max_split_size_mb to avoid fragmentation. See documentation for Memory Management and PYTORCH_CUDA_ALLOC_CONF

Time taken: 12 min. 41.4 sec.

A: 20.55 GB, R: 22.88 GB, Sys: 12.0/12 GB (100.0%)

메시지의 내용은 7.97GiB 할당하다가 오류났고 이걸 해결하려면 결과적으로 7.97GiB 메모리가 더 필요하다는 의미다. 최소 VRAM 을 8GB 증설하던가, 시스템 메모리를 16GB 증설하던가 해야 한다.

※ 테스트에 사용한 이미지는 아래와 같다.

사용자 삽입 이미지

원본


사용자 삽입 이미지

Hires fix 2배


사용자 삽입 이미지

Hires fix 3배


사용자 삽입 이미지

Extra 2배


사용자 삽입 이미지

Extra 3배


사용자 삽입 이미지

Extra 4배

글쓴시간
분류 기술,IT
AMD Ryzen™ 7 PRO 4750G 메모리 오버클러킹

DDR4 메모리 오버클러킹을 했다. 결과적으로는 DDR4-4000 까지 무리 없이 되었다. tCL 은 28으로 되었다.

메모리 오버클러킹하려 한 목적이 사용하고 있는 CPU 의 인피니티 패브릭 인터커넥트의 클럭을 올리기 위함이었다. 그래서 tCL 값은 따로 설정하지 않고 AUTO 로 세팅해 놓고 진행했다. tCL 값 줄인다고 해서 그다지 빨라지는것도 아니고 말이다.

즉 메모리 클럭만 4000MHz 으로 설정하고 다른 메모리 관련 설정은 모두 자동으로 놓았다. 전압도 자동으로 두었다.

- 사용한 메모리는 삼성, 22년 22주차, DDR4-2666V, 16GB, 2Rx8, D다이이다. 파트넘버는 M378A2K43DB1-CTD 이다.

사용자 삽입 이미지

사용자 삽입 이미지

- 사용한 CPU는 AMD Ryzen™ 7 PRO 4750G, 마더보드는 ASUS B550M-A 이다. 마더보드의 바이오스는 최신버전을 사용했다.

- 오버클러킹 전은 아래 화면과 같다. DDR4-2666V 램을 사용하기 때문에, 그 값으로 세팅되어있는 상태다.Uncore Frequency 1333MHz, DRAM Frequency 1333MHz, tCL 19 다.

사용자 삽입 이미지

- 우선 DDR4-3200 으로 세팅하고 부팅했다. 한번에 되었다. tCL 22 으로 DDR4-3200AA 에 해당하는 세팅이다.

사용자 삽입 이미지

- DDR4-4000 으로 세팅하고 본 값. 역시 한번에 되었다. 인피니티 패브릭 인터커넥트는 2000MHz 이다.

사용자 삽입 이미지


- HWiNFO 에서 FCLK(인피니티 패브릭 클럭), UCLK(메모리 컨트롤러 클럭)를 확인해보았다. 2000MHz 으로 나온다.

사용자 삽입 이미지

- HWiNFO 에서 MCLK(메모리 클럭) 도 2000 MHz 으로 확인된다. 이로써 1:1:1 임을 확인했다.

사용자 삽입 이미지

- DDR4-4000 상태에서 MT5 를 실행해 메모리를 테스트했다. 문제 없었다.

사용자 삽입 이미지

사용자 삽입 이미지

- DDR4-4200 은 부팅 불가. 그래서 전압을 1.3으로 높여보니 부팅은 되었지만 1:1 매핑이 되지 않았다. 따라서 이보다 높게는 시도하지 않았다.

사용자 삽입 이미지


- 최종적으로 DDR4-4000 을 사용하기로 하고 벤치 및 GPU-Z 도 찍어보았다. CPU는 벤치 성능차이 없고, GPU 의 메모리 대역폭은 메모리 클럭수 올라간만큼만 좋아졌다. 대신 발열이 조금 있는 느낌이다.

사용자 삽입 이미지

사용자 삽입 이미지

사용자 삽입 이미지

- 빠릿빠릿해진 느낌. 화면 전환이 확실히 많이 빨라졌다. 그외에는 아직 크게 느끼진 못하고 있다. 어쨌든 목표한 인피니티 패브릭 클럭 2000MHz 달성이라 만족이다.

- DDR4-4000 으로 오버클럭 한 상태에서, tCL 28에서 줄이려면 메모리에 인가되는 전압을 올려야 하는데 이건 메모리 수명과도 연결되는거라 전압을 올리진 않았다. 보통 1.35V (DDR4의 표준전압은 1.2V이다) 까지는 10% 차이라 안전하지만, 그래도 전압을 올릴생각은 없었다. 어차피 tCL 값 줄인다고 성능이 비약적으로 상승하는게 아니니 tCL 을 줄이지 않고 사용중이다.