윈디하나의 누리사랑방. 이런 저런 얘기

글쓴시간
분류 기술,IT/스테이블 디퓨전
Stable Diffusion - FastSD CPU

"FastSD CPU" CPU 만을 사용해서 이미지를 생성한다. LCM 이나 OpenVINO 를 사용하는듯.

예전에 한번 써보고 관심 없었는데, 갑자기 CPU 로 사용하는건 어떨까 해서 찾아봤다.

스텝은 4 이하로 설정하는게 핵심이다. 4 이하로 설정해도 품질이 좋은 이미지를 생성하기 위해 여러가지 작업을 한다. 물론 그렇지 않은 모델보다는 떨어지지만, 속도가 매우 중요한 경우에는 이 방법밖에 없다.

i7-7700K 에서 1장 생성하는데 약 30초 정도 걸린다. 품질도 생각보다는 좋다.

사용자 삽입 이미지

아래와 같이 LCM-LoRA 모델을 사용했다. OpenVINO 로 사용해도 속도는 크게 달라지지 않았다. OpenVINO를 사용해 성능을 향상시키려면 최신 CPU가 필요한것 같기도 하다. 예를 들어 AVX-VNNI 를 지원하는 CPU 말이다. (OpenVINO 는 AVX2 를 지원하는 CPU 에서 사용할 수 있다)

사용자 삽입 이미지


----

Stable Diffusion - LCM(Latent Consistency Model)
FastSD CPU
글쓴시간
분류 기술,IT/하드웨어 정보
Intel® Core™ i7-7700K 발열

Stable Diffusion 에서 성능을 강화한 모델을 CPU 로 돌려보았다. CPU만으로 생성하는 방법은 Stable Diffusion - FastSD CPU 을 읽어보자.

사용자 삽입 이미지

CPU 사양은 i7-7700K 인데, 결론은 계속 못 돌릴것 같다. 발열이 너무 심하다. TDP 91W 라는 수치가 믿기지 않을 정도의 발열이다. 80°C 넘는건 기본(80°C 는 CPU 의 1차 발열 제한 수치다) 이고 100°C 에 육박한다. 스로틀링 걸린거 같은데 7700K 가 망가질까봐 더이상 돌려보지 않았다.

※ i7-7700K 의 열 사양

- TDP: 91W
- Thermal Solution: PCG 2015D (130W)
- T JUNCTION: 100°C

105°C 넘어가면 아예 CPU 가 종료(시스템 종료)되는걸로 알려져있다. T JUNCTION 이 사용하기에 안전한 CPU 의 온도이기 때문에 100°C 까지 버틴다는 의미다. 단 CPU 온도가 100°C 부근이라면 쓰로틀링 걸리는 중일 수 있으니 성능도 같이 확인해보자.

※ TDP 는 요즘에는 Processor Base Power 라고 불리는데, 프로세서의 기본 전력 소비량이다. 터보부스트를 사용하지 않는 경우에 대한 전력 소비량이다. 터보부스트를 포함한 최대 전력 소비량은 Maximum Turbo Power 항목에서 찾을 수 있는데, 이 항목은 12세대 CPU 이후부터 표기된다. 이런 경우에는 Thermal Solution 에 나와있는 와트수를 보면 된다. 위 표에는 130W 라고 되어있는데, 이 수치는 인텔에서 판매하는 쿨러중에서 최 상급 쿨러다. 즉, i7-7700K 의 전력 소모는 사실상 130W 라는 의미다.

사용자 삽입 이미지

PCG 2015D 를 만족하는 Intel Thermal Solution BXTS15A. 팬 포함해 쿨러 높이가 90mm 이다.



사용자 삽입 이미지

PCG 2015D 를 만족하는 Intel Thermal Solution BXTS13X 수랭쿨러다.




※ Stable Diffusion 를 CPU으로 돌린거라 코어 4개가 모두 사용중이고 AVX, AVX2 를 사용하고 있다. 원래 AVX 를 사용하면 발열이 심해진다고 알려져 있기 때문에, 어느 정도 온도가 높을꺼라고, 80 도 정도까지는 생각했다. 하지만, 100도 일줄은 몰랐다. SD 는 수시간, 수십시간씩 실행하기 때문에 100도를 유지하면서 몇일씩 실행하는건 무리다. 게다가 현재 달아준건 수냉이기 때문에 코어 히트싱크 부근에 물이 끓어 순간적으로 기포 생길까봐 무서워서 못하겠다. (염려된다는거지 실질적인 문제가 있다는건 아니다)

※ 참고로 PCG 2015는 인텔에서 스카이레이크 프로세서를 출시할 때 정한 써멀 솔루션의 스펙이다. A ~ D까지 있고 대략 아래와 같은 소비전력을 커버할 수 있다.

PCG 2015A (35W)
PCG 2015B (58W?)
PCG 2015C (65W)
PCG 2015D (130W)

※ GT 1030 이라도 쓰는게 좋아 보인다. 이건 발열이라도 없으니 말이다. 에혀. 인텔의 삽질을 내가 느낄줄이야. 나중에 AMD 로도 해봐야 겠다.
글쓴시간
분류 기술,IT/스테이블 디퓨전
FLUX.1 Dev - 이미지 생성형 AI

사용자 삽입 이미지

Stability AI 의 Stable Diffusion 3 (SD3) 가 주춤한 사이 FLUX.1 이 공개되었습니다. 8월 1일에 공개되었는데 이제 주목하게 되었네요. Stable Diffusion 시리즈를 만든 개발자 중 일부가 나와 Black Forest Labs 라는 회사를 차렸는데, 이 회사의 첫번째 생성형 AI입니다. 독일 회사입니다.

FLUX.1 의 성능이 매우 좋다고 해서 관심을 많이 가지고 있습니다. 전 아직 안 써 봤습니다만, SD3 보다는 좋아보입니다. SD3 는 라이선스에 이슈가 있어서 아직까지는 대중화 될지 안될지 모릅니다. FLUX.1 의 경우 특히 "손"도 잘 그리는것으로 알고 있습니다. 엄청난 성능에 SD3 로는 대응이 안되어서 Stability AI 에서는 SD 3.1 을 내놓을 예정이라 합니다.

현재 SD 는 개발사에서 제공한 모델이 주류가 아닙니다. SD1.5 의 경우 개발사에서 제공한 모델보다는, 수많은 사용자들이 만든 모델들을 사용하고 있고요, Dreamshaper 8 정도가 유명합니다. 저도 제가 병합한걸 쓰고 있습니다. SDXL 의 경우 개발사에서 제공한 모델 보다는, 사용자들이 학습시킨 Pony Diffusion 이나 Animagine XL, JuggernautXL v9 기반의 모델이 더 널리 쓰이고 있죠. 심지어 Novel AI 3 도 SDXL 기반으로 알려져 있고 꽤 성능이 좋죠. 이후에 나온 SD3 나 FLUX.1 도 마찬가지일거라 생각합니다. 사용자들이 학습시키려면 라이선스가 중요한데 일단 SD3 는 사용하기 어렵겠네요. 약 6개월 정도 후면 사용자들이 학습시킨 모델이 나올텐데 이떄쯤에 판가름 되겠죠.

FLUX.1 은 Pro, Dev, Schnell 의 3가지로 제공되는데 Pro 는 유료고, 공개된 건 Dev 와 Schnell 입니다. 120억개 파라메터를 가지고 있습니다. "Schnell"은 4스텝 고속 추론 모델이라 성능이 더 좋은 "Dev" 모델이 주가 될겁니다. 약어로 "FLUX.1 D"라고 부르네요. 아직 Stable Diffusion WebUI (SDUI) 에서는 지원이 안되고, Stable Diffusion WebUI Forge (SDF) 에서 지원된다고 하네요. SDF 는 예전에 VRAM 이 낮은 기기에서도 느리지만 이미지 생성이 되어서 한때 잘 썼었는데요, 다시 보니깐 반갑네요. (물론 같은 파라메터를 주어도 SDUI 와 유사한 이미지를 만들지 않습니다. 내부 알고리즘이 호환이 안되는거라서요)

FLUX 라는건 "선속"이라는 의미입니다. 특정 공간에서의 어떤 물리량의 "흐름"을 의미합니다. 주변에서 흔히 볼 수 있는 FLUX 라는 용어는 광선속을 이야기할때 주로 사용합니다. 광선속의 단위가 루멘, 칸델라, 럭스이고, 조명 기구의 밝기를 나타냅니다. 단위 면적당 광자의 흐름을 나타내죠.

Black Forest Labs
GitHub - black-forest-labs/flux: Official inference repo for FLUX.1 models

----

FLUX.1 Dev 사용하기
글쓴시간
분류 이야기
천리안 서비스 종료

굉장히 오래 전부터 써 오던 서비스가 결국 종료된다고 하네요.

천리안입니다. 한 30년 넘게 써 왔던거 같네요. PC통신을 천리안으로 처음 시작했기 때문에 감회가 남다르네요.

사용자 삽입 이미지

메일까지 종료되기 때문에 메일 주소부터 옮겨야 합니다. 카드부터 시작해서 도메인 등등 다 옮겨야 하네요. 어쨌든 꽤 큰 작업이 될듯 합니다. 나우누리도 서비스 종료된지 오래고, 결국 PC통신의 유물들이 모두 종료되었네요.

----

나우누리 서비스 종료
글쓴시간
분류 기술,IT
AGESA 1.2.0.cc  와 싱크클로즈(Sinkclose) 보안 취약점


사용자 삽입 이미지

싱크클로즈 취약점은 AMD CPU 에서 발견된 취약점으로, ring 0 모드 (커널 모드)에서 SMM (System Management Mode) 락이 활성화되어있어도 SMM 설정을 변경할 수 있는 취약점이라고 합니다. SMM 설정의 변경은 주로 AGESA 설정을 변경 (버전 변경) 할 때 사용합니다.

게스트 메모리 취약점, SMM 락 바이패스 취약점이라고도 합니다. IOActive 라는 보안 업체에서 발견했고, Sinkclose 라는 이름을 붙였습니다.

현재 패치가 나와있는 상태입니다. 바이오스를 패치해야하며,

Ryzen 3000 번대: AGESA 1.2.0.cc
Ryzen 4000 번대: AGESA 1.2.0.cb
Ryzen 5000 번대: AGESA 1.2.0.cb
Ryzen 7000 번대: AGESA 1.2.0.1
Ryzen 8000 번대: AGESA 1.2.0.1

으로 업데이트 하면 됩니다.

제가 사용하는 마더보드는 바이오스가 아직 안 나왔네요.

----

https://www.amd.com/en/resources/product-security/bulletin/amd-sb-7014.html


----
2024.10.09 AGESA 1.2.0Cc 바이오스 업데이트 완료!

사용자 삽입 이미지