윈디하나의 누리사랑방. 이런 저런 얘기

글쓴시간
분류 기술,IT/스테이블 디퓨전
Stable Diffusion - 웨딩 드레스 #3

체크포인트를 바꿨다. 오랜만에 머지를 다시 했는데, 괘 괜찮게 나왔다. 8월 초에 한번 바꾸고 근 3개월 만이다. 그동안 몇번 머지를 시도했지만 기존것 보다 안 좋다고 판단되어서 사용하지 않고 있었다. 다행이도 이번엔 기존것 보다 잘 나왔다.

슬슬 SDXL 이나 SD3, FLUX.1 등으로 바꾸긴 해야 한다고 생각하긴 하는데 아직 못 바꿨다. PC의 업그레이드는 마쳤고, 지금은 SDXL 정도는 무난하게 사용가능하긴 하지만 아직 맘에 드는 그림체가 아니라서 못 바꾸고 있다. 하지만 꾸준히 SDXL 이나 FLUX.1 으로는 생성하고 있다. 웬지 아래와 같은 그림체가 안나와서 맘에 안들 뿐이다. 이러다가 직접 LoRA 를 작성해야 하는게 아닌가 생각하기도 한다.

사용자 삽입 이미지


사용자 삽입 이미지

사용자 삽입 이미지

사용자 삽입 이미지

사용자 삽입 이미지

사용자 삽입 이미지

사용자 삽입 이미지

사용자 삽입 이미지
글쓴시간
분류 문화,취미/음악
ROSÉ & Bruno Mars - APT.

로제와 브루노 마스의 아파트가 선풍적인 인기를 끌고 있습니다. 인기가 있다길래 찾아봤고 저도 뮤직 비디오 (뮤비)보자마자 이건 엄청 뜨겠다고 생각했고 역시나네요.

사용자 삽입 이미지


뮤비서 춤추는게 막춤 같아보이지만, 꽤 세련되어 보입니다. 제가 평할건 아니겠지만, 결론적으로는 B급 감성으로 포장한 S급 뮤비라고 생각합니다.



또한 음악이 좋고, 편곡이 잘되어있습니다. 괜찮은 이어폰을 끼고 볼륨크게 들어도 그렇게 깨지거나 잘못된걸 못 느꼈으니까요. 쿵쾅쿵쾅 거릴것 같지만 꽤 부드러운 음악이라 생각되네요. 결론은 작곡도 세계 정상급이라는 겁니다. 노래는 뭐 말할필요 없겠죠.

가사도 굉장히 맘에 듭니다. 영어로 된 곡이지만 한국어도 제법 있습니다. 인트로는 한국어로 시작하죠.

채영이가~ 좋아하는~ 랜덤~ 게임! 랜덤~ 게임! 게임~ 스타트!
아파트
건배
예전에 싸이가 강남스타일로 뜰때가 생각나네요. 그때 이후에는 별로 신선함을 못 느꼈었는데요, 그때보다 더 신선합니다.
글쓴시간
분류 기술,IT/스테이블 디퓨전
Stable Diffusion - 할로윈

4060Ti 구매한 후에 한번 생성해 보았다. HiRES fix. 부분이나 4배 업스케일링 부분에서는 확실히 많은 성능 향상을 체감할 수 있다. 반대로 작은 이미지, 예를 들어 512 x 768 정도의 이미지 생성에는 그렇게 성능향상을 못 느낀다.

사용자 삽입 이미지


사용자 삽입 이미지


사용자 삽입 이미지

사용자 삽입 이미지



글쓴시간
분류 기술,IT/스테이블 디퓨전
Stable Diffusion 3.5 Large

10월 22일에 Stable Diffusion 3.5 가 발표되었습니다.

- 총 3가지로 공개된다고 하네요.

① Stable Diffusion 3.5 Large: 80 억개 파라메터
② Stable Diffusion 3.5 Large Turbo: Large 의 ADD(Adversarial Diffusion Distillation) 적용 모델. 4 스텝 용.
③ Stable Diffusion 3.5 Medium: 25 억개 파라메터

우선 Large 와 Large Turbo 가 발표되었습니다. Medium 은 10/29 공개 예정이라 하네요.

- 앞서 발표했던 SD3 의 Medium 모델이 20 억개의 파라메터를 가졌고, SDXL 은 26 억개입니다. FLUX.1 Dev 가 120억개입니다. 파라메터가 많으면 더 좋은 이미지를 얻을 수 있는건 맞지만, 고사양을 필요로 하기 때문에 대중성에서는 떨어집니다. 많이 떨어지죠. 아직까지 SDXL 에서 벗어나지 못하는 이유기도 합니다.

사용자 삽입 이미지

SD 3.5 구조. SD3 와 거의 유사하다.


SD3.5 의 구조는 SD3 와 거의 같습니다. 다이어그램에는 CLIP 에서 256 토큰을 사용한다고 되어있는데 뭔지는 잘 모르겠네요.

FLUX.1 Dev 이 사용하기 어려워서 (이미지 생성 속도 때문에) 고민되었는데 Medium 은 이미지 생성속도가 SDXL 과 비슷한 정도일 것으로 생각되어서 사용해볼만 하겠네요.

※ 파라메터 수 비교

SD 1.4/1.5: 860M
SD 2.0/2.1: 865M
SDXL: 2.6B
SD3 Medium: 2B
SD3.5 Medium: 2.5B
SD3.5 Large: 8B
FLUX.1 Dev: 12B
글쓴시간
분류 기술,IT/하드웨어 정보
nVidia Geforce RTX 4060TI  16GB - GPU-Z

사용자 삽입 이미지

당근에서 구매. 45만냥. 현재 신품 최저가는 60만원이다. 출시가는 55만원대였는데 이후 조금 떨어지다가 계속 올라서 지금은 60만원이 된거다. 그리고 앞으로 조금씩 오를거라고 생각한다.

제조일은 24년 2주차다. 2027년 2주차까지 A/S 기간이다. 일단 받은건 정상 작동하는건 확인했다.

제품명은 GeForce RTX 4060 TI VENTUS 2X BLACK 16G OC 이다. 제조사는 MSI. 4060 TI 의 16GB 버전은 현재 MSI 에서만 판매하고 있다. 그만큼 4060 Ti 16G 는 수요가 없긴 하다. OC 가 들어갔으니 뭔가 오버클럭 되어있는 셈. 또한 MSI 제품은 처음 써본다.

사용자 삽입 이미지

기존 2060 12G 는 다른 PC에 달고 이걸로 달았다. 생각보다 많이 작은거에 놀랐다. 발열도 2060 12G 보다는 더 낮은 느낌. TGP 는 2060 12G 보다 낮다.

사용자 삽입 이미지

GPU-Z 는 아래와 같다. Resizable BAR 를 활성화했다.

사용자 삽입 이미지

센서는 지난 2060에 비해 많아졌다.

사용자 삽입 이미지

조만간 5090이 나올거라고는 하는데, 5060 까지 출시하려면 아직 멀어서 (5090 출시후 6개월~1년정도 후에 나옴) 어차피 비쌀것이기도 해서 그냥 4060 Ti 구매했다. VRAM 이 24GB 이 못된게 아주 아쉽긴 하다. 물론 작년 출시때부터 산다고 했던거기도 하고 말이다.