윈디하나의 누리사랑방. 이런 저런 얘기

글쓴시간
분류 기술,IT
포토 스케이프

간단한 사진 출력 프로그램을 찾다가 발견한 무료 프로그램. Mooii Tech 라는 곳에서 개발했다. 반 명함 사이즈 정도로 출력할 때 쓸만하다. A4 용지에 출력하려는 용도 말고 말이다.

그냥 프로그램 실행하고, 용지 크기 설정하고, 이미지 파일 가져다 끌어놓으면 출력준비 끝.

집에서 사용하는것도 포토 프린터라 더 쓸만한듯.

http://photoscape.co.kr 에서 다운로드 받을 수 있긴 한데, 여기에서 소개하는 티스토리 블로그는 다른 걸로 바뀌었다. 없어졌는줄 알았는데, 또 다른걸 찾았다. http://x.photoscape.org/ 여기에서 다른 버전을 받을 수 있다. 윈도10부터 실행 가능하다.

사용자 삽입 이미지
글쓴시간
분류 기술,IT/스테이블 디퓨전
Stable Diffusion - 업그레이드 1차

- Stable Diffusion(이하 SD) 를 사용할 PC를 업그레이드 했다.

CPU:  i5-750 -> i3-6100
M/B: P55 -> H110
MEM: DDR3 16GB -> DDR4 8GB
GPU: nVidia GT 1030 (변경없음)

마더보드에서 PCIe 3.0 을 지원하기 때문에 GT1030 의 성능을 다 내준다. 그래서 그만큼 빨라졌다. 아래 작업관리자 그래프에서 Copy 1 항목이 2배이상 빨라진 셈이다. 그래서 3D (CUDA 코어 연산) 부분의 사용율이 올라갔다. 체감상 이미지 1개 생성시 14 분 -> 9분 정도로 약 35% 향상이 있었다. (성능 향상 비율은 SD 에서 생성할 이미지에 따라 다르다) CPU 연산성능 향상에 따라 GPU 부하가 늘어난 것도 있겠지만, PCIe 속도 빨라진게 성능 향상의 주된 요소인것으로 생각한다. GT 1030 의 VRAM 이 2GB 이기 때문에, SD 를 실행시킬때 --lowvram 을 주어 실행시켰고 이 때문에 이미지 생성시 Copy 성능이 중요해졌다. --lowvram 옵션을 주지 않으면 Copy 성능은 중요하지 않다.

사용자 삽입 이미지

가장 아래 그림 그릴때의 성능 그래프. 512x1024 이미지 생성했다. 중간쯤에 그래프가 튀는건 이미지 생성의 최종단계 이기 때문이다.


요즘 사용하고 있는 체크포인트는 AbyssOrangeMix3 다. 판타지 풍 에니메이션 그림체를 잘 만들어주는거 같다. Mix 이기 때문에 2가지 이상의 체크포인트를 합해 만든거다. 이중에서 AOM3A1B 버전 사용하고 있다. 메모리도 적게 사용하는데 비해 맘에 드는 품질을 보여준다.

인터넷에서 본 키워드를 사용해 작성중이다. 그중 꽤 쓸만하다고 생각되는거 하나 업로드한다. "어머니가 섬그늘에 굴 따러 가면"를 오역한 "when mother raids ghoul on the darker side of the island" 프롬프트를 사용했다. (구체적인 키워드는 이미지에 있으므로, PNG 파일을 다운받아 Stable Diffusion 의 PNG Info 에서 보면 볼 수 있다)

사용자 삽입 이미지

사용자 삽입 이미지
글쓴시간
분류 기술,IT
Core i3-6100 부터 Core i3-14100 까지 스펙

                   6100     7100     8100    9100    10100    11100B    12100     13100  14100
리소그래피         14 nm    좌동     좌동    좌동    좌동     10nm      Intel 7   좌동   좌동
출시가격           $117.00  좌동     좌동    $122.00 좌동     -         $134      $144   좌동
코어수             2        좌동     4       좌동    좌동     좌동      좌동      좌동   좌동
쓰레드수           4        좌동     4       좌동    8        좌동      좌동      좌동   좌동
기본 주파수 GHz    3.70     3.90     3.60    좌동    좌동     좌동      3.3       3.4    3.5
터보 주파수 GHz    -        -        -       4.20    4.30     4.4       4.3       4.5    4.7
터보 부스트 GHz    -        -        -       4.20    4.30     4.4       4.3       4.5    4.7
명령셋             AVX2     좌동     좌동    좌동    좌동     좌동      좌동      좌동   좌동
캐시               3 MB     좌동     6 MB    좌동    좌동     12MB      좌동      좌동   좌동
버스 속도          8GT/s    좌동     좌동    좌동    좌동     좌동      좌동      좌동   좌동
TDP W              51W      좌동     65W     좌동    좌동     좌동      60~89     60~110 좌동
출시일             Q3'15    Q1'17    Q4'17   Q2'19   Q2'20    Q2'21     Q2'22     Q2'23  Q2'24
최대 메모리        64GB     좌동     좌동    좌동    128 GB   좌동      좌동      192 GB 좌동
메모리 유형        D4-2133  D4-2400  좌동    좌동    D4-2666  D4-3200   ~D5-4800  좌동   좌동
메모리 대역폭 GB/s 34.1     37.5     좌동    좌동    41.6     51.2      76.8      좌동   좌동
ECC 메모리         예       좌동     좌동    좌동    아니오   아니오    ?         ?      ?
프로세서 그래픽    HD 530   HD 630   UHD 630 좌동    좌동     UHD11gen  UHD 730   좌동   좌동
PCIe               3.0      좌동     좌동    좌동    좌동     4.0       5.0       좌동   좌동
PCIe 레인 수       16       좌동     좌동    좌동    좌동     20        좌동      좌동   좌동
TCASE              65°C     좌동     72°C    좌동    좌동     ?         ?         72°C   ?
TJUNCTION          100°C    좌동     좌동    좌동    좌동     좌동      좌동      좌동   좌동
Optane™ 메모리     아니오   예       좌동    좌동    좌동     좌동      좌동      좌동   좌동
CPU-Z BENCH S      357      375      421     470     460      510?      659       678    702
CPU-Z BENCH M      1045     1099     1587    1762    2448     2500?     3348      3553   3625
- 6100 ~ 10100 까지 마이크로 아키텍처가 같고 공정도 14nm 으로 같다. 그래서 한번에 비교해 보았다. 이후 마이크로 아키텍처를 변경했지만 공정은 그대로인 로켓 레이크 CPU에는 i3 제품이 없다. i5-11400 이 가장 낮다. 따라서 i3-10100 다음 세대 CPU 는 i3-12100 이다. 위의 표에서 적어놓은  i3-11100B는 리테일 제품이 아니다.

- 12100 부터는 아키텍처가 변경되었지만, i3 는 거기서 거기다. E 코어가 없기 때문이다.

- 써보고 나니 생각보다 더 인텔의 삽질이 심했다고 느껴진다. 좌동이 이렇게 많을 줄이야. 바꿔말하면 스카이레이크 마이크로 아키텍처가 잘 만들어진걸지도 모르겠다. 이것 때문에 스카이레이크 출시 시기에는 인텔에 관심 없어졌지만, 실제로 표로 정리해보니 생각보다 삽질이 더 심한거 같다.

- 경쟁사인 AMD 에서 라이젠을 발매한 시기가 2017년 2월이다. 이 이후로는 인텔이 고전을 면치 못했다. 필자도 중고로 저렴하게 판매하는게 아니라면, 7세대 ~ 10세대까지 구매하느니 라이젠을 구매하는게 좋지 않을까 한다. 특히 라이젠 3000 시리즈 이후 부터는 튜닝이 완성된 시점이기 때문에 매우 좋다. 이는 12세대부터 다시 역전되었다가 이후 경합을 벌이고 있다.
글쓴시간
분류 문화,취미
더 글로리

사용자 삽입 이미지

더 글로리 1부 포스터


사용자 삽입 이미지

더 글로리 2부 포스터


드디어 길고 길었던 동은이의 복수가 끝났다. 2023-03-10 17:00 에 공개된 최종화를 이제 다 보았다. 구체적인 내용을 적고 싶지만 한달만 참아야쥐. 여기 들어오는 사람들도 많을테니깐.

- 그래도 나름 행복한 결말이라 맘에 들었다. 우리나라 드라마는 결말이 행복해서 참 좋다.

- 2차 포스터에 단테의 신곡 지옥편의 문구가 써 있다. 매우 인상적.

Lasciate ogni speranza, voi ch'entrate
모든 희망을 버려라, 들어가는 자여
글쓴시간
분류 기술,IT/스테이블 디퓨전

Stable Diffusion - ControlNet

컨트롤넷. 특정한 구도로 Stable Diffusion 이미지 생성시 그려주는 SD 의 확장이다. 구도는 유사한 이미지를 사용해 입력해주거나, 새롭게 그려줄 수 있다. 그냥 윈도에 있는 그림판으로도 그려줄 수 있다. 그정도만 그려줘도 충분하다.

사용자 삽입 이미지

ControlNet 의 원리. 뭔소리인지는 나도 모르지만 뭔가 마지막 직전에 + 해주는 것 같다



- Stable Diffusion web UI 에서는 익스텐션 탭에 가면 쉽게 설치할 수 있다.

사용자 삽입 이미지
확장을 설치했으면, https://huggingface.co/lllyasviel/ControlNet/tree/main/models 에서 원하는 모델을 받은 후, (필자는 control_sd15_openpose.pth 을 받았다) \stable-diffusion-webui\extensions\sd-webui-controlnet\models 에 넣어준다.

설치후 UI 를 재로드 하면 (Apply and restart UI 를 클릭하면) txt2img 탭의 아래에 Control Net 패널이 보인다.


- 이미지를 생성하는 설정은 설치 전과 동일하게 한 후, 이미지넷에 구도에 참고할만한 이미지를 넣어준후 설정해준다. Model 에서 openpose 를 선택하고 바로 아래 Enable, Low VRAM 을 클릭한 후, 이후 Generate 를 누르면 이미지넷에 넣어준 이미지와 유사한 구도의 이미지가 생성된다.

사용자 삽입 이미지


- 이미지 생성시 메모리를 더 사용한다. 7.9 GB -> 8.9 GB 로 말이다. ControlNet 에서 사용하는 모델(.pth 파일)이 5.7 GB 정도 되는데 뭔가 최적화 되서 들어가는 듯. 아래화면은 512x512 이미지를 이미지넷을 사용해서 생성 중인 상태다.

사용자 삽입 이미지

생성할때 아래와 같이 콘솔에 표시된다.

Loading model: control_sd15_openpose [fef5e48e]
Loaded state_dict from [경로\stable-diffusion-webui\extensions\sd-webui-controlnet\models\control_sd15_openpose.pth]
ControlNet model control_sd15_openpose [fef5e48e] loaded.

- 요즘 나오는 AI 이미지는 이를 사용해서 만든다고 생각한다. ControlNet 을 사용해 시드번호를 일치시키지 않고도 손가락이 제대로 나오는 포즈를 고정시킬 수 있기 때문이다. SD 로 그리기 너무 어려웠는데 그나마 이걸 사용하면 손가락을 숨기기 쉬워진다.

- 신체 부위에서 손가락이 그리기 어려운 편에 속하는데 워낙 관절이 작은데다 꺾이는 곳이 많고, 그만큼 다양한 각도에서 보면 처음보는 구도가 나오기 때문이다. 일러스트레이터들은 자기 손가락으로 형태를 취해보고 그대로 그리면 되는데 AI 는 그걸 못하기 때문. 그래서 AI가 그린 포즈가 일정해졌다. 그리고 ControlNet 을 사용해 어느정도 고정시킬 수 있게 되었다. 또한 로라 같은걸 사용해 새로운 포즈와 그에 따른 손가락을 새롭게 학습시키는게 어렵진 않으니 그나마 다행.

- OpenPose 를 사용하는 경우 OpenPose 에디터 확장도 같이 설치하자.

사용자 삽입 이미지


글쓴시간
분류 문화,취미/영화
스즈메의 문단속

사용자 삽입 이미지

스즈메의 문단속을 보고 왔다. 우리나라는 2023년 3월 8일 개봉이지만, 일본에서는 2022년 11월 11일에 개봉한거라 2022년 영화다.

사용자 삽입 이미지

오랜만에 영화관에서 보고왔다. 굉장히 여운이 남는 작품. 끝나고 스탭롤 다 올라갈때까지 자리에 계속 있었다. 단연컨데 신카이 마코토의 작품 중에서 최고라고 꼽을 수 있겠다.

사용자 삽입 이미지

아직 개봉한지 얼마 안되어 스포할만한 내용은 안 쓰겠다.

1. 음향 좋은 영화관에서 보는걸 추천. 음악도 매우 좋다.
2. 우연하게도 오늘 봤는데 영화에서도 오늘이 나왔다.
3. 나름 추억 돋는 음악도 나왔다. 중간에 음악어플로 가요를 돌려듣는게 있는데, 男と女のラブゲーム (남자와 여자의 러브게임) 이 특히 기억난다. 한 반정도는 어떤곡인지 알아들은것 같다. 이런 노래를 안다는건 나도 너무 나이가 들어가는 건감.

사용자 삽입 이미지

PV



OST 가 너무 좋다.

글쓴시간
분류 기술,IT/스테이블 디퓨전
듀얼 GPU 사용

아주 오래전엔 VGA 는 1개로 고정되어있었다. 도스 시절 이야기인데, int 10h 가 하나의 VGA 만 인식했기 때문. 물론 당시에는 당연하게 생각했지만, 요즘에는 그게 아니다. 여러개의 GPU 를 달아 사용할 수 있다.

- 여러개의 GPU 를 달아 마치 하나의 GPU로 인식시켜 어플리케이션에서 사용하려면 뭔가 특수한 기법이 필요해진다. 또한 여러개의 GPU 성능을 그대로 다 내도록 하려면 하드웨어적으로 뭔가 장치가 필요하다. PCIe 를 사용해 GPU 간 통신하는건 느리기 때문. 그래서 SLI (NV Link)나 CorssFire 와 같은 기술을 사용하곤 했다.

- 하나의 어플리케이션에서 시스템에 설치된 GPU 중 하나의 GPU 를 선택적으로 사용하려면 그건 별다른 기술 없이 윈도10에서 지원해준다. 단 드라이버가 설치되어야 한다. 요즘엔 CPU 에 내장되어있는 GPU 가 있기 때문에 이렇게 구성하기 쉽다.

- 이런 이야기를 하는게, 좀 성능 낮은 GPU 를 모니터 출력용으로 사용하고, GT 1030 을 CUDA  용으로만 사용해 메모리를 아끼려는 심산이었다. 윈도에서 기본으로 400MB 정도의 VRAM 을 사용하기 때문에 이거라도 아끼려고 했다.

아래 캡처본은 그렇게 한 결과다. 남아있던 Radeon HD 5500 를 달아 모니터를 연결해주고, GT 1030 에는 아무것도 연결하지 않았다. 그래서 아래와 같이 부팅 직후에는 GPU 메모리를 사용하지 않고 있다. 원래는 약 400MB 정도 점유하고 있었다.2 GB 에서 400 MB는 크다.

사용자 삽입 이미지

- 그 400MB 가량은 아래와 같이 HD 5500 에서 사용하고 있다.

사용자 삽입 이미지

이렇게 해서 SD 에서 768 x 768 이미지를 생성시킬 수 있었다. 기존에는 메모리 부족해서 이걸 못했다. 나름 만족. 하지만 --medvram 옵션을 줄 수 있을 정도는 안되었다. CUDA 메모리 부족으로 뜬다.
글쓴시간
분류 기술,IT/스테이블 디퓨전
Stable Diffusion web UI

요즘 핫 한 이미지 생성 AI 프로그램이다. 2022년 8월에 나왔고 10월 경부터 핫해지기 시작했는데, 필자는 이제 시작해 보았다.

사용자 삽입 이미지

- 여태까진 PC 성능에 대해 욕심이 없었는데, 이걸 접하고 나니 욕심이 생긴다.내가 관심있는건 이걸 사용하는게 아니라 이걸 좀 더 "빠르게" 사용하는 거다. 쉽게 말하면 튜닝에 관심있다.

- 필자의 시스템에서 돌아가고 이미지 생성도 되긴 하지만, 업스케일 할때는 메모리 부족하다면서 오류내곤 한다. 그냥 업스케일 포기. GPU 메모리 2GB 에서도 실행되지만, 최소한 4GB 는 되어야 뭔가 제대로 돌릴 수 있을 것 같다. 권장은 8GB 다.

- 필자가 생각하는 최소 사양은 이렇다. 어쨌든 생성은 되는 수준이다. (필자가 이렇게 사용하고 있다)

CPU: Intel Core i3 이상
GPU: nVidia GeForce GT 1030 2GB
RAM: 16GB
SSD: 100GB 여유용량

- 이미지 생성시나 보정시에는 HDD 사용해도 되지만, 체크포인트 파일이 최소 2GB 이상이고 커다란 파일은 8GB에 달하기 때문에, 파일 로딩 시간이 30초 내외로 꽤 오래걸린다. (한번 로딩하면 다음 이미지 생성시에는 재사용하므로, 로딩시간이 없다. 따라서 크게 문제될건 아니다) 하지만 체크포인트를 병합하는 등의 작업을 하면 SSD 는 필수다.

- 이미지 생성시 CPU, GPU 사용량은 아래와 같다. GPU 메모리가 부족해 --lowvram 옵션을 주고, 성능 향상을 위해 --xformers 을 주어 실행한 결과다. 1장의 이미지를 생성하는데 기본 옵션 만으로 생성하면 2분 정도, 옵션을 수정하고, 고해상도, 생성 퀄리티를 높이면 30분 넘게도 걸린다. 따라서 새로운 세팅을 찾는건 어렵고, 대신 구글링해서 성공적인 이미지를 생성한 프롬프트를 조금씩 수정해서 사용해보고 있다. 나름 만족해하고 있다.

사용자 삽입 이미지

CPU 사용량


- 사용율을 모니터링 해보면, GPU 사용율이 주기적으로 올라갔다 내려갔다 한다. --lowvram 옵션을 주면 "SYSTEM MEM 데이터 일부를 GPU MEM에 로드 → 계산 → 계산 결과를 SYSTEM MEM에 저장 → SYSTEM MEM 데이터 일부를 GPU MEM에 로드 → 계산 → ..." 이런식으로 진행하기 때문이다. 즉 로드 및 저장시에는 계산하는게 없기 때문에, 사용율이 요동친다. 그리고 이때문에 5배이상 느려진다.

사용자 삽입 이미지

GPU 사용량


-  GPU 는 nVidia GeForce 950 2GB 도 가능할 걸로 생각한다. (해보진 않았다) 그 이하는 안된다. 권장하는 사양은 GPU nVidia GeForce RTX 3060 12GB 이다. 개발자는 nVidia GeForce RTX 3090 을 사용하는걸로 알려져있다.

- GPU 가 nVidia 제품이 아니라면 AVX2 가 지원되는 CPU 만으로도 실행해볼 수 있다. AVX2는 4세대 Core CPU 인 하스웰부터 지원한다. 단 이미지 생성 속도는 사용 못 할 정도로 너무 너무 느리다. 필자도 CPU만 사용해서 이미지 생성에  2시간 기다리다가 그냥 포기했다. 32코어나 64코어를 가진 CPU 라면 해볼만하지 않을까 생각한다.

- 생성해본 이미지를 올리고 싶지만 제대로 생성된게 별로 없다. 정말 정말 손가락을 제대로 못 그린다. 어떻게하던 손가락을 숨기는 포즈로 생성 해야 그나마 봐줄만하다. 아직은 이에 대한 명확한 해결책은 없는 상태다. 현재로써는 그냥 보정하거나, 시드 값을 달리해 손가락이 숨겨지는 포즈를 찾아보는 수밖에 없는 듯.

사용자 삽입 이미지

shuimobysim, girl, woman,bare shoulders, (ecchi:0.5), (trees:0.5), (flowers:0.6) ,(birds:0.2), (bamboo:0.1), lakes, Hangzhou, wuchangshuo, wuchangshuo in background, <lora:Moxin_10:0.8> Negative prompt: EasyNegative, mutated hands, (poorly drawn hands:1.331),(fused fingers:1.61051), (too many fingers:1.61051), bad hands, missing fingers, extra digit Steps: 28, Sampler: DPM++ SDE Karras, CFG scale: 2, Seed: 2643581225, Face restoration: CodeFormer, Size: 512x768, Model hash: 2537d1a815, Model: guofeng3_v32, ENSD: 31337

글쓴시간
분류 기술,IT/하드웨어 정보

nVidia Quadro K2000 - GPU-Z

사용자 삽입 이미지

싼 김에 당근에서 구매해본 GPU. 상당히 오래된 제품이기 때문에 싸긴 싸다. 하지만 드라이버 지원이 2022년 말로 끊겼기 때문에 더이상의 기대를 하면 안된다. GeForce GT 740 와 같은 GK107 칩을 사용하는 제품이다.

사용자 삽입 이미지

GK107 은 아래와 같은 기능을 지원한다.

NVENC: 1st Gen
NVDEC: 1st Gen
PureVideo HD: VP5
VDPAU: Feature Set D

싼김에 사긴 샀는데 케플러 아키텍처를 사용하는거라 조금 아쉽다. AI 학습에 활용할 수 없기 때문이다. 돈 더 들여서 파스칼 아키텍처 사용하는 제품으로 사용했더라면 하는 생각. 그래도 저렴하니 나름 만족한다.

사용자 삽입 이미지

윈도 10을 공식 지원한다. 따라서 작업관리자에 표시된다.

사용자 삽입 이미지

찍고보니 딱 10년 된 제품이다.

글쓴시간
분류 기술,IT
윈도11 0x0000000A IRQL_NOT_LESS_OR_EQUAL 오류

꽤 흔한 윈도11의 블루스크린 오류. "IRQL 이 낮거나 같지 않다"는 의미로 IRQL(Interrupts ReQuest Level)이 낮은 채로 실행 중이었는데 IRQL 이 높은 작업이 요청되었다는 의미다. 윈도 커널에서 이 오류를 처리할 수 없기 때문에 STOP 코드가 걸리고, 그래서 블루스크린이 표시된다. 기본적으로 이 오류는 하드웨어와 윈도 커널간의 통신 문제다.

예전에 1990년대 말 윈도95 시절에는 일주일에 몇번씩 본 오류지만, 지금은 흔하지 않은 오류다. 하드웨어가 IRQ 를 사용하지 않고 작동하도록 디자인되거나, 소프트웨어 IRQ를 사용하는 방향으로 디자인 되기 때문이다.

그런만큼 한번 발생하면 해결하기가 어렵다. 원인 불명이다. 하지만 몇가지 해볼만한게 있다.

- 전원을 완전히 껏다 켜보고 몇 시간동안 아무 작업없이 켜 놓아 보자. 그리고 문제 없으면 그냥 쓰자. 가장 좋은 해결책이다.

- 시스템의 발열을 확인해보자. 열은 모든 PC부품의 적이다. 발열이 있다면 쿨링 솔루션을 변경해보자.

- 시스템에 먼지가 껴 있으면 모두 털어주자. 특히 메모리 슬롯이나 PCIe 슬롯의 먼지는 치명적이나 잘 닦아주자. 접점에 문제가 생기면 하드웨어 오류가 쉽게 발생한다.

- 최근 몇일간 윈도 시스템에 변화를 준게 있으면 롤백해보자. 새로운 장치를 설치하거나, 드라이버를 업데이트하거나, 윈도 업데이트를 설치했으면 업데이트를 취소해보자.

- 윈도 인증 드라이버(WDM 인증 드라이버)가 아닌 미인증 드라이버는 설치하지 말자. 특히 "IRQL_NOT_LESS_OR_EQUAL" 앞에 "DRIVER_" 라는 단어가 있는 경우는 설치된 드라이버 확인해보자.

- 너무 자주 발생해서 못쓰겠다 싶으면 윈도 재설치해보자. 윈도 재설치는 이런 문제를 해결하기 쉬운 방법 중 하나다.

- 필자도 몇일 전에 이 오류를 봤었는데 그때는 노트북 발열이 심했었다. 식혀주고 재시작 하니 다시 발생하지 않았다.

- 또한 필자는 NETIO.SYS 라는 파일에서 발생했다고 나오는 경우도 있었다. 아무래도 네트워크 부분에 문제가 발생하는 듯 하다. 그래서 아래와 같이 드라이버 업데이트 해주었다. 이후엔 발생하지 않았다.

사용자 삽입 이미지

사용자 삽입 이미지