윈디하나의 누리사랑방. 이런 저런 얘기

글쓴시간
분류 기술,IT
AMD 라이젠 마스터(Ryzen Master)

오버클럭시에는 필수라는 소프트웨어라고는 하지만, 4750G CPU 는 PBO 가 지원 안되기 때문에 그동안 사용 안했다. Ryzen CPU 를 모니터링하고 제어할 수 있는 제조사 공식 툴이다.

그래도 한번 설치해보았다. 실행시 나오는 경고문구는 그다지 신경 안 써도 된다.

사용자 삽입 이미지

다른건 HWiNFO 나 CPU-Z 에서 보여주기 때문에 크게 중요지 않지만, 라이젠 마스터에는 CPU 선호도 나오는게 있다. CCD 및 CCX 화면에서 별표와 동그라미로 나온다. 이중 노란색 별표가 가장 성능이 좋은 코어라는 의미다.

언젠가 PBO 지원되는 X 계열 CPU 사고 꼭 해봐야지.
글쓴시간
분류 기술,IT
UEFI 바이오스 화면 캡처

이게 될꺼라고는 생각 못했는데, 우연히 기능을 살펴보다가 알게 되었다.

ASUS 마더보드에 UEFI 바이오스가 들어있는 경우,

1. USB 드라이브를 연결하고
2. F12 를 누르고 USB 드라이브를 선택하면  .bmp 파일로 저장된다.

- 아래와 같이 저장되었다. 해상도는 1024 x 768 이다.

사용자 삽입 이미지

- 도움말을 보니 아래와 같은 키도 되나보다.
사용자 삽입 이미지
글쓴시간
분류 기술,IT
Intel Core2 Quad Q9500 오버클러킹

Core 2 의 오버는 원래 잘 안하는데, (예전에 시도했었지만 실패하기도 했고) Q9500 이 잘된다는 글을 보고 한번 시도해 보았다. 10여년도 더 된 CPU 를 이제와서 오버하는건 의미 없을수도 있겠지만, 결과적으로는 잘 되어서 글을 써본다.

Core 2 의 오버는 주로 FSB 클럭수를 오버한다. 다른건 오버가 안되기 때문이다. 특히 배수락이 걸려있기 때문에 배수락을 조정하는 방법으로는 오버가 되지 않는다.

- 우선 Q9500 의 스펙은 아래와 같이 계산된다.

- BUS: 333 MHz
- FSB: 1333 MHz ( BUS x 4)
- CoreSpeed: 2.83 ( BUS x 8.5)

-> 즉 BUS 클럭만 올리면 나머지는 결정되어있는 셈이다.

- 사용한 메모리는 DDR2-800 메모리다. 2G 씩 4개 풀 뱅크로 사용중이다.

- 순정 스펙인 FSB-1333 - DDR2-800 은 아래와 같다. 252.3 점 - 999.2 점 이다.

사용자 삽입 이미지
사용자 삽입 이미지
사용자 삽입 이미지

- BUS 를 400으로 올렸다. FSB-1600 - DDR2-800 은 아래와 같다. 304.0 점 - 1204.5 점 이다. FSB:DRAM 이 1:1 인게 맘에 든다.

사용자 삽입 이미지
사용자 삽입 이미지
사용자 삽입 이미지

- BUS 를 444으로 올렸다. FSB-1776 - DDR2-888 은 아래와 같다. 335.3 점 - 1328.6 점 이다.
사용자 삽입 이미지
사용자 삽입 이미지
사용자 삽입 이미지

- 메모리를 DDR2-1066 으로 올렸다. FSB-1776 - DDR2-1066 은 아래와 같다. 337.8 - 1335.2 점이다.
사용자 삽입 이미지
사용자 삽입 이미지
사용자 삽입 이미지

- BUS 를 470으로 올렸다. 이렇게 하면 최대 Core Speed 가 4.0 GHz 가 나온다. 부팅은 되었지만 CPU-Z 벤치에는 실패했다. 안하기로 했다.

- 메모리도 DDR2-1333 까지 올려봤지만 바이오스 진입에 실패했다.

- 현재는 FSB-1600 - DDR2-800 사양으로 사용하고 있다.
글쓴시간
분류 기술,IT
인텔이 13, 14세대 K 프로세서에 대한 안정성 이슈업데이트를 발표했습니다.

결과적으로는 안정성을 위해 전력제한 해제하지 말고, 전압 오버하지 않도록 오버클럭하지 말고 쓰라는 것입니다. 그래서 사용자들이 전력제한을 해제하지 않고 써보니, 그렇다면 12세대와 성능차이가 없다고 하네요. 그럼 뭐하러 비싼돈주고 13, 14세대 CPU 쓰냐는 거죠. 화가 단단히 났습니다. 게다가 인터넷 뒤져보니 최근에는 일부러 오버하지 않았는데도 CPU 가 고장난 경우가 있다고 하네요. CPU 의 터보 기능만 적극 사용해도 이슈가 있는거 같아 보이네요.

사용자 삽입 이미지

전문은 아래와 같습니다.

13th and 14th Generation K SKU Processor Instability Issue Update

Intel® has observed that this issue may be related to out of specification operating conditions resulting in sustained high voltage and frequency during periods of elevated heat.
Analysis of affected processors shows some parts experience shifts in minimum operating voltages which may be related to operation outside of Intel® specified operating conditions.

ㆍ While the root cause has not yet been identified, Intel® has observed the majority of reports of this issue are from users with unlocked/overclock capable motherboards.
ㆍ Intel® has observed 600/700 Series chipset boards often set BIOS defaults to disable thermal and power delivery safeguards designed to limit processor exposure to sustained periods of high voltage and frequency, for example:
    – Disabling Current Excursion Protection (CEP)
    – Enabling the IccMax Unlimited bit
    – Disabling Thermal Velocity Boost (TVB) and/or Enhanced Thermal Velocity Boost (eTVB)
    – Additional settings which may increase the risk of system instability:
    – Disabling C-states
    – Using Windows Ultimate Performance mode
    – Increasing PL1 and PL2 beyond Intel® recommended limits

Intel® requests system and motherboard manufacturers to provide end users with a default BIOS profile that matches Intel® recommended settings.

ㆍ Intel® strongly recommends customer’s default BIOS settings should ensure operation within Intel’s recommended settings.
ㆍ In addition, Intel® strongly recommends motherboard manufacturers to implement warnings for end users alerting them to any unlocked or overclocking feature usage.

Intel® is continuing to actively investigate this issue to determine the root cause and will provide additional updates as relevant information becomes available.

Intel® will be publishing a public statement regarding issue status and Intel® recommended BIOS setting recommendations targeted for May 2024.

- 올초에 나온 이야기 중에 인텔CPU 에서 AVX2 명령셋 및 PCIe 레인을 동시에 과도하게 오랫동안 사용하는 경우 오류가 발생하는 경우가 있다고 합니다. 그냥 CPU 가 고장납니다. A/S 받으러 가야했죠. 특히 철권8 이라는 게임에서 쉽게 발견되었다고 합니다.

- 원래 CPU에서 AVX 명령을 수행하면 전력을 많이 소비하고 그만큼 발열이 심해졌습니다. AVX2 로 가면 더 심해지고, AVX512 으로 가면 더 심해지죠. 현재는 AVX 를 사용하는 게임이 많기 때문에 이 이슈가 지금 나오게 된거 같습니다. 그 정점에 철권8 이 있게 된 셈입니다.

사용자 삽입 이미지

- 10년전까지만 해도 인텔 CPU는 AMD CPU에 비해 빠르고 안정적이었습니다. 고장도 없었고 소비전력도 낮고 안정적으로 작동했기 때문에 믿고 쓸 수 있었죠. 특히 서버 제품군에는 인텔 외에는 생각도 하지 않았습니다. 하지만 어느샌가 CPU 에 고장이 많아지고 있었고 인텔도 예외는 아니었습니다. AMD는 원래 드물게 고장이 있었고 그냥 그러려니 했었는데, 결국 저도 고장난 G4560 (카비레이크) 를 하나 가지게 되었습니다. CPU가 원래 고장이 잘 나는게 아니라 중고거래가 활발한 편인데, 이번엔 그렇지 않나 보네요. 전 다행이 그런 비싼 인텔 CPU는 못쓰고, 저렴한 AMD CPU나 쓰고 있습니다. AMD CPU 가 더 안정적이라는건 정말 오랜만에 느껴보네요.

사용자 삽입 이미지


----

https://www.igorslab.de/en/intel-releases-the-13th-and-14th-generation-k-sku-processor-instability-issue-update/
글쓴시간
분류 기술,IT/스테이블 디퓨전
nVidia GT 1030 (2GB VRAM) 으로 Stable Diffusion WebUI 사용하기

※ 여러가지 시행착오끝에 아래와 같은 512x768 이미지를 GT 1030 에서 2분대에 생성할 수 있도록 했다. 작년 이맘때 생성한게 10분 대였다는걸 감안하면 많은 발전이다. 그만큼 기술이 늘었다는 셈이다. 이 방법은 아마도 2G VRAM 을 가진 모든 nVidia 계열에서 사용할 수 있을거 같다.

사용자 삽입 이미지

※ 하는 방법을 적어 놓는다.

1. Ubuntu 22.04 를 설치하고 nVidia 그래픽 카드 드라이버를 설치한다. 이 글을 쓰는 시점에서 드라이버 버전은 550.67 이다. 윈도에서는 이 방법이 되지 않는다.

2. OS 가 띄워진 후에도 VRAM 2GB 를 온전히 비워질 수 있도록 한다. 필자의 경우 모니터 연결은 내장 그래픽을 사용했다.

3. Stable Diffusion WebUI 를 설치하고 실행한다. 옵션은 "--medvram --listen --xformers" 을 준다.

glibc version is 2.35
Check TCMalloc: libtcmalloc_minimal.so.4
libtcmalloc_minimal.so.4 is linked with libc.so,execute LD_PRELOAD=/lib/x86_64-linux-gnu/libtcmalloc_minimal.so.4
Python 3.10.12 (main, Nov 20 2023, 15:14:05) [GCC 11.4.0]
Version: v1.9.0
Commit hash: adadb4e3c7382bf3e4f7519126cd6c70f4f8557b
Launching Web UI with arguments: --medvram --listen --xformers
Loading weights [********] from Model.safetensors
Running on local URL:  http://0.0.0.0:7860

To create a public link, set `share=True` in `launch()`.
Startup time: 7.1s (prepare environment: 1.4s, import torch: 2.4s, import gradio: 0.6s, setup paths: 1.2s, import ldm: 0.1s, initialize shared: 0.1s, other imports: 0.3s, list SD models: 0.1s, load scripts: 0.4s, create ui: 0.4s).
Creating model from config: /home/windy/stable-diffusion-webui/configs/v1-inference.yaml
Applying attention optimization: xformers... done.
Model loaded in 1.6s (load weights from disk: 0.5s, create model: 0.3s, apply weights to model: 0.5s, calculate empty prompt: 0.2s).

4. 이미지를 생성한다. 아래 화면 참조하자. 네거티브 프롬프트가 반드시 75토큰을 초과해야한다. (왜그래야 하는지는 모르겠다)

사용자 삽입 이미지


4-1. 아래와 같이 화면에 표시된다.

100%|████████████████████████████████████████████████████████| 24/24 [02:33<00:00,  6.40s/it]
Total progress: 100%|██████████████████████████████████████████████| 24/24 [02:36<00:00,  6.54s/it]
Total progress: 100%|██████████████████████████████████████████████| 24/24 [02:36<00:00,  6.36s/it]

4-2. VRAM 사용량은 아래와 같다. 1952 MB 사용한다.

+-----------------------------------------------------------------------------------------+
| NVIDIA-SMI 550.67                 Driver Version: 550.67         CUDA Version: 12.4     |
|-----------------------------------------+------------------------+----------------------+
| GPU  Name                 Persistence-M | Bus-Id          Disp.A | Volatile Uncorr. ECC |
| Fan  Temp   Perf          Pwr:Usage/Cap |           Memory-Usage | GPU-Util  Compute M. |
|                                         |                        |               MIG M. |
|=========================================+========================+======================|
|   0  NVIDIA GeForce GT 1030         Off |   00000000:01:00.0 Off |                  N/A |
| N/A   53C    P0             N/A /   19W |    1955MiB /   2048MiB |    100%      Default |
|                                         |                        |                  N/A |
+-----------------------------------------+------------------------+----------------------+

+-----------------------------------------------------------------------------------------+
| Processes:                                                                              |
|  GPU   GI   CI        PID   Type   Process name                              GPU Memory |
|        ID   ID                                                               Usage      |
|=========================================================================================|
|    0   N/A  N/A      5895      C   python3                                      1952MiB |
+-----------------------------------------------------------------------------------------+


4-3. 생성 완료된 후 나오는 텍스트는 아래와 같다.

best quality, masterpiece, 1girl

Negative prompt: ng_deepnegative_v1_75t, EasyNegativeV2, bad_prompt_version2,
Steps: 24, Sampler: DPM++ 2M SDE Heun, Schedule type: Karras, CFG scale: 7, Seed: 1121270688, Size: 512x768, Model hash: ********, Model: Model, Clip skip: 2, Version: v1.9.0

Time taken: 2 min. 44.3 sec.

A: 1.78 GB, R: 1.83 GB, Sys: 1.9/1.94531 GB (98.1%)

5. 정말 아슬아슬하게 생성되는 셈이다. 단 이렇게 하면 배치로는 못 생성한다. --lowvram 과 아닌건 성능 차이가 많기 때문에 필자는 이렇게 사용하고 있다.