- 글쓴시간
- 분류 기술,IT
Wan 2.1 는 중국의 알리바바그룹의 통 연구소에서 개발한 시각모델이다. 주로 동영상을 생성하는 AI 으로 잘 알려져 있고 오픈소스로 공개되어있기 때문에 현재는 매우 핫해졌다.
나온지는 꽤 되었지만 이제서야 돌려 보았다. 내 PC 사양에서 720p 동영상은 무리지만, 480p 영상은 생성 가능할것으로 생각된다. 조금 기다리긴 해야 하지만 말이다. RTX 2060 12G 에서 아래 영상 생성하는데 약 30 분 걸렸다. GPU 온도가 60도 미만인것으로 보아 VRAM 이 매우 부족해 보인다. 뭔가 튜닝을 해야할 듯.
파라메터가 14B 와 1.3B 모델이 있는데, 14B 모델을 그대로는 못 돌린다. 너무 느리다. 양자화한걸로 하긴 했는데 성능은 다행이도 그대로인거 같다. 샘플 만큼의 영상이 나온다.
잠재영역(Latent)을 사용하는건 SD와 같은데, 이를 동영상 생성에 맞게 튜닝했다. 그래서인지 굉장히 빠르다.
사용하려면 반드시 ComfyUI 를 사용해야 한다. 최신버전을 설치하고, 모델 4개를 받아 지정된 곳에 넣어주면 준비는 끝. 비디오 메모리가 12G 이기 때문에 조금 많이 기다리긴 해야 하지만 어쨌든 생성은 된다.

사용 방법은 Wan2.1 ComfyUI Workflow 에 잘 설명되어있으니 생략.
처음 치고는 잘 만들었다고 자찬중이다. (이후에도 몇개 더 만들었긴 하지만, 모두 이것보다는 잘 안나왔다) 어쨌든 동영상 생성시에도 좋은 이미지가 필요하다는건 알게 되었다.