윈디하나의 블로그 :: 동영상 생성 AI

글쓴시간 2025/03/30 22:17

동영상 생성 AI - Wan 2.1

Wan 2.1 는 중국의 알리바바그룹의 통이 연구소에서 개발한 시각모델이다. 주로 동영상을 생성하는 AI 으로 잘 알려져 있고 오픈소스로 공개되어있기 때문에 현재는 매우 핫해졌다.

나온지는 꽤 되었지만 이제서야 돌려 보았다. 내 PC 사양에서 720p 동영상은 무리지만, 480p 영상은 생성 가능할것으로 생각된다. 조금 기다리긴 해야 하지만 말이다. RTX 2060 12G 에서 아래 영상 생성하는데 약 30 분 걸렸다. GPU 온도가 60도 미만인것으로 보아 VRAM 이 매우 부족해 보인다. 뭔가 튜닝을 해야할 듯.

파라메터가 14B 와 1.3B 모델이 있는데, RTX 2060 12G 에서 14B 모델을 그대로는 못 돌린다. 너무 느리다. 양자화한걸로 실행하긴 했는데 성능은 다행이도 그대로인거 같다. 샘플 만큼의 영상이 나온다.

잠재영역(Latent)을 사용하는건 SD와 같은데, 이를 동영상 생성에 맞게 튜닝했다. 그래서인지 굉장히 빠르다.

사용하려면 반드시 ComfyUI 를 사용해야 한다. 최신버전을 설치하고, 모델 4개를 받아 지정된 곳에 넣어주면 준비는 끝. 비디오 메모리가 12G 이기 때문에 조금 많이 기다리긴 해야 하지만 어쨌든 생성은 된다.

사용 방법은 Wan2.1 ComfyUI Workflow 에 잘 설명되어있으니 생략.

처음 치고는 잘 만들었다고 자찬중이다. (이후에도 몇개 더 만들었긴 하지만, 모두 이것보다는 잘 안나왔다) 어쨌든 동영상 생성시에도 좋은 이미지가 필요하다는건 알게 되었다.

----

2025.08.01 추가

Wan 2.2 가 나왔다. 2.1가 비슷하긴 한데, 좀 더 부드럽고 그럴듯하게 생성해준다. 당연히 써야 한다.

https://github.com/Wan-Video/Wan2.2

일	월	화	수	목	금	토
	1	2	3	4	5	6
7	8	9	10	11	12	13
14	15	16	17	18	19	20
21	22	23	24	25	26	27
28	29	30