윈디하나의 누리사랑방. 이런 저런 얘기

글쓴시간
분류 기술,IT
동영상 생성 AI - Wan 2.1

Wan 2.1 는 중국의 알리바바그룹의 통 연구소에서 개발한 시각모델이다. 주로 동영상을 생성하는 AI 으로 잘 알려져 있고 오픈소스로 공개되어있기 때문에 현재는 매우 핫해졌다.

나온지는 꽤 되었지만 이제서야 돌려 보았다. 내 PC 사양에서 720p 동영상은 무리지만, 480p 영상은 생성 가능할것으로 생각된다. 조금 기다리긴 해야 하지만 말이다. RTX 2060 12G 에서 아래 영상 생성하는데 약 30 분 걸렸다. GPU 온도가 60도 미만인것으로 보아 VRAM 이 매우 부족해 보인다. 뭔가 튜닝을 해야할 듯.

파라메터가 14B 와 1.3B 모델이 있는데, 14B 모델을 그대로는 못 돌린다. 너무 느리다. 양자화한걸로 하긴 했는데 성능은 다행이도 그대로인거 같다. 샘플 만큼의 영상이 나온다.

잠재영역(Latent)을 사용하는건 SD와 같은데, 이를 동영상 생성에 맞게 튜닝했다. 그래서인지 굉장히 빠르다.

사용하려면 반드시 ComfyUI 를 사용해야 한다. 최신버전을 설치하고, 모델 4개를 받아 지정된 곳에 넣어주면 준비는 끝. 비디오 메모리가 12G 이기 때문에 조금 많이 기다리긴 해야 하지만 어쨌든 생성은 된다.

사용자 삽입 이미지

사용 방법은 Wan2.1 ComfyUI Workflow 에 잘 설명되어있으니 생략.

처음 치고는 잘 만들었다고 자찬중이다. (이후에도 몇개 더 만들었긴 하지만, 모두 이것보다는 잘 안나왔다) 어쨌든 동영상 생성시에도 좋은 이미지가 필요하다는건 알게 되었다.