바이트댄스, AI 영상 모델 시댄스 2.0 공개
중국의 인공지능(AI) 영상 생성 모델 시댄스(Seedance) 2.0이 공개됐습니다. 바이트댄스에 따르면 시댄스 2.0은 영상과 오디오의 동시 생성 듀얼 브랜치 확산 트랜스포머(Dual-branch Diffusion Transformer) 아키텍처를 채택해 텍스트나 이미지를 기반으로 영화급 영상을 제작할 수 있습니다.
주요 기능
- 텍스트 또는 이미지 입력으로 60초 이내 원본 오디오 포함 멀티샷 시퀀스 영상 생성
- 독자적인 멀티샷 스토리텔링 기능: 하나의 프롬프트로 연관된 여러 장면 자동 생성
- 장면 전환 과정에서 인물, 시각적 스타일, 분위기 일관성 유지
- 텍스트·이미지·오디오·영상 콘텐츠 동시 처리 가능
업계 반응
미국 감독 및 제작자들은 시댄스 2.0을 테스트한 영상과 소감을 공유하며 높은 평가를 내렸습니다. 찰스 커런 미국 다큐멘터리 감독은 단 20분 만에 1분 24초 분량의 영화 예고편을 제작했으며 비용은 60달러밖에 들지 않았다고 밝혔습니다. 일론 머스크는 “발전 속도가 너무 빠르다”고 평했고, AI 영상 제작 전문가들은 “영화 제작의 미래를 완전히 바꿀 수도 있다”고 언급했습니다.
시사점
시댄스 2.0의 출시는 영상 콘텐트 제작의 전환점이 될 것으로 전망됩니다. 텍스트 생성 중심의 거대언어모델(LLM) 이후 영상·이미지 생성 파운데이션 모델이 AI 기술 발전의 다음 단계로 부상하고 있으며, 시댄스 2.0은 그 시점을 앞당겼다는 평가입니다.
이 게시물은 AI 기반 뉴스 수집 및 요약 시스템을 통해 자동 생성되었습니다.