토킹 헤드 비디오
초상화를 프레젠터로 변환하세요 — 하나의 이미지와 보이스 트랙으로 설명 콘텐츠, 공지, 아바타 호스트.
Kling의 토킹 아바타 모델 — 이미지와 오디오 트랙을 립싱크 공연으로 변환.
크레딧에 대해 한 번 지불하십시오. ZOOOP의 모든 모델에서 크레딧을 사용하십시오. · 필요할 때 보충하고 월별 화상을 입지 마십시오.
Powered by Kling AI's API on ZOOOP
캐릭터 이미지와 오디오 트랙을 제공하면, Kling Avatar V2가 해당 캐릭터가 오디오를 말하는 비디오를 동기화된 입과 표정으로 생성합니다.
빠르고 비용 효율적인 테이크에는 표준; 더 높은 충실도에는 Pro. 같은 입력 — 샷의 중요도에 따라 선택하세요.
드라이빙 오디오와 함께 표정과 전달 방향을 잡기 위해 프롬프트를 추가하세요.
비디오 영상 불필요 — 하나의 이미지로 토킹 헤드 공연을 만들 수 있습니다.
초상화를 프레젠터로 변환하세요 — 하나의 이미지와 보이스 트랙으로 설명 콘텐츠, 공지, 아바타 호스트.
일러스트나 생성된 캐릭터에 오디오에 동기화된 말하기 공연을 부여하세요.
로컬라이즈된 버전을 위해 다른 언어의 오디오로 같은 아바타를 구동하세요.
프레젠터를 촬영하지 않고 소셜용 토킹 아바타 클립을 생산하세요.
적절한 도구를 선택하세요. ZOOOP 어디서든 크레딧이 통합니다.
이 페이지에서 Kling Avatar V2를 열거나 비디오 생성기에서 선택하세요.
캐릭터 이미지와 오디오 트랙을 업로드하세요; 표정을 안내하는 프롬프트를 추가하세요.
표준 또는 Pro를 선택하세요.
생성한 뒤 다운로드하거나 캔버스로 보내세요.
Kling Avatar V2는 토킹 아바타 모델입니다: 캐릭터 이미지와 오디오 트랙을 입력하면, 해당 캐릭터가 동기화된 입과 일치하는 표정으로 오디오를 말하는 비디오를 생성합니다. 핵심은 단일 정지 이미지에서 시작한다는 것입니다 — 프레젠터 영상이 필요 없습니다 — 초상화, 일러스트, 생성된 캐릭터가 말하는 공연자가 됩니다.
표준과 Pro 티어로 같은 입력에서 제공됩니다: 빠르고 저렴한 테이크에는 표준, 더 높은 충실도의 최종에는 Pro. 선택적 프롬프트가 드라이빙 오디오와 함께 표정과 전달 방향을 잡습니다.
자연스러운 짝은 TTS 모델입니다: Multilingual V3(또 다른 음성 모델)로 음성을 생성한 뒤, 아바타를 구동해 녹음 없이 완전한 토킹 비디오를 만드세요 — 그리고 오디오 언어를 교체해 로컬라이즈하세요.
잘못된 도구일 때: 이미 비디오 클립이 있고 새 오디오에 입만 재동기화하면 되는 경우, 그것은 Kling Lipsync의 작업입니다. Kling Avatar V2의 영역은 정지 이미지에서 토킹 공연을 생성하는 것입니다.
합리적인 판단 기준: 출발점이 단일 이미지와 오디오 트랙일 때 Kling Avatar V2를 기본으로 쓰세요. 기존 비디오 영상을 재동기화하려면 Kling Lipsync를 사용하세요.
캐릭터 이미지와 오디오 트랙. 해당 캐릭터가 오디오를 동기화된 입과 표정으로 말하는 비디오를 생성합니다. 선택적 프롬프트로 전달 방향을 잡을 수 있습니다.
표준은 더 빠르고 비용 효율적인 티어; Pro는 더 높은 충실도. 같은 입력 — 샷의 중요도에 따라 선택하세요.
Kling Avatar V2는 오디오로 정지 이미지를 구동해 토킹 아바타를 만듭니다. Kling Lipsync는 기존 비디오 클립을 새 오디오에 재동기화합니다. 단일 이미지에서 시작할 때 Avatar V2를 선택하세요.
네 — 먼저 TTS 모델로 음성을 생성한 뒤, 아바타를 구동해 녹음 없이 완전한 토킹 비디오를 만드세요.
이미지*
Audio*
Prompt*