AI 數位人

什麼是 AI 數位人？

AI 數位人可以把一張頭像圖片和一段音訊合成為會說話的數位人影片。上傳人物圖片並選擇音訊後，Voicv 會依照聲音驅動口型與表情。

音訊可以來自已完成的 TTS 結果，也可以直接上傳自己的音訊檔。選擇 TTS 時會顯示對應文案；上傳音訊時則直接以音訊生成影片。

數位人影片會依實際音訊長度和解析度扣除影片積分。720p 適合快速預覽，1080p 適合更清晰的正式影片。

準備一張頭像圖片和一段音訊，就能在 Voicv 中生成可播放、可下載的數位人影片。

上傳自己的頭像圖片，或使用頁面提供的範本圖片。建議使用光線清楚、臉部无遮挡、正面或接近正面的圖片。

選擇已完成的 TTS 音訊並試聽，或上傳 MP3、WAV、AAC、OGG、WebM 音訊檔。

選擇 720p 或 1080p，也可以在進階選項中調整 Video prompt，以控制鏡頭、姿態和動作風格。

提交任務後，在最近任務中查看進度。完成後可以播放、下載或刪除結果。

Voicv 將頭像、音訊、積分和任務記錄整合在同一個流程中。

不需要拍攝真人影片，只要一張人物圖和一段聲音，就能快速製作講解、課程、口播和社群內容。

可以重用 Voicv 已完成的 TTS，也可以上傳自己的錄音。兩種來源都使用同一套影片生成流程。

影片積分依音訊整數秒計費：720p 每秒 3,000 credits，1080p 每秒 5,000 credits。不足 1 秒以 1 秒計。

最近任務會保留在頁面中，方便查看狀態、播放成片、下載影片或清理舊結果。

了解頭像圖片、音訊來源、積分扣除、解析度和生成結果。

應該上傳什麼樣的頭像圖片？

建議使用清楚的人像圖片，臉部可見、无遮挡、光線自然。正面或接近正面的圖片通常更穩定。

可以使用 TTS 音訊和自己上傳的音訊嗎？

可以。你可以選擇已完成的 Voicv TTS 音訊，也可以直接上傳本地音訊檔。上傳音訊模式不需要文案。

為什麼選擇 TTS 後文案不能修改？

文案來自選中的 TTS 結果，保持唯讀可避免顯示文案和實際用於影片的音訊不一致。

影片積分如何計算？

系統會依選中或上傳音訊的整數秒計費。720p 每秒 3,000 credits，1080p 每秒 5,000 credits，不足 1 秒以 1 秒計。

720p 和 1080p 怎麼選？

720p 適合快速預覽和輕量分享；1080p 適合正式發布、客戶交付或需要更高清晰度的場景。

生成數位人影片需要多久？

耗時取決於音訊長度、解析度和佇列狀態。短音訊通常會在任務列表中很快完成。

如果生成失敗會怎樣？

如果影片生成失敗且已扣除影片積分，系統會依任務狀態退還影片積分。原 TTS 結果不會被修改。

生成的影片可以商用嗎？

是否可商用取決於你的方案、頭像圖片權利和音訊權利。請確認你有權使用上傳的人像和錄音。

上傳頭像圖片，選擇 TTS 音訊或上傳自己的音訊，快速建立 AI 數位人。