AI 數位人

文案来自选中的 TTS 音频,生成视频时会直接使用该音频。

影片積分依音訊整數秒計費:720p 每秒 3,000 credits,1080p 每秒 5,000 credits。音訊時長必須大於 1 秒。

什麼是 AI 數位人?

AI 數位人可以把一張頭像圖片和一段音訊合成為會說話的數位人影片。上傳人物圖片並選擇音訊後,Voicv 會依照聲音驅動口型與表情。

音訊可以來自已完成的 TTS 結果,也可以直接上傳自己的音訊檔。選擇 TTS 時會顯示對應文案;上傳音訊時則直接以音訊生成影片。

數位人影片會依實際音訊長度和解析度扣除影片積分。720p 適合快速預覽,1080p 適合更清晰的正式影片。

4 個步驟生成數位人影片

準備一張頭像圖片和一段音訊,就能在 Voicv 中生成可播放、可下載的數位人影片。

1

第一步:選擇頭像圖片

上傳自己的頭像圖片,或使用頁面提供的範本圖片。建議使用光線清楚、臉部无遮挡、正面或接近正面的圖片。

2

第二步:選擇或上傳音訊

選擇已完成的 TTS 音訊並試聽,或上傳 MP3、WAV、AAC、OGG、WebM 音訊檔。

3

第三步:設定影片選項

選擇 720p 或 1080p,也可以在進階選項中調整 Video prompt,以控制鏡頭、姿態和動作風格。

4

第四步:生成並下載

提交任務後,在最近任務中查看進度。完成後可以播放、下載或刪除結果。

為什麼用 Voicv 生成數位人影片?

Voicv 將頭像、音訊、積分和任務記錄整合在同一個流程中。

圖片加音訊即可生成

不需要拍攝真人影片,只要一張人物圖和一段聲音,就能快速製作講解、課程、口播和社群內容。

支援 TTS 和上傳音訊

可以重用 Voicv 已完成的 TTS,也可以上傳自己的錄音。兩種來源都使用同一套影片生成流程。

積分規則清楚

影片積分依音訊整數秒計費:720p 每秒 3,000 credits,1080p 每秒 5,000 credits。不足 1 秒以 1 秒計。

任務記錄與下載

最近任務會保留在頁面中,方便查看狀態、播放成片、下載影片或清理舊結果。

AI 數位人的常見問題

了解頭像圖片、音訊來源、積分扣除、解析度和生成結果。

應該上傳什麼樣的頭像圖片?

建議使用清楚的人像圖片,臉部可見、无遮挡、光線自然。正面或接近正面的圖片通常更穩定。

可以使用 TTS 音訊和自己上傳的音訊嗎?

可以。你可以選擇已完成的 Voicv TTS 音訊,也可以直接上傳本地音訊檔。上傳音訊模式不需要文案。

為什麼選擇 TTS 後文案不能修改?

文案來自選中的 TTS 結果,保持唯讀可避免顯示文案和實際用於影片的音訊不一致。

影片積分如何計算?

系統會依選中或上傳音訊的整數秒計費。720p 每秒 3,000 credits,1080p 每秒 5,000 credits,不足 1 秒以 1 秒計。

720p 和 1080p 怎麼選?

720p 適合快速預覽和輕量分享;1080p 適合正式發布、客戶交付或需要更高清晰度的場景。

生成數位人影片需要多久?

耗時取決於音訊長度、解析度和佇列狀態。短音訊通常會在任務列表中很快完成。

如果生成失敗會怎樣?

如果影片生成失敗且已扣除影片積分,系統會依任務狀態退還影片積分。原 TTS 結果不會被修改。

生成的影片可以商用嗎?

是否可商用取決於你的方案、頭像圖片權利和音訊權利。請確認你有權使用上傳的人像和錄音。

開始生成你的數位人影片

上傳頭像圖片,選擇 TTS 音訊或上傳自己的音訊,快速建立 AI 數位人。

立即生成數位人影片