AI 數位人
什麼是 AI 數位人?
AI 數位人可以把一張頭像圖片和一段音訊合成為會說話的數位人影片。上傳人物圖片並選擇音訊後,Voicv 會依照聲音驅動口型與表情。
音訊可以來自已完成的 TTS 結果,也可以直接上傳自己的音訊檔。選擇 TTS 時會顯示對應文案;上傳音訊時則直接以音訊生成影片。
數位人影片會依實際音訊長度和解析度扣除影片積分。720p 適合快速預覽,1080p 適合更清晰的正式影片。
4 個步驟生成數位人影片
準備一張頭像圖片和一段音訊,就能在 Voicv 中生成可播放、可下載的數位人影片。
第一步:選擇頭像圖片
上傳自己的頭像圖片,或使用頁面提供的範本圖片。建議使用光線清楚、臉部无遮挡、正面或接近正面的圖片。
第二步:選擇或上傳音訊
選擇已完成的 TTS 音訊並試聽,或上傳 MP3、WAV、AAC、OGG、WebM 音訊檔。
第三步:設定影片選項
選擇 720p 或 1080p,也可以在進階選項中調整 Video prompt,以控制鏡頭、姿態和動作風格。
第四步:生成並下載
提交任務後,在最近任務中查看進度。完成後可以播放、下載或刪除結果。
為什麼用 Voicv 生成數位人影片?
Voicv 將頭像、音訊、積分和任務記錄整合在同一個流程中。
圖片加音訊即可生成
不需要拍攝真人影片,只要一張人物圖和一段聲音,就能快速製作講解、課程、口播和社群內容。
支援 TTS 和上傳音訊
可以重用 Voicv 已完成的 TTS,也可以上傳自己的錄音。兩種來源都使用同一套影片生成流程。
積分規則清楚
影片積分依音訊整數秒計費:720p 每秒 3,000 credits,1080p 每秒 5,000 credits。不足 1 秒以 1 秒計。
任務記錄與下載
最近任務會保留在頁面中,方便查看狀態、播放成片、下載影片或清理舊結果。
AI 數位人的常見問題
了解頭像圖片、音訊來源、積分扣除、解析度和生成結果。
應該上傳什麼樣的頭像圖片?
建議使用清楚的人像圖片,臉部可見、无遮挡、光線自然。正面或接近正面的圖片通常更穩定。
可以使用 TTS 音訊和自己上傳的音訊嗎?
可以。你可以選擇已完成的 Voicv TTS 音訊,也可以直接上傳本地音訊檔。上傳音訊模式不需要文案。
為什麼選擇 TTS 後文案不能修改?
文案來自選中的 TTS 結果,保持唯讀可避免顯示文案和實際用於影片的音訊不一致。
影片積分如何計算?
系統會依選中或上傳音訊的整數秒計費。720p 每秒 3,000 credits,1080p 每秒 5,000 credits,不足 1 秒以 1 秒計。
720p 和 1080p 怎麼選?
720p 適合快速預覽和輕量分享;1080p 適合正式發布、客戶交付或需要更高清晰度的場景。
生成數位人影片需要多久?
耗時取決於音訊長度、解析度和佇列狀態。短音訊通常會在任務列表中很快完成。
如果生成失敗會怎樣?
如果影片生成失敗且已扣除影片積分,系統會依任務狀態退還影片積分。原 TTS 結果不會被修改。
生成的影片可以商用嗎?
是否可商用取決於你的方案、頭像圖片權利和音訊權利。請確認你有權使用上傳的人像和錄音。
開始生成你的數位人影片
上傳頭像圖片,選擇 TTS 音訊或上傳自己的音訊,快速建立 AI 數位人。