Ugcai
AI-powered content creation platform that generates professional influencer videos, avatars, images with pose variations, and character outfits from text. Features batch processing, video merging, collections, analytics, and supports multiple TTS and video generation providers. Create high-quality UGC content instantly..
Install / Use
/learn @265barancan/UgcaiREADME
AI UGC Video Generator
Replicate API ve çoklu TTS sağlayıcıları kullanarak metin ile AI tabanlı influencer videoları oluşturan web uygulaması.
🎙️ Seslendirme (TTS) Sağlayıcıları
Uygulama birden fazla TTS (Text-to-Speech) sağlayıcısını destekler:
1. Edge TTS (Önerilen - Tamamen Ücretsiz) 🌐
- Ücretsiz: Evet, sınırsız kullanım
- API Key: Gerekmez
- Kalite: Yüksek
- Diller: 100+ dil (Türkçe dahil)
- Kurulum: Hiçbir şey gerekmez, varsayılan olarak kullanılabilir
2. Google Cloud Text-to-Speech 🔊
- Ücretsiz Tier: Ayda 1-4 milyon karakter
- API Key: Gerekli
- Kalite: Çok yüksek (WaveNet teknolojisi)
- Diller: 50+ dil, 380+ ses
- Kurulum:
- Google Cloud Console üzerinden proje oluşturun
- Text-to-Speech API'yi etkinleştirin
- API key oluşturun
.envdosyasına ekleyin:GOOGLE_TTS_API_KEY=your_key_here
3. Azure Speech Service ☁️
- Ücretsiz Tier: Ayda 500.000 karakter
- API Key: Gerekli
- Kalite: Yüksek
- Diller: 119 dil, 270+ ses
- Kurulum:
- Azure Portal üzerinden Speech Service oluşturun
- API key ve region alın
.envdosyasına ekleyin:AZURE_SPEECH_KEY=your_key_here AZURE_SPEECH_REGION=eastus
4. ElevenLabs 🎙️
- Ücretsiz Tier: Sınırlı (aylık ücretsiz karakter)
- API Key: Gerekli
- Kalite: Çok yüksek (AI ses klonlama)
- Diller: Çoklu dil desteği
- Kurulum:
- ElevenLabs hesabı oluşturun
- API key alın: https://elevenlabs.io/app/settings/api-keys
.envdosyasına ekleyin:ELEVENLABS_API_KEY=your_key_here
🚀 Kurulum
1. Bağımlılıkları Yükleyin
npm install
# veya
yarn install
2. Environment Variables
.env dosyası oluşturun ve aşağıdaki değişkenleri ekleyin:
# Video Generation (Gerekli - En az bir tanesi)
REPLICATE_API_TOKEN=your_replicate_token_here
# veya
FAL_API_KEY=your_fal_key_here # Fal.ai için (günlük 100 ücretsiz istek)
# veya
HUGGINGFACE_API_KEY=your_hf_key_here # Hugging Face için (opsiyonel, günlük 1000 ücretsiz istek)
# TTS (Text-to-Speech) - Opsiyonel (Edge TTS ücretsiz ve API key gerektirmez)
ELEVENLABS_API_KEY=your_elevenlabs_key_here # ElevenLabs için
GOOGLE_TTS_API_KEY=your_google_tts_key_here # Google Cloud TTS için
AZURE_SPEECH_KEY=your_azure_speech_key_here # Azure Speech için
AZURE_SPEECH_REGION=eastus # Azure region (varsayılan: eastus)
# Diğer Ayarlar
ELEVENLABS_VOICE_ID=default_voice_id_here # Opsiyonel: Belirtmezseniz varsayılan ses kullanılır
NEXT_PUBLIC_APP_URL=http://localhost:3000
# AI Model API Keys (Opsiyonel - AI özellikleri için)
GEMINI_API_KEY=your_gemini_key_here # Google Gemini için
GROK_API_KEY=your_grok_key_here # xAI Grok için
DEEPSEEK_API_KEY=your_deepseek_key_here # DeepSeek için
Not:
.envdosyası.gitignore'da olduğu için git'e commit edilmeyecektir.ELEVENLABS_VOICE_IDopsiyoneldir. Belirtmezseniz varsayılan ses (Rachel) kullanılır.- Farklı bir ses kullanmak isterseniz ElevenLabs'den Voice ID alıp buraya ekleyebilirsiniz.
API Key'leri Nasıl Alınır:
Video Generation:
- Replicate: https://replicate.com/account/api-tokens
- Fal.ai: https://fal.ai/dashboard/keys
- Hugging Face: https://huggingface.co/settings/tokens
Text-to-Speech (TTS):
- Edge TTS: API key gerekmez (tamamen ücretsiz) ✅
- ElevenLabs: https://elevenlabs.io/app/settings/api-keys
- Google Cloud TTS: https://console.cloud.google.com/apis/credentials
- Azure Speech: https://portal.azure.com/ → Speech Service oluşturun
AI Models:
- Google Gemini: https://makersuite.google.com/app/apikey
- Grok (xAI): https://console.x.ai/
- DeepSeek: https://platform.deepseek.com/api_keys
- Fal.ai: https://fal.ai/dashboard (günlük 100 ücretsiz istek)
- Hugging Face: https://huggingface.co/settings/tokens (opsiyonel, günlük 1000 ücretsiz istek)
3. Development Server'ı Başlatın
npm run dev
# veya
yarn dev
Tarayıcınızda http://localhost:3000 adresini açın.
📖 Kullanım
- Ana sayfada metin girişi alanına video için istediğiniz metni yazın
- Seslendirme Servisi seçin (Edge TTS, Google Cloud TTS, Azure Speech veya ElevenLabs)
- Ses seçin (seçtiğiniz servise göre sesler listelenir)
- Video Oluşturma Servisi seçin (Replicate, Fal.ai veya Hugging Face)
- Video ayarlarını yapın (süre, çözünürlük, stil)
- "Video Oluştur" butonuna tıklayın
- Sistem önce sesi oluşturur, ardından videoyu oluşturur
- Oluşturulan videoyu önizleyebilir ve indirebilirsiniz
🎵 Ses Senkronizasyonu
Replicate (Google Veo 3.1) ses senkronizasyonunu destekler:
- ✅ Oluşturulan ses dosyası video ile otomatik olarak senkronize edilir
- ✅ Video, ses ile uyumlu hareketler ve ifadeler içerir
- ✅ Ses ve video birlikte oluşturulur, sonradan birleştirme gerekmez
Fal.ai ve Hugging Face:
- ⚠️ Bu servislerde ses desteği sınırlıdır veya model bazlıdır
- ⚠️ Ses dosyası oluşturulur ancak video ile otomatik senkronizasyon olmayabilir
- ⚠️ Video ve ses ayrı ayrı oluşturulur, manuel birleştirme gerekebilir
💡 Öneri: En iyi ses senkronizasyonu için Replicate (Google Veo 3.1) kullanın.
🛠️ Teknolojiler
- Next.js 14 - React framework
- TypeScript - Type safety
- Tailwind CSS - Styling
- Replicate API - Video generation
- ElevenLabs API - Text-to-Speech
- FFmpeg - Video processing (client-side ve server-side desteği)
✂️ Video İşleme (Trim & Export)
Uygulama hem client-side hem de server-side video işleme desteği sunar:
Client-Side (Varsayılan - Önerilen)
- ✅ FFmpeg.wasm kullanır - tarayıcıda çalışır
- ✅ Sunucu kurulumu gerektirmez
- ✅ Her zaman çalışır
- ✅ Video trim ve export özellikleri mevcuttur
Server-Side (Opsiyonel)
- ⚙️ fluent-ffmpeg kullanır - sunucuda çalışır
- ⚙️ Sunucuda FFmpeg binary'si gerektirir
- ⚙️ Daha hızlı işleme (büyük dosyalar için)
- ⚙️ Kurulum:
# macOS brew install ffmpeg # Ubuntu/Debian sudo apt-get install ffmpeg # Windows # https://ffmpeg.org/download.html adresinden indirin
Not: Server-side FFmpeg yoksa, uygulama otomatik olarak client-side çözümü kullanır.
📝 Notlar
- Video oluşturma işlemi birkaç dakika sürebilir
- API kullanım limitlerinize dikkat edin
- Local ortamda çalışmak için tasarlanmıştır
- Video trim ve export özellikleri client-side FFmpeg ile çalışır (sunucu kurulumu gerekmez)
🔧 Geliştirme
# Development
npm run dev
# Build
npm run build
# Production
npm start
# Lint
npm run lint
