سئووبتیمایزر – این ابزار جدید با نام Sound Effects می‌تواند تا ۲۲ ثانیه صوت را بر اساس پرامپت‌های کاربر تولید کند که امکان ترکیب آن با پلتفرم صوتی و موسیقی شرکت وجود دارد تا حداقل چهار گزینه کلیپ صوتی قابل دانلود در اختیار کاربر قرار گیرد.

شرکت نرم‌افزاری ElevenLabs تاکنون ورژن‌های تولید شده توسط هوش مصنوعی از صداها و موسیقی انسانی را ارائه داده است. اکنون این شرکت برای کاربران این امکان را فراهم آورده است که جلوه‌های صوتی برای پادکست‌ها، فیلم‌ها یا بازی‌ها نیز بسازند.

 

به گزارش
سئووبتیمایزر
و به نقل از
ورج
، این ابزار جدید با نام Sound Effects می‌تواند تا ۲۲ ثانیه صوت را بر اساس پرامپت‌های کاربر تولید کند که امکان ترکیب آن با پلتفرم صوتی و موسیقی شرکت وجود دارد تا حداقل چهار گزینه کلیپ صوتی قابل دانلود در اختیار کاربر قرار گیرد.

بخوانید  کارکنان فعال حوزه هوش مصنوعی خواستار حمایت‌های قوی‌تر از سوت‌زن‌ها شدند

 

این شرکت می‌گوید که با پلتفرم رسانه‌ای شاتراستاک (Shutterstock) برای ساختن یک کتابخانه و آموزش مدل آن بر روی کلیپ‌های صوتی خود همکاری را آغاز کرده است. شاتراستاک مجوز کتابخانه‌های محتوای خود را به بسیاری از شرکت‌های هوش مصنوعی از جمله OpenAI، متا و گوگل داده است.

 

استفاده از ابزار Sound Effects رایگان است، اما در نسخه پولی آن امکان استفاده از کلیپ‌های صوتی تولید شده با مجوزهای تجاری نیز وجود دارد، در حالی که کاربران نسخه رایگان «باید ElevenLabs با درج «elevenlabs.io» در عنوان انتساب دهند.» کاربران ElevenLabs دارای محدودیت تعداد کاراکتر در هنگام نوشتن پرامپت‌ها هستند که برای کاربران رایگان 10000 کاراکتر در ماه است. ElevenLabs در صفحه پرسش‌های متداول خود توضیح داده است که که اگر کاربران مدت زمان کلیپ صوتی را در این ابزار خودشان تنظیم کنند، 40 کاراکتر در ثانیه از این سهمیه کسر خواهد شد. اگر از مدت زمان پیش‌فرض برای صوت موردنظرتان استفاده کنید، برای هر پراپمپت 200 کاراکتر کسر خواهد شد.

بخوانید  تغییرات اساسی در iOS 18

 

کتابخانه‌های کلیپ‌های جلوه‌های صوتی در حال حاضر در بازار برای تولیدکنندگان محتوا، فیلم‌سازان و توسعه‌دهندگان بازی‌های ویدیویی وجود دارند. اما گاهی اوقات اینها ممکن است گران باشند یا در پخش صدای مناسب با مشکل مواجه شوند. ElevenLabs در پست وبلاگ خود گفته است که Sound Effects را «برای تولید سریع، مقرون به صرفه و در مقیاس وسیع منظره‌های صوتی غنی و غوطه‌ورکننده» طراحی کرده است.