مدل Zonos-v0.1 یک مدل پیشرفته تبدیل متن به گفتار (TTS) open-weight است که بر روی بیش از ۲۰۰ هزار ساعت گفتار چندزبانه متنوع آموزش دیده و کیفیتی همتراز یا حتی بالاتر از برترین ارائهدهندگان TTS ارائه میدهد.
قادر است گفتاری بسیار طبیعی را از ورودی متنی تولید کند، بهویژه زمانی که یک کد صدای گوینده یا پیشوند صوتی ارائه شود.
همچنین، با دریافت تنها چند ثانیه نمونه صوتی، میتواند شبیهسازی صدای افراد را با دقت بالا انجام دهد.
این مدل امکان کنترل دقیق بر ویژگیهای صوتی از جمله سرعت گفتار، تغییرات زیر و بمی صدا، کیفیت صوت و احساسات (مانند شادی، ترس، غم و عصبانیت) را فراهم میکند.
خروجی صوتی این مدل بهطور پیشفرض با کیفیت ۴۴ کیلوهرتز تولید میشود.
کمپانی Zyphra یک کمپانی هوش مصنوعی مستقر در Palo Alto کالیفرنیا است.
که در حال توسعه MaiaOS یک سیستم عامل چندحالته (Multimodal Agent System) برای کسبوکارها که تحقیقات پیشرفته ای در زمینه معماریهای نسل جدید شبکههای عصبی، حافظه بلندمدت و یادگیری تقویتی می کنند، می باشد.
Github : Zonos-v0
Playground : Zonos
>>Click here to continue<<
