"Google تطور نموذج AI لتحويل النصوص إلى موسيقى"

جوجل تكشف عن تحديثات شاملة لنماذج الذكاء الاصطناعي في منصة Vertex AI

أعلنت شركة جوجل، اليوم الأربعاء، عن مجموعة من التحديثات الجوهرية التي طالت عدة نماذج من تقنياتها الخاصة بالذكاء الاصطناعي المولّد للوسائط، والمتوفرة عبر منصتها السحابية Vertex AI، وذلك في إطار سعيها المتواصل لتعزيز حضورها في سوق الذكاء الاصطناعي المخصص لبيئات الأعمال والمبدعين.

من أبرز ما تم الكشف عنه، إطلاق النسخة التجريبية من نموذج Lyria، المخصص لتحويل النصوص إلى مقطوعات موسيقية، لفئة محددة من المستخدمين. ويُروَّج لهذا النموذج كأداة جديدة تتيح إنشاء موسيقى عالية الجودة بأساليب متنوعة، مثل الجاز والموسيقى الرقمية، ما يجعله بديلاً مبتكرًا لمكتبات الموسيقى التقليدية.

كما شهد نموذج Veo 2، المختص بإنتاج الفيديو، تحسينات ملحوظة شملت أدوات جديدة للتحكم في التأثيرات البصرية وتحرير المحتوى بشكل أكثر مرونة ودقة، ما يعزز من إمكانيات المستخدمين في صناعة الفيديوهات الإبداعية.

في السياق ذاته، كشفت جوجل عن دعم ميزة استنساخ الصوت بواسطة نموذجها المتقدم Chirp 3، والذي يتميز بقدرات متقدمة في تحليل وفهم الصوت. يتيح النموذج إنشاء كلام بـ 35 لغة مختلفة، ويُعد من أبرز خصائصه ميزة Instant Custom Voice، التي تمكّن من تقليد صوت شخص ما باستخدام تسجيل صوتي قصير لا يتجاوز عشر ثوانٍ. أصبحت هذه الميزة الآن متاحة لجميع المستخدمين.

وعلى صعيد توليد الصور، حصل نموذج Imagen 3 على تحديثات تقنية تُحسن بشكل كبير من جودة المخرجات، وفقًا لما أوضحته جوجل.

ولتعزيز دقة النصوص الناتجة عن تفريغ المحتوى الصوتي، أضافت الشركة أداة جديدة ما تزال قيد المعاينة تُعرف باسم Transcription with Diarization. تتيح هذه الأداة تمييز وفصل أصوات المتحدثين في المقاطع الصوتية متعددة المشاركين، مما يسهم في إنتاج نصوص أكثر دقة ووضوحًا.

تأتي هذه التحديثات ضمن جهود جوجل لتعزيز موقعها في سوق الذكاء الاصطناعي المولّد، في وقت تشهد فيه منافسة متزايدة من قبل شركات مثل أمازون، التي تقدم خدمات مشابهة عبر منصتها Bedrock.

Share this content: