تاریخ : شنبه, ۲۲ اردیبهشت , ۱۴۰۳
4

سورا مدل هوش مصنوعی تبدیل متن به تصویر اپن‌ای‌آی رونمایی شد

  • کد خبر : 5518
  • ۰۱ اسفند ۱۴۰۲ - ۸:۱۸
سورا مدل هوش مصنوعی تبدیل متن به تصویر اپن‌ای‌آی رونمایی شد
شرکت‌هایی مانند Runway و Pika مدل‌های تبدیل‌گر متن به ویدیوی تحسین‌برانگیز تولیدی خود را معرفی کردند و لومیِر گوگل نیز یکی از رقبای اصلی OpenAI در این فضا به شمار می‌رود.

شرکت OpenAI از قصد خود برای عرضه یک مدل جدید برای تولید ویدئو به نام سورا (Sora) خبر داد.

به گزارش مجازینا و به نقل از ورج، این شرکت هوش مصنوعی می‌گوید سورا «می‌تواند صحنه‌های واقعی و تخیلی را از دستورالعمل‌های متنی خلق کند». این مدل تبدیل‌گر متن به ویدیو برای کاربران این امکان را فراهم می‌آورد تا ویدیوهای واقع‌گرایانه، با طول حداکثر یک دقیقه، ایجاد کنند – همه بر اساس دستورالعمل‌هایی که برای آن نوشته‌اند.

OpenAI در معرفی این مدل توضیح داده است که سورا قادر است «صحنه‌های پیچیده با کاراکترهای متعدد، انواع خاصی از حرکت‌ها، و جزئیات دقیق سوژه و پس‌زمینه» ایجاد کند. این شرکت همچنین خاطرنشان کرده است که این مدل می‌تواند درک کند که چگونه اجسام «در دنیای فیزیکی وجود دارند»، و همچنین «به‌طور دقیق درخواست‌ کاربر را تفسیر می‌کند و کاراکترهای قانع‌کننده‌ای می‌آفریند که از نظر احساسی سرزنده هستند».

این مدل همچنین می‌تواند یک ویدیو بر اساس یک تصویر ثابت تولید کند، همچنین فریم‌های از دست رفته را در یک ویدیوی موجود پر کرده یا آن را گسترش دهد. دموهای تولید شده توسط سورا که در پست وبلاگ OpenAI گنجانده شده‌اند، شامل صحنه‌ای هوایی از کالیفرنیا در عصر جویندگان طلا، ویدیویی که به نظر می‌رسد از داخل یک قطار توکیو گرفته شده است، و موارد دیگر می‌شود. بسیاری از آنها نشانه‌های آشکاری از تولید شدن توسط هوش مصنوعی دارند – مانند یک طبقه در یک ویدیو از یک موزه که به طرز مشکوکی متحرک است – و OpenAI می‌گوید این مدل «ممکن است با شبیه‌سازی دقیق فیزیک یک صحنه پیچیده مشکل داشته باشد»، اما نتایج در کل بسیار چشمگیر هستند.


دو سال پیش، مولدهای تبدیل متن به تصویر مانند Midjourney بودند که پیشگام توانایی چنین مدل‌هایی برای تبدیل کلمات به تصویر بودند. اما اخیراً، کیفیت ویدیو با سرعت قابل‌توجهی رو به بهبود گذاشته است: شرکت‌هایی مانند Runway و Pika مدل‌های تبدیل‌گر متن به ویدیوی تحسین‌برانگیز تولیدی خود را معرفی کردند و لومیِر گوگل نیز یکی از رقبای اصلی OpenAI در این فضا به شمار می‌رود. لومیر، مانند سورا، ابزارهای تبدیل متن به ویدیو را در اختیار کاربران قرار می‌دهد و همچنین برای آنها امکان ساخت فیلم از یک تصویر ثابت را فراهم می‌آورد.

سورا در حال حاضر فقط برای «تیم‌های قرمز» که در حال ارزیابی مدل از نظر آسیب‌ها و خطرات احتمالی هستند در دسترس است. OpenAI همچنین دسترسی امکان دسترسی به آن را برای برخی از هنرمندان تجسمی، طراحان و فیلمسازان به منظور دریافت بازخوردشان فراهم آورده است.

لینک کوتاه : https://majazina.ir/?p=5518

ثبت دیدگاه

مجموع دیدگاهها : 0در انتظار بررسی : 0انتشار یافته : 0
قوانین ارسال دیدگاه
  • دیدگاه های ارسال شده توسط شما، پس از تایید توسط تیم مدیریت در وب منتشر خواهد شد.
  • پیام هایی که حاوی تهمت یا افترا باشد منتشر نخواهد شد.
  • پیام هایی که به غیر از زبان فارسی یا غیر مرتبط باشد منتشر نخواهد شد.