Nobitex Referral Campaign Banner

تازه‌های اقتصادی:

21 دقیقه پیش
ایلان ماسک ثروت مندترین فرد تاریخ با 800 میلیار دلار شد
26 دقیقه پیش
اوج‌گیری طلا و سکه در بازار | امروز قیمت چند است؟
28 دقیقه پیش
وزیر نیرو: ۱۹۳ همت پروژه آب و برق در دهه فجر آماده افتتاح است
28 دقیقه پیش
۶۴ درصد از گاز کشور به بخش خانگی و تجاری رسید
29 دقیقه پیش
حقوق ورودی خودروهای وارداتی ایرانیان مقیم خارج از کشور ابلاغ شد
29 دقیقه پیش
کاهش ۷ درصدی تردد بین‌استانی در جاده‌های کشور
29 دقیقه پیش
قیمت طلا و سکه امروز ۱۶ بهمن؛ سکه ۱۹۶ میلیون تومان شد
31 دقیقه پیش
اصلاحات دستورالعمل معاملات ارز تجاری ابلاغ شد
31 دقیقه پیش
۱۳ نیروگاه جدید مقیاس کوچک افتتاح می‌شود
31 دقیقه پیش
مصرف 64درصد گاز تولیدی در بخش خانگی و تجاری
36 دقیقه پیش
قیمت بلیت هواپیما در مسیرهای پرتردد چند؟
36 دقیقه پیش
قیمت دلار و سایر ارز‌های معتبر در بازار امروز ۱۶ بهمن
42 دقیقه پیش
متقاضیان وام ازدواج بخوانند/ رقم وام ازدواج در سال آینده تا چه رقمی تغییر می‌کند؟
50 دقیقه پیش
این روش سفر، هزینه‌های شما را نصف می‌کند
51 دقیقه پیش
وام ازدواج سال آینده بدون تغییر ادامه می‌یابد
51 دقیقه پیش
سهامداران عدالت حتما بخوانند/ تکلیف واریز سود سهام عدالت در بهمن ۱۴۰۴ مشخص شد
1 ساعت پیش
ایران رتبه ششم معادن مس دنیا را دارد
1 ساعت پیش
رشد ۱۳ درصدی انتقال فرآورده‌های نفتی از منطقه خلیج فارس
1 ساعت پیش
سقوط ۲ درصدی قیمت نفت در بازار جهانی
1 ساعت پیش
توسعه متوازن صنعت پتروشیمی جایگاهی اثرگذار در اقتصاد کشور دارد
1 ساعت پیش
کالابرگ زنجیره‌ای می‌تواند حمایت از مردم و تولیدکنندگان را تضمین کند
1 ساعت پیش
قیمت خودرو در نیمه بهمن ۱۴۰۴؛ رشد تا ۱۷۰ میلیون تومان در یک هفته+ جدول
2 ساعت پیش
آغاز عملیات اجرایی ۱۳ پروژه در پالایشگاه شهید هاشمی‌نژاد
2 ساعت پیش
عقب‌نشینی دوباره طلا و نقره در بازارهای جهانی
2 ساعت پیش
قیمت خودرو در نیمه بهمن ۱۴۰۴؛ رشد تا ۱۷۰ میلیون تومان در یک هفته+ جدول
2 ساعت پیش
سقوط نفت به کانال ۶۰ دلار
2 ساعت پیش
افت رمزارزها؛ بیت کوین به یک قدمی ۶۹ هزار دلار رسید

هوش مصنوعی با شنیدن صدا‌ عکس می‌سازد

دنیای اقتصاد چهارشنبه 14 آذر 1403 - 00:05

مهر: هم اکنون سیستم‌های هوش مصنوعی جلوه‌های صوتی برای تصاویر ساکن از خیابان‌های شهر و اماکن دیگر می‌سازند، اما یک فناوری آزمایشی جدید برعکس این فرآیند را انجام می‌دهد. یوهائو کانگ و همکارانش در دانشگاه تگزاس «مدل انتشار صدا به تصویر» (Soundscape-to-Image Diffusion Model) را براساس مخزن داده‌ای از کلیپ‌های صوتی و تصویری ۱۰ ثانیه‌ای آموزش دادند.

این کلیپ‌ها شامل تصاویر ثابت و صداهای محیطی از ویدئوهای یوتیوب مربوط به خیابان‌های شهری و حومه‌ای در آمریکای شمالی، آسیا و اروپا بودند. محققان با استفاده از الگوریتم‌های یادگیری عمیق نه تنها به سیستم آموزش دادند چه اصواتی به چه آیتم‌هایی در تصاویر مرتبط است، بلکه چه کیفیت اصواتی با محیط‌های بصری مطابقت دارد. پس از تکمیل آموزش به سیستم دستور داده شد تصاویری را فقط براساس صدای محیطی ضبط شده از ۱۰۰ ویدئو چشم‌انداز خیابان بسازد. این سیستم به ازای هر ویدئو یک عکس ساخت. در مرحله بعد هریک از عکس‌ها همراه دو تصویر تولید شده از خیابان‌های دیگر به پنلی از داوران انسانی نشان داده شد و همزمان صدایی که عکس‌ها براساس آن تولید شده بودند نیز پخش شد. هنگامی که از داوران خواسته شد سه عکس مرتبط با صدای شنیده شده را شناسایی کنند، آنها با دقت متوسط ۸۰ درصد این کار را انجام دادند.

مشاهده متن کامل خبر در "دنیای اقتصاد"

آخرین اخبار

پربیننده ترین اخبار روز

آخرین اخبار استانها:

عناوین روزنامه‌های امروز:

جستجو:

پخش زنده اخبار:

تیتر اخبار - تیتر آخرین اخبار - آخرین اخبار روز - آخرین اخبار ایران - خبر - اخبار سیاسی - اخبار ورزشی - اخبار اقتصادی - اخبار فناوری - اخبار فرهنگی - اخبار هنری - اخبار پزشکی - اخبار حوادث - اخبار استانها

تمامی خبرها توسط نرم‌افزار جستجوگر خبر سایت گردآوری شده و سایت تیترآنلاین در قبال محتوای خبرها مسئولیتی ندارد

تمامی حقوق این سایت برای تیترآنلاین محفوظ است