گوگل از “Expressive Captions” برای اندروید با تشخیص احساسات و صدا مبتنی بر هوش مصنوعی رونمایی کرد.

کاربران اندروید اکنون می توانند سطح کاملا جدیدی از زیرنویس را با انتشار «کپشن های بیانی» تجربه کنند. این ویژگی جدید فراتر از نشان دادن کلماتی است که مردم می گویند – در واقع نحوه بیان آنها را نشان می دهد. تصور کنید که بتوانید احساسات و شدت صدای کسی را ببینید، حتی اگر نتوانید آن را بشنوید.

برای سال‌ها، زیرنویس‌ها به سادگی کلمات گفته شده را نمایش می‌دادند، اما اکنون، به لطف هوش مصنوعی، می‌توانند کارهای بیشتری انجام دهند. زیرنویس‌های رسا مواردی مانند لحن صدا، بلندی صدا، و حتی صداهای پس‌زمینه را تجزیه و تحلیل می‌کنند تا درک بهتری از آنچه اتفاق می‌افتد به شما بدهد. این به ویژه برای ویدیوهای زنده و پست‌های رسانه‌های اجتماعی، که در آن زیرنویس‌ها اغلب وجود ندارند یا خیلی دقیق نیستند، مفید است.

یکی از جالب ترین چیزها در مورد Captions Expressive جدید این است که چگونه از حروف بزرگ برای نشان دادن احساسات قوی استفاده می کند. بنابراین، اگر دوستتان برای شما پیام تولد بفرستد و فریاد بزند “تولدت مبارک!” شما آن کلمات را با حروف بزرگ در زیرنویس ها خواهید دید، درست مانند نحوه استفاده از تمام حروف در متن به این معنی است که شما فریاد می زنید. این ویژگی همچنین می‌تواند مواردی مانند آه، نفس نفس زدن و حتی کف زدن یا تشویق کردن را در پس‌زمینه تشخیص دهد و به شما حس بهتری از کل صحنه بدهد.

زیرنویس‌های رسا دقیقاً در جدیدترین تلفن‌های اندرویدی تعبیه شده‌اند، بنابراین تقریباً با هر برنامه‌ای که می‌توانید ویدیو تماشا کنید کار می‌کنند. این ویژگی از امروز برای هر اندرویدی که دارای اندروید 14 و بالاتر باشد و قابلیت Live Caption را فعال کرده باشد، در دسترس خواهد بود. در حال حاضر، فقط در ایالات متحده به زبان انگلیسی در دسترس خواهد بود.

این بدان معناست که می‌توانید از آن‌ها برای پخش زنده، ویدیوها در Google Photos و حتی پیام‌های ویدیویی از دوستان استفاده کنید. و بهترین بخش این است که آنها فورا و حتی زمانی که آفلاین هستید، مانند هواپیما کار می کنند.

گوگل می گوید که برای ایجاد این ویژگی فوق العاده مفید، تیم های اندروید و گوگل دیپ مایند با هم کار کردند تا بفهمند مردم چگونه ویدیوها را بدون صدا تماشا می کنند. آنها از فناوری هوش مصنوعی ویژه ای استفاده کردند تا نه تنها کلمات را ضبط کنند، بلکه آنها را به شرح هایی تبدیل کنند که احساسات را نشان می دهد و همه آن صداهای اضافی را شامل می شود.

این یک گام بزرگ رو به جلو برای اطمینان از اینکه همه می‌توانند از ویدیوهای آنلاین لذت ببرند، مهم نیست که چقدر خوب می‌شنوند، است. این نشان می دهد که چگونه می توان از هوش مصنوعی برای بهبود اوضاع برای همه استفاده کرد.

من ویدیوهای زیادی را روی تلفنم تماشا می‌کنم، بنابراین در مورد زیرنویس‌های بیانگر بسیار هیجان‌زده هستم. توانایی دیدن احساسات و شنیدن صداهای پس‌زمینه از طریق زیرنویس‌ها، تماشای ویدیوها در مکان‌های پر سر و صدا را به تجربه بهتری تبدیل می‌کند. من نمی توانم صبر کنم تا ببینم آیا این به زودی به زبان ها و مناطق دیگر می آید یا خیر.
منبع:phonearena

ncharmiamyung

Recent Posts

گفته می‌شه سامسونگ تست رابط کاربری One UI 8 رو روی گلکسی زد فولد ۴ و گلکسی زد فلیپ ۴ شروع کرده

سامسونگ اوایل همین ماه تو رویداد گلکسی آنپکد ۲۰۲۵، از سیستم عامل One UI 8…

4 روز ago

دنباله‌ی تریلر جنگی ۳۰ ساله‌ی دنزل واشنگتون در راه است

قراره برای تریلر زیردریایی ۳۰ ساله‌ی دنزل واشنگتون و جین هکمن یه دنباله ساخته بشه.…

4 هفته ago

جنسن هوانگ در تور اروپا – همچنین با صدراعظم

[ad_1] بنیانگذاران Nvidia و مدیر عامل شرکت جنسن هوانگ در هفته آینده با نمایندگان بی…

2 ماه ago

گفته می شود که معیار جدید تمسخر مدل های هوش مصنوعی را نشان می دهد

[ad_1] گفته می شود که معیار جدید تمسخر مدل های هوش مصنوعی را نشان می…

2 ماه ago

آیین نامه AI: تا حدی دیگر مستثنی نیست

[ad_1] برخی از کشورهای عضو اتحادیه اروپا امیدوارند که حداقل استفاده از آیین نامه هوش…

2 ماه ago

پرونده های بیمار الکترونیکی: افراد بیمه شده آگاه ، میزان تناقض رشد می کند

[ad_1] پرونده های بیمار الکترونیکی: افراد بیمه شده آگاه ، میزان تناقض رشد می کند…

2 ماه ago