اخبار ارزهای دیجیتال

ChatGPT تا دو هفته دیگر به قابلیت دیدن، شنیدن و صحبت کردن مجهز می‌شود

شرکت اوپن‌ای‌آی (OpenAI) اعلام کرد که چت جی پی تی (ChatGPT) طی دو هفته آینده به قابلیت دیدن، شنیدن و صحبت کردن مجهز می‌شود.

به گزارش والکس و به نقل از cryptoslate، طبق اطلاعیه OpenAI که در ۲۵ سپتامبر (۳ مهر) منتشر شد، به‌روز‌رسانی جدید چت جی پی تی از تشخیص گفتار و تبدیل متن به صوت پشتیبانی خواهد کرد و این امکان را برای کاربران فراهم می‌کند تا علاوه بر متن، از تصاویر و صوت هم در این مدل هوش مصنوعی استفاده کنند. تا دو هفته دیگر کاربران با استفاده از دستورات صوتی می‌توانند با چت جی پی تی تعامل داشته باشند و تجربه شخصی‌سازی‌ شده‌تر، مفیدتر و ساده‌تری را تجربه کنند.

شرکت OpenAI اعلام کرد که هوش مصنوعی چت جی پی تی از یک مدل تبدیل متن به گفتار پشتیبانی می‌کند که می‌تواند صدا را از حداقل نمونه گفتار ایجاد شده توسط صدا پیشگان حرفه‌ای تولید کند. این ویژگی همچنین از سیستم تشخیص گفتار Whisper هم بهره خواهد برد. انتظار می‌رود که این به روزرسانی جدید چت جی پی تی با ارائه ویژگی‌های صوتی، طیف گسترده‌تری از نیازها را پاسخ دهد. از کمک به والدین برای خواندن داستان قبل از خواب برای کودکان تا کمک به افرادی که با دستیار صوتی راحت‌تر و سریع‌تر کارهای خود را انجام می‌دهند. 

به منظور مقابله با جعل هویت و تقلب، شرکت OpenAI در نظر دارد تا ویژگی‌های صوتی پلتفرم خود را با محدودیت در اختیار کاربران قرار دهد. یکی از دلایلی که افراد فقط می‌توانند متن را به گفتار صدا پیشگان معروف و حرفه‌ای تبدیل کنند همین مساله است تا بلکه از جعل صدای سایر افراد حقیقی جلوگیری شود. اما همزمان برخی شرکت‌ها و اپلیکیشن‌ها این اجازه را خواهند داشت تا به قابلیت‌های بیشتری دسترسی داشته باشند. مثلا Spotify با این ویژگی جدید قادر خواهد بود که پادکست‌ها را با صدای اصلی هر میزبان به زبان‌های جدید ترجمه می‌کند.

علاوه بر این، به زودی کاربران می‌توانند تصاویر مورد نظر خود را برای تجزیه و تحلیل در اختیار چت جی پی تی قرار دهند. در زمینه ارسال عکس هم ممکن است حریم خصوصی افراد نقض شود، بنابراین چت جی پی تی این ویژگی را نیز با محدودیت عرضه می‌کند. درست است که هوش مصنوعی چت جی پی تی همیشه دقیق نیست اما توضیحات کلی از تصاویر می‌تواند برای افراد کم‌بینا یا نابینا که از Be My Eyes استفاده می‌کنند بسیار مفید باشد. 

گفته می‌شود که ویژگی‌های صوتی در iOS و Android به صورت انتخابی در دسترس خواهند بود و ویژگی‌های تصویر در همه پلتفرم‌ها در دسترس خواهند بود.

دیدگاه شما به بهبود مطالب والکس کمک می‌کند.

به این مطلب چه امتیازی می‌دهید؟

میانگین امتیارها: ۰ / ۵. مجموع آرا: ۰

منبع
cryptoslate
نوشته های مشابه
اشتراک در
اطلاع از
guest
ایمیل شما نمایش داده نمی شود
0 دیدگاه
بازخورد (Feedback) های اینلاین
View all comments
دکمه بازگشت به بالا