ChatGPT در عرض دو هفته قادر به دیدن، شنیدن و صحبت خواهد بود

تحریریه کوین اکسوآوریل 9, 2024

OpenAI اعلام کرده است که ChatGPT در دو هفته آینده به قابلیت دیدن، شنیدن و صحبت کردن مجهز خواهد شد.

بر اساس گزارش کوین اکسو و به نقل از cryptoslate، بر اساس اعلامیه OpenAI که در 25 سپتامبر (3 اکتبر) منتشر شد، به‌روزرسانی جدید GPT Chat از تشخیص گفتار و تبدیل متن به گفتار پشتیبانی می‌کند و به کاربران اجازه می‌دهد در بالای متن، از تصاویر و صدا در این مدل هوش مصنوعی استفاده کنید. در عرض دو هفته، کاربران می توانند با استفاده از دستورات صوتی با JPT Chat تعامل داشته باشند و تجربه شخصی تر، مفیدتر و ساده تر را تجربه کنند.

OpenAI اعلام کرد که JPT chat AI از یک مدل تبدیل متن به گفتار پشتیبانی می کند که می تواند صدا را از حداقل نمونه های گفتاری ایجاد شده توسط متخصصان حرفه ای صدا تولید کند. این قابلیت از سیستم تشخیص گفتار Whisper نیز بهره خواهد برد. انتظار می‌رود این به‌روزرسانی جدید JPT Chat با ارائه ویژگی‌های صوتی، طیف وسیع‌تری از نیازها را برطرف کند. از کمک به والدین در خواندن داستان‌های قبل از خواب برای کودکان تا کمک به افراد برای انجام کارها با دستیار صوتی آسان‌تر و سریع‌تر.

برای مبارزه با جعل و کلاهبرداری، OpenAI قصد دارد ویژگی های صوتی پلتفرم خود را به کاربران محدود کند. یکی از دلایلی که افراد فقط می توانند متن را به صدای متخصصان مشهور و حرفه ای تبدیل کنند همین مشکل است تا از جعل صدای افراد واقعی دیگر جلوگیری شود. اما در عین حال، برخی از شرکت ها و برنامه ها اجازه دسترسی به ویژگی های بیشتری را خواهند داشت. به عنوان مثال، Spotify با این ویژگی جدید قادر خواهد بود پادکست ها را با صدای اصلی هر میزبان به زبان های جدید ترجمه کند.

علاوه بر این، کاربران به زودی می توانند تصاویر مورد نظر خود را برای تجزیه و تحلیل به JPT Chat ارسال کنند. در زمینه ارسال عکس، حریم خصوصی افراد می تواند نقض شود، بنابراین GPT Chat نیز این ویژگی را با محدودیت ارائه می دهد. درست است که هوش مصنوعی چت JPT همیشه دقیق نیست، اما توضیحات کلی تصویر می تواند برای افراد کم بینا یا نابینا که از Be My Eyes استفاده می کنند بسیار مفید باشد.

گفته می‌شود که ویژگی‌های صوتی به صورت انتخابی در iOS و Android در دسترس هستند و ویژگی‌های تصویر در همه پلتفرم‌ها در دسترس خواهند بود.

منبع

کریپتوپلاست

تحریریه کوین اکسوآوریل 9, 2024