ChatGPT در عرض دو هفته قادر به دیدن، شنیدن و صحبت خواهد بود
OpenAI اعلام کرده است که ChatGPT در دو هفته آینده به قابلیت دیدن، شنیدن و صحبت کردن مجهز خواهد شد.
بر اساس گزارش کوین اکسو و به نقل از cryptoslate، بر اساس اعلامیه OpenAI که در 25 سپتامبر (3 اکتبر) منتشر شد، بهروزرسانی جدید GPT Chat از تشخیص گفتار و تبدیل متن به گفتار پشتیبانی میکند و به کاربران اجازه میدهد در بالای متن، از تصاویر و صدا در این مدل هوش مصنوعی استفاده کنید. در عرض دو هفته، کاربران می توانند با استفاده از دستورات صوتی با JPT Chat تعامل داشته باشند و تجربه شخصی تر، مفیدتر و ساده تر را تجربه کنند.
OpenAI اعلام کرد که JPT chat AI از یک مدل تبدیل متن به گفتار پشتیبانی می کند که می تواند صدا را از حداقل نمونه های گفتاری ایجاد شده توسط متخصصان حرفه ای صدا تولید کند. این قابلیت از سیستم تشخیص گفتار Whisper نیز بهره خواهد برد. انتظار میرود این بهروزرسانی جدید JPT Chat با ارائه ویژگیهای صوتی، طیف وسیعتری از نیازها را برطرف کند. از کمک به والدین در خواندن داستانهای قبل از خواب برای کودکان تا کمک به افراد برای انجام کارها با دستیار صوتی آسانتر و سریعتر.
برای مبارزه با جعل و کلاهبرداری، OpenAI قصد دارد ویژگی های صوتی پلتفرم خود را به کاربران محدود کند. یکی از دلایلی که افراد فقط می توانند متن را به صدای متخصصان مشهور و حرفه ای تبدیل کنند همین مشکل است تا از جعل صدای افراد واقعی دیگر جلوگیری شود. اما در عین حال، برخی از شرکت ها و برنامه ها اجازه دسترسی به ویژگی های بیشتری را خواهند داشت. به عنوان مثال، Spotify با این ویژگی جدید قادر خواهد بود پادکست ها را با صدای اصلی هر میزبان به زبان های جدید ترجمه کند.
علاوه بر این، کاربران به زودی می توانند تصاویر مورد نظر خود را برای تجزیه و تحلیل به JPT Chat ارسال کنند. در زمینه ارسال عکس، حریم خصوصی افراد می تواند نقض شود، بنابراین GPT Chat نیز این ویژگی را با محدودیت ارائه می دهد. درست است که هوش مصنوعی چت JPT همیشه دقیق نیست، اما توضیحات کلی تصویر می تواند برای افراد کم بینا یا نابینا که از Be My Eyes استفاده می کنند بسیار مفید باشد.
گفته میشود که ویژگیهای صوتی به صورت انتخابی در iOS و Android در دسترس هستند و ویژگیهای تصویر در همه پلتفرمها در دسترس خواهند بود.