ChatGPT Artık Konuşabiliyor ve Görebiliyor
OpenAI tarafından geliştirilen ChatGPT, artık sadece metin tabanlı bir dil modeli değil.
GPT-4 adlı dil modeli ve güncellenmiş DALL-E modeli ile sesli ve görsel yetenekler kazandı. Kullanıcıların sesli komutlarını anlayabilen ve sesli yanıt verebilen bir yapıya sahip olan ChatGPT, bu özelliği OpenAI'nin Whisper isimli “otomatik konuşmayı tanıma” modeli ve “yeni bir metinden konuşmaya” modeli sayesinde kazandı. Ayrıca ChatGPT sahip olduğu görsel anlama yeteneği ile kullanıcıların görsel ipuçları vererek daha karmaşık sorgular oluşturmasına imkân tanıyor. Örneğin bir kullanıcı ChatGPT'den sesli olarak bir masal anlatmasını isteyebiliyor veya bir resim yükleyerek bu resimle ilgili bilgi alabiliyor.
Sesli yanıt özelliği sayesinde ChatGPT artık görme engellilerin hayatını kolaylaştıran bir araç olarak da kullanılabilecek. Ayrıca görüntü analiz yeteneği sayesinde ChatGPT görsellerin içindeki metni de analiz edebilecek. Örneğin basılı bir gazetenin ön sayfasının fotoğrafını çekip ChatGPT’den bu sayfayı özetlemesini isterseniz metni size sesli olarak da özetleyebiliyor.
ChatGPT’nin yeni versiyonunun konuşma ayarlarında şu an için Juniper, Ember, Breeze, Sky ve Cove isimli, her dilde konuşabilen sanal asistanlar var. Türkçe konuşma kabiliyeti, vurgu ve tonlamaları, mevcut yapay zekâ asistanlarıyla kıyaslandığında çok daha başarılı. Dilerseniz ChatGPT’ye Türkiye’nin farklı yörelerinde kullanılan ağızlarla hitap edebilir ve ChatGPT’den bu ağızlarla konuşmasını isteyebilirsiniz. Böylece eğlenceli bir sohbet ortamı oluşturabilirsiniz.
ChatGPT gibi gelişmiş uygulamaların etik ve güvenlik açısından değerlendirilmesi de gerekiyor. OpenAI, bu nedenle yeni özellikleri yavaş yavaş kullanıma sunmayı, bu sayede olası riskleri en aza indirmeyi planlıyor.
Hem ses hem de görüntü özellikleri yalnızca ChatGPT Plus ve Enterprise'da. Bu hizmetler şimdilik yalnızca ücretli kullanıcılara sunuluyor.
Yazar Hakkında:
Dr. Fatih Sinan Esen
TÜBİTAK
Bilgisayar Mühendisi
Yorumlar
Mahmut1071 Pa, 10/29/2023 - 18:07
Öpen AI bu işin ucunu serbest bırakırsa
Adli, sanayî ve hizmet alanlarında bir patlamaya sebep olacaktır.
İns elimizi hızlı tutup sağlam bir zemin hazırlarız