OpenAI bu ay son derece popüler sohbet robotu ChatGPT'nin en son sürümünü tanıttığında, insan benzeri tonlama ve duyguya sahip yeni bir sese sahipti. Çevrimiçi gösteri sırasında botun bir çocuğa geometri problemini çözme konusunda ders verdiği de görüldü.
Ne yazık ki benim için gösterinin aslında bir tuzak taktiği olduğu ortaya çıktı. Yeni ChatGPT, geliştirilmiş ses özelliği de dahil olmak üzere (şirket bana düzeltme yapmamı söylemeyi geciktirmişti) çoğu yeni özelliği olmadan piyasaya sürüldü. Ayrıca, matematik problemi gibi bir şeyin gerçek zamanlı analizini elde etmek için telefonun video kamerasını kullanma yeteneği henüz mevcut değil.
Gecikmenin bir parçası olarak şirket, bazılarının yasal işlem tehdidinde bulunan oyuncu Scarlett Johansson'a benzediğini söylediği ChatGPT sesini de devre dışı bıraktı ve yerine başka bir kadın sesi koydu.
Şimdilik yeni ChatGPT'de tanıtılan şey, botun analiz etmesi için fotoğraf yükleme yeteneğidir. Kullanıcılar genellikle daha hızlı ve daha net yanıtlar bekleyebilirler. Bot aynı zamanda gerçek zamanlı dil çevirisi de gerçekleştirebilir, ancak ChatGPT daha eski, makine benzeri sesiyle yanıt verir.
Yine de bu, teknoloji endüstrisini altüst eden lider chatbot, bu yüzden incelemeye değer. Hızlandırılmış sohbet robotunu iki hafta denedikten sonra karışık duygulara kapıldım. Dil çevirilerinde başarılıydı ancak matematik ve fizikte zorluk çekiyordu. Sonuç olarak, son sürüm olan ChatGPT-4'e göre önemli bir gelişme görmedim. Kesinlikle çocuğuma ders vermesine izin vermem.
Yapay zeka şirketlerinin çılgın yeni özellikler vaat ettiği ve yarım yamalak ürünler sunduğu bu taktik, insanların kafasını karıştıracak ve hayal kırıklığına uğratacak bir trend haline geliyor. OpenAI patronu Sam Altman tarafından finanse edilen startup Humane'nin konuşan bir pini olan 700 dolarlık Ai Pin, aşırı ısınması ve saçmalık yayması nedeniyle geniş çapta eleştirildi. Meta ayrıca kısa süre önce uygulamalarına bir AI sohbet robotu ekledi; bu, internette uçak bileti aramak gibi reklamı yapılan görevlerin çoğunda düşük performans gösterdi.
Şirketler yapay zeka ürünlerini olgunlaşmamış bir aşamada piyasaya sürüyor, bunun nedeni kısmen insanların teknolojiyi nasıl geliştireceklerini öğrenmek için kullanmalarını istemeleri. Geçmişte şirketler telefonlar gibi yeni teknoloji ürünlerini piyasaya sürdüklerinde, bize gösterdikleri şeyleri (yeni kameralar ve daha parlak ekranlar gibi özellikler) tam da onların gördüğü gibi elde ediyorduk. Yapay zeka sayesinde şirketler olası bir geleceği öngörüyor ve yalnızca sınırlı, kontrollü koşullar altında geliştirilip çalışacak teknolojileri gösteriyor. Olgun ve güvenilir bir ürün pazara çıkabilir ya da çıkmayabilir.
Tüm bunlardan alabileceğimiz ders, biz tüketiciler olarak bu abartılı reklama direnmemiz ve yapay zekaya yavaş ve ihtiyatlı yaklaşmamız gerektiğidir. Araçların reklamı yapıldığı gibi çalıştığına dair kanıt elde edene kadar yarım yamalak teknolojiye çok fazla para harcamamalıyız.
ChatGPT'nin GPT-4o (“o”, “omni”) olarak adlandırılan yeni sürümü artık OpenAI'nin web sitesinde ve uygulamasında ücretsiz olarak denenebilir. Ödeme yapmayan kullanıcılar, zaman aşımı gerçekleşmeden önce birkaç istekte bulunabilir ve aylık 20 ABD doları tutarında aboneliği olanlar bota daha fazla sayıda soru sorabilir.
OpenAI, ChatGPT'yi güncellemeye yönelik yinelemeli yaklaşımının, iyileştirmeler yapmak için geri bildirim toplamasına olanak sağladığını söyledi.
Şirket yaptığı açıklamada, “İnsanlara yetenekleri hakkında fikir vermek ve gerçek dünyadaki uygulamalarını anlamamıza yardımcı olmak için gelişmiş modellerimizi önizlemenin önemli olduğuna inanıyoruz” dedi.
(Haberler, geçen yıl OpenAI ve ortağı Microsoft'a, sohbet robotlarını eğitme izni olmadan telif hakkıyla korunan haber makalelerini kullanmaları nedeniyle dava açtı.)
İşte ChatGPT'nin en son sürümü hakkında bilmeniz gerekenler.
Geometri ve fizik
ChatGPT-4o'nun yeni numaralarını göstermek için OpenAI, kar amacı gütmeyen eğitim amaçlı Khan Academy'nin genel müdürü Sal Khan ve oğlu Imran'ın yer aldığı bir video yayınladı. Geometri problemi üzerine eğitilmiş bir video kamera kullanan ChatGPT, Imran'a çözüm boyunca adım adım yol göstermeyi başardı.
ChatGPT'nin video analiz özelliği henüz yayınlanmamış olmasına rağmen geometri problemlerinin fotoğraflarını yükleyebildim. ChatGPT bazı kolay sorunları doğru bir şekilde çözdü ancak daha zor sorunlarla karşılaştı.
Bir SAT hazırlık web sitesinde araştırdığım kesişen üçgenler probleminde bot soruyu anladı ancak yanlış cevap verdi.
Orange County, Kaliforniya'da bir lise fizik öğretmeni olan Taylor Nguyen, Gelişmiş Yerleştirme Matematik testlerinde sıklıkla görülen, salıncakta sallanan bir adamın yer aldığı bir fizik problemini yükledi. ChatGPT birçok mantıksal hata yaptı ve yanlış yanıt verdi ancak Bay Nguyen'in geri bildirimiyle kendini düzeltmeyi başardı.
“Koçluk yapabilirim ama ben bir öğretmenim” dedi. “Bir öğrencinin bu hataları nasıl fark etmesi gerekiyor? Chatbotun haklı olduğunu varsayıyorlar.”
ChatGPT-4o'nun önceki modellerin yanlış yaptığı bazı bölme hesaplamalarını başarıyla gerçekleştirdiğini fark ettim. Yani yavaş iyileşme işaretleri var. Ancak önceki sürümlerin ve Meta AI ve Google'ın Gemini'si de dahil olmak üzere diğer sohbet robotlarının başarısız olduğu temel bir matematik probleminde de başarısız oldu: sayma yeteneği. ChatGPT-4o'ya “W” harfiyle başlayan dört heceli bir kelime sorduğumda “Harika” cevabını verdi.
OpenAI, şirketin karmaşık matematik problemlerine yönelik sistemlerinin yanıtlarını iyileştirmek için sürekli çalıştığını açıkladı.
Şirketi, özel ders yazılımı Khanmigo'da OpenAI teknolojisini kullanan Bay Khan, öğretmen ChatGPT'yi oğluyla yalnız bırakıp bırakmayacağına ilişkin yorum talebine yanıt vermedi.
tartışma
OpenAI ayrıca yeni ChatGPT'nin akıl yürütmede veya yanıtları bulmak için mantıksal akıl yürütmeyi kullanmada daha iyi olduğunu vurguladı. Bu yüzden onu en sevdiğim testlerden birine tabi tuttum: Ondan bir “Waldo Nerede?” bulmacasını oluşturmasını istedim. Kalabalığın içinde duran dev Walter'ın resmi gösterildiğinde asıl meselenin onu bulmanın zor olması gerektiğini söyledim.
Bot daha sonra daha da büyük bir Waldo oluşturdu.
Arizona Eyalet Üniversitesi'nde profesör ve yapay zeka araştırmacısı olan Subbarao Kambhampati de chatbot'u bazı testlerden geçirdi ve son versiyona kıyasla düşünme yeteneğinde gözle görülür bir gelişme görmediğini söyledi.
ChatGPT'ye bloklardan oluşan bir bulmaca sundu:
“Düzeltebilirsiniz ama bunu yaptığınızda kendi zekanızı kullanıyorsunuz” dedi.
OpenAI, genel bilgi sorularını yanıtlarken GPT-4o'nun ChatGPT'nin önceki sürümlerinden yaklaşık iki yüzde puan daha iyi performans gösterdiğini ve muhakeme becerilerinin biraz geliştiğini gösteren test sonuçlarına dikkat çekti.
Dil
OpenAI ayrıca yeni ChatGPT'nin gerçek zamanlı dil çevirisi gerçekleştirebildiğini ve bunun da yabancı dil konuşan biriyle konuşmanıza yardımcı olabileceğini söyledi.
ChatGPT'yi Mandarin ve Kantonca ile test ettim ve “Önümüzdeki perşembe için bir otel odası rezervasyonu yaptırmak istiyorum” ve “Kral boy yatak istiyorum” gibi cümleleri kolaylıkla tercüme edebildiğini gördüm. Ancak vurgular biraz bozuktu. (Dürüst olmak gerekirse bozuk Çincem pek iyi değil.) OpenAI hala aksanları iyileştirmeye çalıştığını söyledi.
ChatGPT-4o aynı zamanda editör olarak da başarılıydı. Onu kendi yazdığım paragraflarla besleyebildiğimde, gereksiz kelimeleri ve jargonu hızlı ve etkili bir şekilde ortadan kaldırdı. ChatGPT'nin sesli çevirideki iyi performansı, bunun yakında daha kullanışlı bir özellik olacağına dair bana güven veriyor.
Sonuç olarak
OpenAI'nin ChatGPT-4o ile doğru yaptığı en büyük şey, teknolojinin denemenin ücretsiz olmasıdır. Ücretsiz, doğru fiyattır: Verilerimizle bu yapay zeka sistemlerinin geliştirilmesine yardımcı olduğumuz için bunun bedelini ödememeliyiz.
En iyi yapay zeka gelişmeleri hâlâ önümüzde. Belki bir gün konuşmak isteyeceğimiz iyi bir matematik öğretmeni olur. Ama gördüğümüzde ve duyduğumuzda buna inanmalıyız.
Ne yazık ki benim için gösterinin aslında bir tuzak taktiği olduğu ortaya çıktı. Yeni ChatGPT, geliştirilmiş ses özelliği de dahil olmak üzere (şirket bana düzeltme yapmamı söylemeyi geciktirmişti) çoğu yeni özelliği olmadan piyasaya sürüldü. Ayrıca, matematik problemi gibi bir şeyin gerçek zamanlı analizini elde etmek için telefonun video kamerasını kullanma yeteneği henüz mevcut değil.
Gecikmenin bir parçası olarak şirket, bazılarının yasal işlem tehdidinde bulunan oyuncu Scarlett Johansson'a benzediğini söylediği ChatGPT sesini de devre dışı bıraktı ve yerine başka bir kadın sesi koydu.
Şimdilik yeni ChatGPT'de tanıtılan şey, botun analiz etmesi için fotoğraf yükleme yeteneğidir. Kullanıcılar genellikle daha hızlı ve daha net yanıtlar bekleyebilirler. Bot aynı zamanda gerçek zamanlı dil çevirisi de gerçekleştirebilir, ancak ChatGPT daha eski, makine benzeri sesiyle yanıt verir.
Yine de bu, teknoloji endüstrisini altüst eden lider chatbot, bu yüzden incelemeye değer. Hızlandırılmış sohbet robotunu iki hafta denedikten sonra karışık duygulara kapıldım. Dil çevirilerinde başarılıydı ancak matematik ve fizikte zorluk çekiyordu. Sonuç olarak, son sürüm olan ChatGPT-4'e göre önemli bir gelişme görmedim. Kesinlikle çocuğuma ders vermesine izin vermem.
Yapay zeka şirketlerinin çılgın yeni özellikler vaat ettiği ve yarım yamalak ürünler sunduğu bu taktik, insanların kafasını karıştıracak ve hayal kırıklığına uğratacak bir trend haline geliyor. OpenAI patronu Sam Altman tarafından finanse edilen startup Humane'nin konuşan bir pini olan 700 dolarlık Ai Pin, aşırı ısınması ve saçmalık yayması nedeniyle geniş çapta eleştirildi. Meta ayrıca kısa süre önce uygulamalarına bir AI sohbet robotu ekledi; bu, internette uçak bileti aramak gibi reklamı yapılan görevlerin çoğunda düşük performans gösterdi.
Şirketler yapay zeka ürünlerini olgunlaşmamış bir aşamada piyasaya sürüyor, bunun nedeni kısmen insanların teknolojiyi nasıl geliştireceklerini öğrenmek için kullanmalarını istemeleri. Geçmişte şirketler telefonlar gibi yeni teknoloji ürünlerini piyasaya sürdüklerinde, bize gösterdikleri şeyleri (yeni kameralar ve daha parlak ekranlar gibi özellikler) tam da onların gördüğü gibi elde ediyorduk. Yapay zeka sayesinde şirketler olası bir geleceği öngörüyor ve yalnızca sınırlı, kontrollü koşullar altında geliştirilip çalışacak teknolojileri gösteriyor. Olgun ve güvenilir bir ürün pazara çıkabilir ya da çıkmayabilir.
Tüm bunlardan alabileceğimiz ders, biz tüketiciler olarak bu abartılı reklama direnmemiz ve yapay zekaya yavaş ve ihtiyatlı yaklaşmamız gerektiğidir. Araçların reklamı yapıldığı gibi çalıştığına dair kanıt elde edene kadar yarım yamalak teknolojiye çok fazla para harcamamalıyız.
ChatGPT'nin GPT-4o (“o”, “omni”) olarak adlandırılan yeni sürümü artık OpenAI'nin web sitesinde ve uygulamasında ücretsiz olarak denenebilir. Ödeme yapmayan kullanıcılar, zaman aşımı gerçekleşmeden önce birkaç istekte bulunabilir ve aylık 20 ABD doları tutarında aboneliği olanlar bota daha fazla sayıda soru sorabilir.
OpenAI, ChatGPT'yi güncellemeye yönelik yinelemeli yaklaşımının, iyileştirmeler yapmak için geri bildirim toplamasına olanak sağladığını söyledi.
Şirket yaptığı açıklamada, “İnsanlara yetenekleri hakkında fikir vermek ve gerçek dünyadaki uygulamalarını anlamamıza yardımcı olmak için gelişmiş modellerimizi önizlemenin önemli olduğuna inanıyoruz” dedi.
(Haberler, geçen yıl OpenAI ve ortağı Microsoft'a, sohbet robotlarını eğitme izni olmadan telif hakkıyla korunan haber makalelerini kullanmaları nedeniyle dava açtı.)
İşte ChatGPT'nin en son sürümü hakkında bilmeniz gerekenler.
Geometri ve fizik
ChatGPT-4o'nun yeni numaralarını göstermek için OpenAI, kar amacı gütmeyen eğitim amaçlı Khan Academy'nin genel müdürü Sal Khan ve oğlu Imran'ın yer aldığı bir video yayınladı. Geometri problemi üzerine eğitilmiş bir video kamera kullanan ChatGPT, Imran'a çözüm boyunca adım adım yol göstermeyi başardı.
ChatGPT'nin video analiz özelliği henüz yayınlanmamış olmasına rağmen geometri problemlerinin fotoğraflarını yükleyebildim. ChatGPT bazı kolay sorunları doğru bir şekilde çözdü ancak daha zor sorunlarla karşılaştı.
Bir SAT hazırlık web sitesinde araştırdığım kesişen üçgenler probleminde bot soruyu anladı ancak yanlış cevap verdi.
Orange County, Kaliforniya'da bir lise fizik öğretmeni olan Taylor Nguyen, Gelişmiş Yerleştirme Matematik testlerinde sıklıkla görülen, salıncakta sallanan bir adamın yer aldığı bir fizik problemini yükledi. ChatGPT birçok mantıksal hata yaptı ve yanlış yanıt verdi ancak Bay Nguyen'in geri bildirimiyle kendini düzeltmeyi başardı.
“Koçluk yapabilirim ama ben bir öğretmenim” dedi. “Bir öğrencinin bu hataları nasıl fark etmesi gerekiyor? Chatbotun haklı olduğunu varsayıyorlar.”
ChatGPT-4o'nun önceki modellerin yanlış yaptığı bazı bölme hesaplamalarını başarıyla gerçekleştirdiğini fark ettim. Yani yavaş iyileşme işaretleri var. Ancak önceki sürümlerin ve Meta AI ve Google'ın Gemini'si de dahil olmak üzere diğer sohbet robotlarının başarısız olduğu temel bir matematik probleminde de başarısız oldu: sayma yeteneği. ChatGPT-4o'ya “W” harfiyle başlayan dört heceli bir kelime sorduğumda “Harika” cevabını verdi.
OpenAI, şirketin karmaşık matematik problemlerine yönelik sistemlerinin yanıtlarını iyileştirmek için sürekli çalıştığını açıkladı.
Şirketi, özel ders yazılımı Khanmigo'da OpenAI teknolojisini kullanan Bay Khan, öğretmen ChatGPT'yi oğluyla yalnız bırakıp bırakmayacağına ilişkin yorum talebine yanıt vermedi.
tartışma
OpenAI ayrıca yeni ChatGPT'nin akıl yürütmede veya yanıtları bulmak için mantıksal akıl yürütmeyi kullanmada daha iyi olduğunu vurguladı. Bu yüzden onu en sevdiğim testlerden birine tabi tuttum: Ondan bir “Waldo Nerede?” bulmacasını oluşturmasını istedim. Kalabalığın içinde duran dev Walter'ın resmi gösterildiğinde asıl meselenin onu bulmanın zor olması gerektiğini söyledim.
Bot daha sonra daha da büyük bir Waldo oluşturdu.
Arizona Eyalet Üniversitesi'nde profesör ve yapay zeka araştırmacısı olan Subbarao Kambhampati de chatbot'u bazı testlerden geçirdi ve son versiyona kıyasla düşünme yeteneğinde gözle görülür bir gelişme görmediğini söyledi.
ChatGPT'ye bloklardan oluşan bir bulmaca sundu:
Cevap şu; bu koşullar altında blokları düzenlemenin imkansız olduğu, ancak tıpkı önceki sürümlerde olduğu gibi ChatGPT-4o, C bloğunu hareket ettirmeyi içeren bir çözüm bulmaya devam etti. Bay Kambhampati, bu ve diğer muhakeme testleriyle ChatGPT'nin ara sıra doğru cevaba ulaşmak için geri bildirimi kabul edebildiğini ve bunun yapay zekanın nasıl çalışması gerektiğiyle çeliştiğini söyledi.C bloğu A bloğunun üstündeyse ve B bloğu masanın üzerinde ayrı ayrıysa, A bloğu B bloğunun üstünde ve B bloğu C bloğunun üstünde olacak şekilde, ancak hareket etmeden nasıl blok yığını yapabileceğimi söyleyebilir misiniz? C blok?
“Düzeltebilirsiniz ama bunu yaptığınızda kendi zekanızı kullanıyorsunuz” dedi.
OpenAI, genel bilgi sorularını yanıtlarken GPT-4o'nun ChatGPT'nin önceki sürümlerinden yaklaşık iki yüzde puan daha iyi performans gösterdiğini ve muhakeme becerilerinin biraz geliştiğini gösteren test sonuçlarına dikkat çekti.
Dil
OpenAI ayrıca yeni ChatGPT'nin gerçek zamanlı dil çevirisi gerçekleştirebildiğini ve bunun da yabancı dil konuşan biriyle konuşmanıza yardımcı olabileceğini söyledi.
ChatGPT'yi Mandarin ve Kantonca ile test ettim ve “Önümüzdeki perşembe için bir otel odası rezervasyonu yaptırmak istiyorum” ve “Kral boy yatak istiyorum” gibi cümleleri kolaylıkla tercüme edebildiğini gördüm. Ancak vurgular biraz bozuktu. (Dürüst olmak gerekirse bozuk Çincem pek iyi değil.) OpenAI hala aksanları iyileştirmeye çalıştığını söyledi.
ChatGPT-4o aynı zamanda editör olarak da başarılıydı. Onu kendi yazdığım paragraflarla besleyebildiğimde, gereksiz kelimeleri ve jargonu hızlı ve etkili bir şekilde ortadan kaldırdı. ChatGPT'nin sesli çevirideki iyi performansı, bunun yakında daha kullanışlı bir özellik olacağına dair bana güven veriyor.
Sonuç olarak
OpenAI'nin ChatGPT-4o ile doğru yaptığı en büyük şey, teknolojinin denemenin ücretsiz olmasıdır. Ücretsiz, doğru fiyattır: Verilerimizle bu yapay zeka sistemlerinin geliştirilmesine yardımcı olduğumuz için bunun bedelini ödememeliyiz.
En iyi yapay zeka gelişmeleri hâlâ önümüzde. Belki bir gün konuşmak isteyeceğimiz iyi bir matematik öğretmeni olur. Ama gördüğümüzde ve duyduğumuzda buna inanmalıyız.