Meta ve Google yapay zeka sesli asistanlarına güveniyor. Kalkacaklar mı?

serdal · 1 May 2024

Bir çift Meta gözlük, “Hey Meta, bir fotoğraf çek” dediğinizde fotoğraf çekiyor. Gömleğinize takılan minyatür bir bilgisayar olan Ai Pin, yabancı dilleri ana dilinize çeviriyor. Yapay olarak akıllı bir ekranın, mikrofon aracılığıyla konuştuğunuz bir sanal asistanı vardır.

Geçen yıl OpenAI, ChatGPT sohbet robotunu sesli yanıt verecek şekilde güncelledi ve yakın zamanda Google, Android telefonlardaki sesli asistanının yerine geçen Gemini'yi tanıttı.

Teknoloji şirketleri, çoğu insanın bilgisayarlarla konuşmanın hoş olmadığına karar vermesinden yıllar sonra, sesli asistanların rönesansı üzerine bahse giriyor.

Bu sefer işe yarayacak mı? Olabilir ama biraz zaman alabilir.

Pek çok kişi Amazon'un Alexa'sı, Apple'ın Siri'si ve Google'ın Asistanı gibi sesli asistanları hiç kullanmadı ve son on yıldaki araştırmalara göre, bunları toplum içinde kullanırken görülmek istemeyenlerin büyük çoğunluğu da söylüyor.

Sesli asistanları da nadiren kullanıyorum ve Meta'nın çevre hakkında bilgi veren kamera ve hoparlörlere sahip gözlükleriyle yaptığım son denemede, hayvanat bahçesinde ebeveynlerin ve çocuklarının önünde sessiz olduğu sonucuna vardım. inanılmaz derecede garip.

Bunun normal hissedilip hissedilmeyeceğini merak ettim. Kısa bir süre önce insanlar arama yapmak için Bluetooth kulaklıklarını kullanırken deli gibi görünüyordu, ancak artık herkes bunu yapıyor. Bilim kurgu filmlerindeki gibi etrafta dolaşan ve bilgisayarlarıyla konuşan çok fazla insan görecek miyiz?

Bu soruyu tasarım uzmanları ve araştırmacıları için sordum ve fikir birliği açıktı: Yeni yapay zeka sistemleri, sesli asistanların söylediklerimizi anlama yeteneğini geliştirdikçe ve bize gerçekten yardımcı oldukça, yakın gelecekte muhtemelen cihazlarla daha sık konuşacağız. – ama bunu halka açık bir şekilde yapmaya hala uzun yıllarımız var.

İşte bilmeniz gerekenler.

Sesli asistanlar neden giderek daha akıllı hale geliyor?

Yeni sesli asistanlar, telefonunuzun otomatik tamamlama özelliğine benzer şekilde hangi kelimelerin bir araya geleceğini tahmin etmek için istatistikler ve karmaşık algoritmalar kullanan üretken yapay zekaya güveniyor. Bu onların, yalnızca sınırlı sayıda soru listesine yanıt verebilen Siri ve Alexa gibi sanal asistanlara kıyasla, istekleri ve takip eden soruları anlamak için bağlamı daha iyi kullanabilmelerini sağlıyor.

Örneğin, ChatGPT'ye “Gelecek hafta San Francisco'dan New York'a hangi uçuşlar var?” ve ardından “Orada hava nasıl?” ve “Ne hazırlamalıyım?” gibi soruları yanıtlayabilir. çünkü konuşmanın içeriğini anlamak için kelimeler arasında bağlantı kuruyor. (Haberler, geçen yıl OpenAI ve ortağı Microsoft'a, sohbet robotlarını eğitme izni olmadan telif hakkıyla korunan haber makalelerini kullanmaları nedeniyle dava açtı.)

Anlamak üzere programlandığı komut ve sorulardan oluşan bir veri tabanına yanıt veren Siri gibi daha eski bir sesli asistan, “New York'ta hava nasıl?” ve “Ne yapmalıyım?” gibi belirli kelimeleri kullanmazsanız başarısız olur. “New York gezisi için eşyalarınızı toplar mısınız?”

İlk konuşma, tıpkı insanların birbirleriyle konuşma şekli gibi daha akıcı geliyor.

İnsanların Siri ve Alexa gibi sesli asistanlardan vazgeçmesinin ana nedeni, bilgisayarların kendilerine sorulanların çoğunu anlayamaması ve hangi soruların işe yaradığını anlamanın zor olmasıydı.

Apple tarafından satın alınmadan önce Siri'nin ilk versiyonunun arkasındaki araştırma laboratuvarı olan SRI'da konuşma teknolojisi direktörü Dimitra Vergyri, üretken yapay zekanın araştırmacıların yıllardır uğraştığı sorunların çoğunu çözdüğünü söyledi. Teknolojinin, sesli asistanların spontan konuşmayı anlayabilmesini ve yararlı yanıtlarla yanıt verebilmesini sağladığını söyledi.

2014 yılında Siri üzerinde çalışan ve asistanı açık sözlü bir şekilde eleştiren eski Apple mühendisi John Burkey, üretken yapay zekanın insanların bilgisayarlardan yardım almasını kolaylaştırması nedeniyle çoğumuzun muhtemelen kendimizle konuşacağına inandığını söyledi. Yakında asistanları işe alacağız ve eğer yeteri kadarımız bunu yapmaya başlarsa, bu bir norm haline gelebilir.

“Siri'nin boyutu sınırlıydı; yalnızca sınırlı sayıda kelime biliyordu” dedi. “Artık daha iyi araçlara sahipler.”

Ancak yeni nesil yapay zeka asistanlarının geniş çapta benimsenmesi, yeni sorunlar ortaya çıkarması nedeniyle yıllar alabilir. ChatGPT, Google'ın Gemini'si ve Meta AI gibi sohbet robotları “halüsinasyonlara” eğilimlidir, yani doğru cevapları bulamadıkları için bir şeyler uydururlar. İnternetteki bilgileri saymak ve özetlemek gibi temel görevleri berbat ettiler.

Sesli asistanlar ne zaman yardımcı olur ve ne zaman olmaz

Uzmanlar, ses teknolojisi gelişmeye devam etse bile, konuşmanın klavye aracılığıyla geleneksel bilgisayar etkileşiminin yerini almasının veya onun yerine geçmesinin pek mümkün olmadığını söylüyor.

Günümüzde insanların, araba kullanırken harita hedefi belirlemek gibi yalnız kaldıkları bazı durumlarda bilgisayarlarla konuşmak için zorlayıcı nedenleri var. Ancak toplum içinde bir asistanla konuşmak sadece tuhaf görünmekle kalmaz, aynı zamanda çoğu durumda sakıncalıdır. Bir markete Meta-Gözlük'ü taktığımda ve onlardan bir parça meyve ve sebzeyi tanımlamalarını istediğimde, dinleyen bir müşteri küstahça şöyle yanıtladı: “Bu bir şalgam.”

Ayrıca trende başkalarına gizli bir iş e-postası dikte etmek istemezsiniz. Benzer şekilde, bir sesli asistandan bir barda kısa mesajları yüksek sesle okumasını istemek düşüncesizce olacaktır.

IBM ve Xerox PARC'ta çalışan ürün tasarımı uzmanı Ted Selker, “Teknoloji bir sorunu çözer” dedi. “Sorunları ne zaman çözüyoruz ve ne zaman sorun yaratıyoruz?”

Araştırma firması Creative Strategies'ten analist Carolina Milanesi, yine de, bilgisayarla konuşmanın size çok yardımcı olduğu ve başkalarına ne kadar garip göründüğünü umursamadığınız zamanları düşünmenin kolay olduğunu söyledi.

Bir sonraki ofis toplantınıza giderken, bir sesli asistandan buluşacağınız kişiler hakkında size bilgi vermesini istemeniz faydalı olacaktır. Bir parkurda yürüyüş yaparken, sesli asistana nereye döneceğinizi sormak, haritayı açmak için durmaktan daha hızlı olacaktır. Bir müzeyi gezerken sesli asistanın baktığınız tabloyla ilgili tarih dersi vermesi faydalı olacaktır. Bu uygulamalardan bazıları halihazırda yeni yapay zeka teknolojisi kullanılarak geliştirilmektedir.

Sesle etkinleştirilen en yeni ürünlerden bazılarını test ederken, bu geleceğe dair bir fikir edindim. Örneğin, bir somun ekmek pişirdiğimi ve Meta gözlüklerimi taktığımı gösteren bir video kaydederken, “Hey Meta, bir video çek” diyebilmek çok yardımcı oldu çünkü ellerim doluydu. Ve Humane'nin Ai Pin'inden yapılacaklar listemi dikte etmesini istemek, durup telefon ekranıma bakmaktan daha kolaydı.

Onlarca yıldır Massachusetts Teknoloji Enstitüsü Medya Laboratuvarı'nda ses arayüzleri üzerinde çalışan Chris Schmandt, “Etrafta dolaşırken, en tatlı nokta burası” dedi.

Yaklaşık 35 yıl önce ilk cep telefonlarından birini aldığında, MIT kampüsünde dolaşırken telefon görüşmeleri yaparken insanların ona baktığını söyledi. Bu artık normaldir.

İnsanların hareket halindeyken ara sıra bilgisayarlarla konuşacağı günün geleceğine inanıyorum, ancak bu çok yavaş gelecek.

Meta ve Google yapay zeka sesli asistanlarına güveniyor. Kalkacaklar mı?

serdal

New member