DEMET İLCE / MUHABİR
Yapay zeka (AI), insan zekasının bazı yönlerini sergileyen herhangi bir teknolojiyi ifade eder ve on yıllardır bilgisayar biliminde öne çıkan bir alan olmuştur. Yapay zeka görevleri, görsel bir sahnedeki nesneleri seçmekten, bir cümlenin nasıl çerçeveleneceğini bilmeye ve hatta hisse senedi fiyat hareketlerini tahmin etmeye kadar her şeyi içerebilir.
Bilim insanları bilgisayar çağının başlangıcından bu yana yapay zeka oluşturmaya çalışıyorlar. Geçen yüzyılın büyük bölümünde önde gelen yaklaşım, gerçeklerden ve kurallardan oluşan geniş veri tabanları oluşturmayı ve ardından karar vermek için mantık tabanlı bilgisayar programlarının bunlardan yararlanmasını içeriyordu. Ancak bu yüzyılda, bilgisayarların verileri analiz ederek kendi gerçeklerini ve kurallarını öğrenmesini sağlayan yeni yaklaşımlarla bir değişim yaşandı. Bu da alanda büyük ilerlemelere yol açtı.
Geçtiğimiz on yılda makineler, tıbbi görüntülerde meme kanserini tespit etmekten, şeytani derecede zorlu masa oyunları Satranç ve Go'yu oynamaya ve hatta proteinlerin yapısını tahmin etmeye kadar her konuda görünüşte "insanüstü" yetenekler sergiledi.
Büyük dil modeli (LLM) chatbot ChatGPT 2022'nin sonlarında sahneye çıktığından beri, yapay genel zeka olarak bilinen insanlarda görülene benzer daha genel zekayı kopyalamanın eşiğinde olabileceğimiz konusunda da büyüyen bir fikir birliği var. AGI). Yapay zeka şirketi Cohere tarafından oluşturulan, kar amacı gütmeyen bir araştırma laboratuvarı olan Cohere For AI'nın başkanı Sara Hooker, "Bunun saha için ne kadar önemli bir değişim olduğunu ne kadar vurgulasak azdır" dedi.
Yapay zeka nasıl çalışır?
Bilim insanları yapay zeka sistemleri oluşturmak için birçok yaklaşımı benimseyebilirken, günümüzde en yaygın kullanılanı makine öğrenimidir. Bu, daha sonra tahminlerde bulunmak için kullanılabilecek kalıpları belirlemek üzere bir bilgisayarın verileri analiz etmesini içerir.
Öğrenme süreci bir algoritma (insanlar tarafından yazılan ve bilgisayara verilerin nasıl analiz edileceğini söyleyen bir dizi talimat) tarafından yönetilir ve bu sürecin çıktısı, keşfedilen tüm kalıpları kodlayan istatistiksel bir modeldir. Bu daha sonra tahminler oluşturmak için yeni verilerle beslenebilir.
Birçok türde makine öğrenimi algoritması mevcuttur, ancak sinir ağları günümüzde en yaygın kullanılanlar arasındadır. Bunlar, gevşek bir şekilde insan beynini örnek alarak modellenen makine öğrenimi algoritmalarının koleksiyonlarıdır ve eğitim verileri arasında gezinirken "yapay nöronlar" ağı arasındaki bağlantıların gücünü ayarlayarak öğrenirler. Bu, metin ve görüntü oluşturucular gibi günümüzün en popüler yapay zeka hizmetlerinin çoğunun kullandığı mimaridir.
Günümüzün en ileri araştırmalarının çoğu, birçok yapay nöron katmanına sahip çok büyük sinir ağlarının kullanılması anlamına gelen derin öğrenmeyi içeriyor. Bu fikir 1980'lerden beri ortalıkta dolaşıyor; ancak devasa veriler ve hesaplama gereksinimleri uygulamaları sınırladı. Daha sonra 2012 yılında araştırmacılar, grafik işlem birimleri (GPU'lar) olarak bilinen özel bilgisayar çiplerinin derin öğrenmeyi hızlandırdığını keşfettiler. Derin öğrenme o zamandan beri araştırmada altın standart haline geldi.
Hooker, "Derin sinir ağları, steroidler üzerinde bir tür makine öğrenimidir. Her ikisi de hesaplama açısından en pahalı modellerdir, ancak aynı zamanda genellikle büyük, güçlü ve etkileyicidirler" dedi.
Ancak tüm sinir ağları aynı değildir. Farklı konfigürasyonlar veya bilindiği şekliyle "mimariler" farklı görevlere uygundur. Evrişimsel sinir ağları, hayvanın görsel korteksinden ilham alan bağlantı modellerine sahiptir ve görsel görevlerde mükemmeldir. Bir tür dahili belleğe sahip olan tekrarlayan sinir ağları, sıralı verilerin işlenmesinde uzmanlaşmıştır.
Algoritmalar uygulamaya bağlı olarak farklı şekilde de eğitilebilir. En yaygın yaklaşım "denetimli öğrenme" olarak adlandırılır ve insanların, model öğrenme sürecini yönlendirmek için her veri parçasına etiket atamasını içerir. Örneğin kedi resimlerine "kedi" etiketini eklersiniz.
"Denetimsiz öğrenmede" eğitim verileri etiketlenmez ve makinenin işleri kendisi yapması gerekir. Bu, çok daha fazla veri gerektirir ve çalıştırılması zor olabilir; ancak öğrenme süreci, insanın önyargıları tarafından sınırlandırılmadığı için, daha zengin ve daha güçlü modellerin ortaya çıkmasına yol açabilir. LLM'lerdeki son atılımların çoğu bu yaklaşımı kullandı.
Son ana eğitim yaklaşımı, yapay zekanın deneme yanılma yoluyla öğrenmesine olanak tanıyan "takviyeli öğrenme"dir. Bu, en yaygın olarak oyun oynayan yapay zeka sistemlerini veya robotları (Şekil 01'deki gibi insansı robotlar veya futbol oynayan minyatür robotlar dahil) eğitmek için kullanılır ve bir görevi tekrar tekrar denemeyi ve olumlu veya olumsuz geri bildirimlere yanıt olarak bir dizi dahili kuralı güncellemeyi içerir. Bu yaklaşım Google Deepmind'ın çığır açan AlphaGo modelini güçlendirdi.
Üretken yapay zeka nedir?
Derin öğrenmenin son on yılda bir dizi büyük başarıya imza atmasına rağmen, çok azı kamuoyunun hayal gücünü ChatGPT'nin esrarengiz insani konuşma yetenekleriyle aynı şekilde yakalayabildi. Bu, kullanıcının girdisine dayalı olarak metin, resim, ses ve hatta video dahil olmak üzere bir çıktı oluşturmak için derin öğrenmeyi ve sinir ağlarını kullanan çeşitli üretken yapay zeka sistemlerinden biridir.
ChatGPT gibi metin oluşturucular, "doğal dil işleme" (NLP) olarak bilinen bir yapay zeka alt kümesini kullanarak çalışır. Bu atılımın kökeni, Google bilim adamlarının 2017 yılında tanıttığı "transformer" adı verilen yeni bir derin öğrenme mimarisine kadar izlenebilir.
Transformer algoritmaları, büyük miktarda sıralı veri koleksiyonu (özellikle büyük yazılı metin parçaları) üzerinde denetimsiz öğrenme gerçekleştirme konusunda uzmanlaşmıştır. Bunu yapmakta iyiler çünkü uzaktaki veri noktaları arasındaki ilişkileri önceki yaklaşımlara göre çok daha iyi izleyebiliyorlar, bu da onlara baktıkları şeyin bağlamını daha iyi anlamalarını sağlıyor.
Hooker, "Bundan sonra söyleyeceklerim daha önce söylediklerime bağlı; dilimiz zamanla bağlantılıdır. Bu, en önemli buluşlardan biriydi; kelimeleri bir bütün olarak görebilme yeteneği." dedi.
LLM'ler, daha önce gelenlere dayanarak ne olduğunu tahmin etmeye çalışmadan önce bir cümledeki sonraki kelimeyi maskeleyerek öğrenirler. Eğitim verileri zaten cevabı içeriyor, dolayısıyla yaklaşım herhangi bir insan etiketlemesi gerektirmiyor, bu da internetten veri yığınlarının basitçe kazınmasını ve algoritmaya beslenmesini mümkün kılıyor. Transformers ayrıca bu eğitim oyununun birden fazla örneğini paralel olarak gerçekleştirebilir, bu da onların verileri çok daha hızlı değiştirmelerine olanak tanır.
Dönüştürücüler bu kadar büyük miktarda veri üzerinde eğitim alarak insan dilinin son derece karmaşık modellerini üretebilir; dolayısıyla "büyük dil modeli" adı da buradan gelir. Ayrıca, bir insanın üretebileceği metne çok benzeyen karmaşık, uzun biçimli metinleri analiz edebilir ve oluşturabilirler. Transformatörlerin devrim yarattığı yalnızca dil değil. Aynı mimari aynı zamanda metin ve görüntü verileri üzerinde paralel olarak eğitilerek basit bir yazılı açıklamadan yüksek çözünürlüklü görüntüler üreten Stabil Difüzyon ve DALL-E gibi modellerle sonuçlanabilir.
Transformatörler ayrıca Google Deepmind'in amino asit dizilerinden protein yapıları oluşturabilen AlphaFold 2 modelinde de merkezi bir rol oynadı. Mevcut verileri basitçe analiz etmek yerine orijinal veriler üretme yeteneği, bu modellerin "üretken yapay zeka" olarak bilinmesinin nedenidir.
Narrow AI ve yapay genel zeka (AGI): Fark nedir?
Gerçekleştirebilecekleri görevlerin çeşitliliği nedeniyle insanlar LLM'ler konusunda heyecanlanmaya başladı. Çoğu makine öğrenimi sistemi, video akışındaki yüzleri algılamak veya bir dilden diğerine çeviri yapmak gibi belirli bir sorunu çözmek için eğitilir. Bu modeller “narrow yapay zeka” olarak biliniyor çünkü yalnızca eğitildikleri belirli görevin üstesinden gelebiliyorlar.
Çoğu makine öğrenimi sistemi, bir video akışındaki yüzleri tespit etmek veya bir dilden diğerine çeviri yapmak gibi belirli bir sorunu insanüstü bir düzeye kadar çözmek için eğitilir; çünkü bunlar, bir insandan çok daha hızlıdır ve daha iyi performans gösterir. Ancak ChatGPT gibi LLM'ler, tek bir modelin çok çeşitli görevleri yerine getirebilmesi nedeniyle yapay zeka yeteneklerinde bir adım değişikliği temsil ediyor. Çeşitli konularla ilgili soruları yanıtlayabilir, belgeleri özetleyebilir, diller arasında çeviri yapabilir ve kod yazabilirler.
Pek çok farklı sorunu çözmek için öğrendiklerini genelleştirme yeteneği, geçen yıl yayınlanan bir makalede DeepMind bilim adamlarının da aralarında bulunduğu bazı kişilerin Yüksek Lisans'ın AGI'ye doğru bir adım olabileceği yönünde spekülasyon yapmasına yol açtı. YGZ, bir insanın yapabileceği her türlü bilişsel görevde ustalaşabilen, sorunlar hakkında soyut mantık yürütebilen ve özel bir eğitim gerektirmeden yeni durumlara uyum sağlayabilen, gelecekteki varsayımsal bir yapay zekayı ifade eder.
Yapay zeka meraklıları, YGZ'ye ulaşıldığında teknolojik ilerlemenin hızla hızlanacağını, "tekillik" olarak bilinen bir dönüm noktasının ardından atılımların katlanarak gerçekleşeceğini tahmin ediyor. Aynı zamanda, büyük ekonomik ve işgücü piyasasındaki aksamalardan yapay zekanın yeni patojenler veya silahlar keşfetme potansiyeline kadar uzanan algılanan varoluşsal riskler de var.
Ancak LLM'lerin bir YGZ'nin öncüsü mü olacağı, yoksa daha geniş bir ağ veya AGI için ihtiyaç duyulan yapay zeka mimarileri ekosistemindeki tek bir mimari mi olacağı konusunda hala tartışmalar var. Bazıları Yüksek Lisans'ın insan muhakemesini ve bilişsel yeteneklerini kopyalamaktan kilometrelerce uzakta olduğunu söylüyor. İftira atanlara göre, bu modeller çok miktarda bilgiyi basitçe ezberlemiş ve bunları daha derin bir anlayışa dair yanlış bir izlenim verecek şekilde yeniden birleştirmişlerdir; bu, bunların eğitim verileriyle sınırlı olduğu ve diğer dar kapsamlı yapay zeka araçlarından temelde farklı olmadığı anlamına gelir.
Hooker, yine de yüksek lisansların bilim adamlarının yapay zeka gelişimine yaklaşımında sismik bir değişimi temsil ettiği kesin. En son teknolojiye sahip araştırmalar, modelleri belirli görevlere göre eğitmek yerine artık bu önceden eğitilmiş, genel olarak yetenekli modelleri alıyor ve bunları belirli kullanım senaryolarına uyarlıyor. Bu durum onların "temel modeller" olarak anılmasına yol açmıştır.
Hooker, "İnsanlar yalnızca tek bir şey yapan çok özel modellerden, her şeyi yapan temel modele geçiyor. Onlar her şeyin üzerine inşa edildiği modeller." diye ekledi.
Yapay zeka gerçek dünyada nasıl kullanılıyor?
Makine öğrenimi gibi teknolojiler her yerde. Yapay zeka destekli öneri algoritmaları Netflix veya YouTube'da ne izleyeceğinize karar verirken çeviri modelleri bir web sayfasını yabancı dilden kendi dilinize anında dönüştürmeyi mümkün kılar. Bankanız muhtemelen hesabınızda dolandırıcılık izlenimi verebilecek olağandışı etkinlikleri tespit etmek için yapay zeka modellerini kullanıyor ve güvenlik kameraları ve sürücüsüz arabalar, video akışlarından insanları ve nesneleri tanımlamak için bilgisayarlı görüş modellerini kullanıyor.
Ancak üretken yapay zeka araçları ve hizmetleri, ChatGPT gibi yeni sohbet robotlarının ötesinde gerçek dünyaya sızmaya başlıyor. Artık çoğu büyük yapay zeka geliştiricisinin, kullanıcıların çeşitli konulardaki sorularını yanıtlayabilen, belgeleri analiz edip özetleyebilen ve diller arasında çeviri yapabilen bir sohbet robotu var. Bu modeller aynı zamanda Gemini'nin Google Arama'ya girmesi gibi arama motorlarına da entegre ediliyor ve şirketler aynı zamanda Github Copilot gibi programcıların kod yazmasına yardımcı olan yapay zeka destekli dijital asistanlar da geliştiriyor. Kelime işlemci veya e-posta istemcileri kullanan kişiler için üretkenliği artıran bir araç bile olabilirler.
Chatbot tarzı yapay zeka araçları en yaygın olarak bulunan üretken yapay zeka hizmetidir, ancak etkileyici performanslarına rağmen Yüksek Lisans'lar hala mükemmel olmaktan uzaktır. Belirli bir istemin ardından hangi kelimelerin gelmesi gerektiği konusunda istatistiksel tahminler yaparlar. Çoğu zaman anladığını gösteren sonuçlar üretseler de, aynı zamanda "halüsinasyonlar" olarak bilinen makul ancak yanlış yanıtları da güvenle üretebilirler.
Üretken yapay zeka giderek yaygınlaşırken, bu araçların nerede ve nasıl en yararlı olacağı henüz net değil. Hooker, teknolojinin ne kadar yeni olduğu göz önüne alındığında, ne kadar hızlı kullanıma sunulacağı konusunda dikkatli olmak için nedenlerin olduğunu söyledi. "Bir şeyin teknik olanakların sınırında olması ama aynı zamanda geniş çapta konuşlandırılması çok alışılmadık bir durum. Bu da kendi risklerini ve zorluklarını beraberinde getiriyor." diye ekledi.