Yapay zeka alanındaki gelişmeler, OpenAI’in 2023’te ChatGPT-4’ü ve Anthropic AI’in bu ayın başlarında Claude 3’ü piyasaya sürmesiyle hız kazanıyor. Bu modeller, içerik geliştiricilerin işlerini kolaylaştırırken, şimdi de yazılım mühendisleri için bir yenilikçi geldi: Cognition‘un Devin‘i.
Devin, SWE-bench kodlama benchmark’ında yeni bir standart belirleyerek dünyanın ilk tam otomatik yapay zeka yazılım mühendisi oldu. Tek bir uyarı ile Devin, insan bir yazılım mühendisi gibi kod yazabilir veya web siteleri oluşturabilir.
Devin, tek bir uyarı ile karmaşık kod ve yazılım mühendisliği görevlerini planlayabilen, analiz edebilen ve uygulayabilen otonom bir modeldir. Kendi komut satırına, bir kod düzenleyicisine ve ayrı bir web tarayıcısına sahip olmasıyla dikkat çeker.
Modelin yetenekleri, Meta’nın Llama 2’sini farklı API sağlayıcılarında test ederek gösterildi. Devin, problemle başa çıkmadan önce adım adım bir “Plan” oluşturdu. Ardından, insan bir yazılım mühendisi gibi aynı araçları kullanarak projeyi tamamladı. Yerleşik tarayıcısını kullanarak API belgelerini inceleyerek ve her API’ye nasıl takılacağını öğrenerek web sitesini oluşturdu ve dağıttı.
Devin’i diğer modellerden ayıran şey, hatalardan öğrenebilme yeteneğidir. Binlerce karar alabilir ve zamanla daha iyi hale gelebilir. Standart yazılım mühendisliği problemleri üzerinde test edildiğinde diğer çözümleri geride bıraktı.
Devin, AI görevleriyle ilgili önde gelen teknoloji markalarıyla görüşmeler yaptı ve beklentileri karşıladı. Ayrıca, Upwork gibi platformlarda yayınlanan gerçek işlerden görevleri tamamladı.
GitHub Copilot gibi bir kod tamamlama aracında Devin’in bir ön izlenimi görüldü. Programcılar, uyarıları çalışabilir kodlara dönüştürebilirler. Devin, kod parçalarını tamamlamanın yanı sıra bunları birden fazla dile çevirebilir ve insan müdahalesi olmadan kodları baştan sona tamamlayabilir.
Devin’in çalışma şekli, kendi komut satırı, kod uyarıcısı bölümü ve kaynakları toplamak için kendi web tarayıcısına sahip olmasıyla tanımlanır. Bir uyarı girildiğinde, Devin “Planlayıcı” moduna girer ve adım adım bir rehber sağlar. Bu işlem tamamlandıktan sonra, kontrol paneli dört bölümlük bir arayüze geçer ve çözümün görselleştirmesini sağlar.
Devin’e erken erişim sağlamak için bekleme listesine katılabilirsiniz.
Devin, SWE-bench adlı bir karşılaştırma platformunda test edildi ve diğer modellere göre oldukça başarılı sonuçlar elde etti. Bu sonuçlar, özellikle yazılım geliştiriciler ve mühendisler arasında, yazılım işlerinin ve ilgili işlerin geleceği konusunda tartışmalara neden oldu.
Cognition, Devin’in insanları tamamen değiştirmek yerine onlara yardım etmek için tasarlandığını ve mühendislerin daha ilginç problemlere odaklanmalarını ve daha iddialı hedeflere ulaşmalarını sağladığını belirtiyor.
Yapay zeka alanındaki bu ilerlemeler, gelecekte Generative AI’nın umut verici olduğunu gösteriyor.