Bağlama duyarlı hassasiyetle NLP, bilgisayarla görme ve konuşma tanımada devrim yaratan yapay zekada öz dikkatin gücünü keşfedin.
Öz dikkat, bir modelin tek bir girdi dizisi içindeki farklı unsurların önemini tartmasını sağlayan bir mekanizmadır. Girdinin her parçasını eşit olarak ele almak yerine, modelin belirli bir öğeyi işlerken seçici olarak en ilgili parçalara odaklanmasını sağlar. Bu yetenek, bağlamı, uzun menzilli bağımlılıkları ve veri içindeki ilişkileri anlamak için çok önemlidir ve başta Transformer olmak üzere birçok modern Yapay Zeka (AI) mimarisinin temelini oluşturur. Doğal Dil İşleme (NLP) alanında devrim yaratan "Attention Is All You Need" adlı ufuk açıcı makalede ünlü bir şekilde tanıtılmıştır.
Özünde, selfattention, o anda işlenmekte olan öğeye göre girdi dizisindeki diğer her öğeye bir "dikkat puanı" atayarak çalışır. Bu, her girdi öğesi için üç vektör oluşturularak gerçekleştirilir: bir Sorgu (Q), bir Anahtar (K) ve bir Değer (V).
Belirli bir Sorgu için mekanizma, dizideki tüm Anahtarlarla benzerliğini hesaplar. Bu benzerlik puanları daha sonra ağırlıklara dönüştürülür (genellikle bir softmax işlevi kullanılarak) ve bu da her bir öğenin Değerine ne kadar odaklanılması gerektiğini belirler. Sorgu için nihai çıktı, tüm Değerlerin ağırlıklı bir toplamıdır ve bu öğenin tüm diziden bağlamla zenginleştirilmiş yeni bir temsilini oluşturur. Bu süreç, Büyük Dil Modellerinin (LLM'ler) nasıl çalıştığının önemli bir parçasıdır. Bu Q-K-V sürecinin mükemmel bir görsel açıklaması Jay Alammar'ın blogu gibi kaynaklarda bulunabilir.
Kendi kendine dikkat, belirli bir dikkat mekanizması türüdür. Temel ayrım, Sorgu, Anahtar ve Değer vektörlerinin kaynağıdır.
İlk olarak metin özetleme ve çeviri gibi görevler için NLP'de popüler hale gelmiş olsa da, öz dikkatin bilgisayarla görme (CV) alanında da oldukça etkili olduğu kanıtlanmıştır.
Araştırmalar, daha fazla hesaplama verimliliği (örneğin, FlashAttention ve seyrek dikkat varyantları gibi yöntemler) ve daha geniş uygulanabilirlik hedefleyerek kendi kendine dikkat mekanizmalarını iyileştirmeye devam etmektedir. YZ modellerinin karmaşıklığı arttıkça, kendi kendine dikkatin, robotik gibi özel YZ uygulamalarından Yapay Genel Zeka (AGI) arayışına kadar alanlarda ilerlemeyi sağlayan bir köşe taşı teknolojisi olmaya devam etmesi beklenmektedir. Ultralytics HUB gibi araçlar ve platformlar, genellikle Hugging Face gibi depolarda bulunan ve PyTorch ve TensorFlow gibi çerçevelerle geliştirilen bu gelişmiş teknikleri içeren modellerin eğitimini ve dağıtımını kolaylaştırır.