Sözlük

Transfer Öğrenimi

Zaman kazanmak, yapay zeka performansını artırmak ve önceden eğitilmiş modelleri kullanarak sınırlı veriyle yeni görevlerin üstesinden gelmek için aktarmalı öğrenmenin gücünü ortaya çıkarın.

Transfer öğrenimi, bir görev için geliştirilen bir modelin ikinci, ilgili bir görevdeki bir model için başlangıç noktası olarak yeniden kullanıldığı bir makine öğrenimi (ML) tekniğidir. Büyük miktarda veri ve hesaplama kaynağı gerektiren sıfırdan bir model oluşturmak yerine, transfer öğrenimi kaynak görevden öğrenilen özellikler, ağırlıklar ve kalıplar gibi bilgilerden yararlanır. Bu yaklaşım son derece verimlidir ve özellikle bilgisayarla görme (CV) alanında modern derin öğrenmenin temel taşı haline gelmiştir. Geliştiriciler, önceden eğitilmiş bir model kullanarak önemli ölçüde daha az veri ve daha kısa eğitim süreleriyle daha yüksek performans elde edebilirler.

Transfer Öğrenimi Nasıl Çalışır?

Transfer öğrenmenin arkasındaki temel fikir, görüntü sınıflandırması için ImageNet gibi büyük ve genel bir veri kümesi üzerinde eğitilen bir modelin kenarlar, dokular ve şekiller gibi evrensel özellikleri tanımayı zaten öğrenmiş olmasıdır. Bu temel bilgi, modelin genellikle omurga olarak adlandırılan ilk katmanlarında saklanır.

Süreç tipik olarak iki ana adımdan oluşur:

  1. Önceden Eğitilmiş Bir Modelle Başlayın: Daha önce büyük bir kıyaslama veri kümesi üzerinde eğitilmiş bir model seçilir. Örneğin, çoğu Ultralytics YOLO modeli COCO veri kümesi üzerinde önceden eğitilmiş ağırlıklarla birlikte gelir. Bu modeller zaten genel nesne özellikleri hakkında sağlam bir anlayışa sahiptir.
  2. İnce Ayar: Önceden eğitilmiş model daha sonra yeni, özel bir göreve uyarlanır. İnce ayar olarak bilinen bu uyarlama, modelin daha küçük, göreve özgü bir veri kümesi üzerinde daha fazla eğitilmesini içerir. Bu aşamada, önceden öğrenilmiş değerli özellikleri kaybetmeden modelin ağırlıklarında küçük ayarlamalar yapmak için öğrenme oranı genellikle düşük tutulur. Ayrıntılı bir kılavuz için transfer öğrenimi hakkındaki PyTorch eğitimine başvurabilirsiniz.

Gerçek Dünya Uygulamaları

Transfer öğrenimi sadece teorik bir kavram değildir; birçok sektörde pratik uygulamaları vardır.

  • Tıbbi Görüntü Analizi: Bir model genel ImageNet veri kümesi üzerinde önceden eğitilebilir ve daha sonra MRI taramalarından beyin tümörleri gibi belirli anomalileri tespit etmek için ince ayar yapılabilir. Etiketli tıbbi verilerin elde edilmesi genellikle az ve pahalı olduğundan, transfer öğrenimi milyonlarca tıbbi görüntüye ihtiyaç duymadan doğru teşhis araçlarının oluşturulmasına olanak tanır. Bu konuda daha fazla bilgi için, yapay zekanın radyolojide nasıl yeni bir hassasiyet çağı yarattığına bakın.
  • Otonom Araçlar: Bir nesne algılama modeli, yol görüntülerinden oluşan büyük bir veri kümesi üzerinde önceden eğitilebilir ve ardından belirli bir otomobil üreticisi tarafından benzersiz araç modellerini tanımak veya belirli hava koşullarında çalışmak için ince ayar yapılabilir. Bu, mevcut araç, yaya ve işaret bilgisinden yararlanarak gelişimi hızlandırır ve güvenliği artırır.

Transfer Öğrenimi ve İlgili Kavramlar

Transfer öğrenimini diğer makine öğrenimi tekniklerinden ayırmak önemlidir:

  • Temel Modelleri: Bunlar, çeşitli alt görevlere uyarlanmak üzere özel olarak tasarlanmış, büyük miktarda veri üzerinde önceden eğitilmiş büyük ölçekli modellerdir. Transfer öğrenimi, bu temel modellerin uyarlanması sürecidir.
  • Sıfır Atışla Öğrenme: Bu teknik, bir modelin eğitim sırasında görmediği sınıfları tanımasını sağlar. Transfer öğrenme, bir modeli bazı yeni verilerle yeni bir göreve uyarlarken, sıfır vuruşlu öğrenme yeni sınıfların herhangi bir örneği olmadan genelleme yapmayı amaçlar. Few-Shot, Zero-Shot ve Transfer Learning hakkındaki kılavuzumuz bu farkları daha ayrıntılı olarak açıklamaktadır.
  • Bilgi Distilasyonu: Bu, verimlilik elde etmek için daha büyük bir "öğretmen" modelinin davranışını taklit etmek üzere daha küçük bir "öğrenci" modelinin eğitilmesini içerir. Transfer öğrenme, bilginin bir görevden diğerine uyarlanmasına odaklanırken, damıtma aynı görev içinde bilginin sıkıştırılmasına odaklanır.

Araçlar ve Çerçeveler

Transfer öğrenimini uygulamak çeşitli araçlar ve platformlar aracılığıyla erişilebilir hale getirilmiştir. PyTorch ve TensorFlow gibi çerçeveler kapsamlı dokümantasyon ve önceden eğitilmiş modeller sağlar. Ultralytics HUB gibi platformlar, kullanıcıların YOLOv8 ve YOLO11 gibi önceden eğitilmiş modelleri kolayca yüklemelerine, yeni veri kümeleri üzerinde özel eğitim gerçekleştirmelerine ve model dağıtımını yönetmelerine olanak tanıyarak tüm iş akışını kolaylaştırır. Daha derin bir teorik anlayış için Stanford CS231n'in transfer öğrenmeye genel bakışı gibi kaynaklar çok değerlidir.

Ultralytics topluluğuna katılın

Yapay zekanın geleceğine katılın. Küresel yenilikçilerle bağlantı kurun, işbirliği yapın ve büyüyün

Şimdi katılın
Panoya kopyalanan bağlantı