Türkiye, küresel teknoloji devlerinin yapay zeka alanındaki hakimiyetine karşı kendi ulusal çözümünü geliştirerek teknolojik bağımsızlık yolunda tarihi bir adım attı. Sanayi ve Teknoloji Bakanı Mehmet Fatih Kacır, tamamen Türkçe verilerle eğitilen ve 2 trilyon tokenlik dev bir veri setine dayanan Türkiye’nin ilk büyük dil modelinin geliştirildiğini duyurdu. Bu hamle, Türkiye’nin yapay zeka çağında sadece bir tüketici değil, aynı zamanda üretici ve oyun kurucu olma vizyonunun en somut adımı olarak kayıtlara geçti.
⚙️ Teknik Detaylar ve Gelecek Vizyonu
TÜBİTAK BİLGEM Yapay Zeka Enstitüsü’nün liderliğinde yürütülen proje, etkileyici teknik detaylara sahip. Bakan Kacır’ın paylaştığı bilgilere göre:
- Bugüne kadar 2 trilyon tokenlik devasa bir Türkçe veri seti derlendi.
- Bu veri setinden titizlikle temizlenen 300 milyar tokenlik bir veri havuzu, modelin eğitimi için kullanıldı.
- Sonuç olarak, yüksek doğrulukla metin işleyebilen, Türkiye’nin kültürüne ve dil yapısına uygun yerli dil modelleri ortaya kondu.
Projenin vizyonu ise metinle sınırlı değil. Hedef, bu modelleri “görüntü ve ses gibi çoklu veri türlerini birlikte işleyebilen, çok modlu yapay zeka sistemlerine” dönüştürerek daha da geliştirmek.
🚀 Sadece Bir Model Değil, Bütüncül Bir Ekosistem
Bakan Kacır, bu projenin izole bir çalışma olmadığını, Milli Teknoloji Hamlesi vizyonuyla daha geniş bir ekosistemin parçası olduğunu vurguladı. Türkiye’nin süper bilgisayar altyapısını yeni nesil işlemcilerle güçlendirmesi ve TEKNOFEST gibi organizasyonlarla on binlerce genci yapay zeka alanında yetiştirmesi, bu milli dil modelini destekleyen ve gelecekte daha da ileriye taşıyacak olan diğer önemli adımlar olarak öne çıkıyor.
Kaynaklar: Anadolu Ajansı, T.C. Sanayi ve Teknoloji Bakanlığı, TÜBİTAK BİLGEM