Araştırmacılar şaşırttı. Dil modellerinin de siyasi görüşünün olduğu ortaya çıktı
Dil modellerinin, yapay zeka tabanlı sohbet robotlarının temelini oluşturduğu ve bu modellerin politik görüşlere sahip olduğu bilim insanları tarafından ortaya konuldu.
ABD'de yapılan bir araştırmada, veri havuzlarının, halihazırda yaygın olarak kullanılan yapay zeka sohbet robotlarının yapı taşı niteliğindeki LM'lerin politik görüşlerine etkisi üzerinde incelemeler yapıldı.
Bilim insanları bu kapsamda, 14 farklı LM üzerinde, yatay eksende sağ ve sol olmak üzere ekonomik değerler, dikey eksende ise liberal ve muhafazakar olmak üzere sosyal değerler bulunan siyasi pusula testini uyguladı.
Araştırmada ayrıca, LM'leri eğitmek için kullanılan haberler, tartışma forumları, kitaplar, çevrim içi ansiklopediler gibi çeşitli veri kaynaklarının içeriğindeki politik eğilimlerin, doğal dil işleme modeli (NLP) üzerindeki etkisi ve söz konusu etki sonucunda LM'nin ürettiği dezenformasyon ve nefret söylemleri incelendi.
Araştırma sonucunda, eğitildikleri veri havuzundaki kaynakların politik eğilimlerini taşıyan LM'lerin, görüşleriyle paralel yönelimde nefret söylemi ve dezenformasyona sebep olduğu kaydedildi.
Buna ek olarak, Eski ABD Başkanı Donald Trump'ın göreve başladığı 20 Ocak 2017 tarihi milat alınarak, bu tarihten önceki ve sonraki veri setleriyle eğitilen LM'ler kıyaslandığında, Trump dönemi ve sonrasına ait verilerle eğitilen LM'lerin eğilimlerinin, siyasi pusulada daha uçlarda konumlandığı tespit edildi.
LM'ler arasında "BERT" varyantlarının "GPT" modellerine kıyasla daha muhafazakar eğilimli olduğu ve aynı firmanın geliştirdiği çeşitli LM'lerin politik eğilimlerinde de azımsanamaz farklılıklar gözlemlendiği belirtildi.
Eğitilen LM'lerin ekonomik konulara kıyasla, sosyal konulara daha taraflı yaklaşması, sosyal konulara ilişkin veri bolluğuna karşın ekonomik yorumlama için daha geniş bir veri seti gerekliliğine bağlandı.
Hiçbir dil modelinin sosyal taraflılıktan tamamen arınmış olamayacağını vurgulayan araştırmacılar, aşırı politik görüşleri temsil eden kaynaklar kullanılarak eğitilen LM'lerin, toplumda var olan kutuplaşmayı daha da derinleştirebilmesinin teorik olarak mümkün olduğu konusunda uyardı.
Araştırmanın sonuçları, "Association for Computational Linguistics"in 61'inci yıllık toplantı raporunda yayımlandı.