Yapay Zeka Sohbet Robotlarına Tersine Mühendislik Yöntemiyle Kötü Niyetli Komutlara Cevap Verme Yeteneği Kazandırıldı
Singapur'daki Nanyang Teknoloji Üniversitesi araştırmacıları, yapay zeka sohbet robotlarının normalde yanıtlayamayacakları komutlara cevap verebilme yeteneği kazandırmak için 'tersine mühendislik' yöntemini kullanarak bir çalışma yaptı. Araştırmacılar, sohbet robotlarının kötü niyetli sorguları tespit etme ve savunma mekanizmalarını öğrenerek, bu bilgileri kullanarak robotlara diğer modellerin savunmalarını atlatabilecek komutlar oluşturmayı başardı.
Singapur'un Nanyang Teknoloji Üniversitesindeki (NTU) araştırmacılar, "tersine mühendislik" yöntemiyle, yapay zeka sohbet robotlarının normalde yanıtlayamayacakları komutlara cevap vermelerini sağladı.
Malay Mail sitesinin haberine göre NTU araştırmacıları, ChatGPT, Google Bard ve Microsoft Bing Chat gibi sohbet robotlarına ilişkin çalışma yaptı.
Araştırmacılar, sohbet robotlarının normalde cevaplamayacakları "kötü niyetli" komutları yanıtlamalarını sağlayan yöntem geliştirdi.
"Tersine mühendislik" yöntemini kullanan araştırmacılar, ilk olarak sohbet robotlarının kötü niyetli sorguları nasıl tespit ettiklerini ve kendilerini nasıl savunduklarını belirledi. Ardından bu bilgiler kullanılarak sohbet robotlarına otomatik olarak diğer modellerin savunmalarını atlatabilecek komutlar oluşturmaları öğretildi.
Sohbet robotlarının potansiyel şüpheli faaliyetleri tespit etmek için belirli anahtar kelimeleri işaretledikleri ve bu sözcükleri içeren komutları cevaplamadıklarının saptanması üzerine, kullanılan her karakterden sonra boşluk bırakılarak bu durumun önüne geçildi.
Araştırmanın yazarlarından Liu Yang, bu tekniğin sohbet robotu geliştiricileri tarafından yazılımlarının güvenliğini test etmek amacıyla kullanılabileceğini belirtti.