İngiltere'deki bir üniversite araştırma ekibi internetin güvenlik tehdidinin boyutlarını ortaya koyan bir çalışma gerçekleştirdi.
Araştırmacılar klavye tuş vuruşlarıyla veri çalabilen bir derin öğrenme modeli geliştirdi. Saldırının ilk aşamasında derin öğrenme modeli klavye sesleri kullanılarak eğitildi. Mikrofon aracılığıyla kaydedilen ses kayıtları özel bir yapay zeka algoritması kullanılarak modele aktarıldı.
Çalışmanın sonunda sistem klavye vuruşlarını analiz ederek kullanıcının hangi tuşlara bastığını tahmin etmeyi öğrendi.
Araştırmacılar geliştirdikleri derin öğrenme modelinin klavye vuruşlarını yüzde 95 doğrulukla tahmin edebildiğini belirtti. Ancak Zoom veya Google Meet gibi video konferans uygulamaları üzerinden kaydedilen tuş vuruşlarında bu oranın yüzde 93'e kadar düştüğü gözlemlendi.
Bu çalışma klavye seslerinin sanıldığından çok daha büyük bir güvenlik riski oluşturabileceğini gösteriyor ve kullanıcıların gizli bilgilerini korumak için daha dikkatli olmaları gerektiğini vurguluyor.
MacBook Pro Kullanıldı
Apple MacBook Pro model bir dizüstü bilgisayar kullanılarak sistem eğitildi. Bilgisayardaki tuşlara her defasında 25 kez basıldı ve her basışın sesi iPhone 13 mini'nin mikrofonuyla kaydedildi. Araştırmacılar kayıtları kullanarak her tuş için farklı dalga biçimleri ve spektrogramlar üretti.
Tuş vuruşu görüntülerini sınıflandırmak için "CoAtNet" adlı (convolution and self-attention networks) bir derin öğrenme modeli kullanıldı. Araştırmacılar telefonu MacBook Pro'nun yaklaşık 17 cm uzağına yerleştirdi. İlk denemelerde program yüzde 95 doğruluk oranına ulaştı ancak Zoom ve Skype gibi platformlarda yüzde 93 ve yüzde 91 başarı oranları elde edildi.