Mahalanobis uzaklığı tabanlı aykırı değer bulma ve ReliefF öznitelik seçimine dayalı bir makine öğrenmesi yaklaşımı ile akıllı telefon verileri üzerinden stres tespiti
Citation
Ensar Arif Sağbaş, Serdar Korukoğlu, Serkan Ballı. Stress detection on smartphone data with a machine learning approach based on Mahalanobis distance-based outlier finding and ReliefF feature selection. Pamukkale Univ Muh Bilim Derg. 2022; 28(2): 333-345Abstract
Stress is beneficial when a person is focused, awake and alert. However, exposure to high doses of stress harms a person's health. For this reason, it is important to detect stress and begin relief as soon as possible. In this study, soft keyboard typing behaviors with touchscreen panel, gravity, linear acceleration, and gyroscope data obtained from smartphones were examined. It was observed that there was a correlation between the results obtained and typing behaviors and the stress levels of individuals. In this context, an expanded data set was created. In order to detect stress with higher accuracy, a Mahalanobis distance-based outlier detection approach was applied. Subsequently, a structure was created by combining the ReliefF feature selection method and machine learning techniques to identify efficient features and perform classification. The results obtained by cleaning outlier data showed that the created structures achieved success with high accuracy. In addition, outlier detection and cleaning increased the classification success by 1.77 points. Stres kişinin odaklanması, uyanık kalması ve tetikte olması durumlarında fayda sağlamaktadır. Fakat yüksek dozda strese maruz kalmak kişinin sağlığına zarar vermektedir. Bu nedenle stresin tespit edilip en kısa sürede rahatlamaya geçilmesi önemlidir. Bu çalışmada, akıllı telefondan elde edilen dokunmatik panel, yerçekimi, doğrusal ivme ve jiroskop verileri ile yazma davranışları incelenmiştir. Elde edilen sonuçlardan yazma davranışları ile kişilerin stres seviyeleri arasında bir bağlantı olduğu görülmüştür. Bu kapsamda genişletilmiş bir veri kümesi oluşturulmuştur. Stresin daha yüksek doğrulukta tespit edilebilmesi için Mahalanobis uzaklığı tabanlı bir aykırı veri tespiti yaklaşımı uygulanmıştır. Devamında, verimli özniteliklerin tespit edilerek sınıflandırma gerçekleştirilmesi için ReliefF öznitelik seçimi yöntemi ve makine öğrenmesi teknikleri kombine edilerek bir yapı oluşturulmuştur. Aykırı verilerin temizlenerek elde edilen sonuçlar, oluşturulan yapıların yüksek doğrulukta başarı yakaladığını göstermiştir. Ek olarak aykırı veri tespiti ve temizliği, sınıflandırma başarısını 1.77 puan artırmıştır.