Item request has been placed! ×
Item request cannot be made. ×
loading  Processing Request

Neonatal Sepsis Detection With Random Forest Classification for Heavily Imbalanced Data

Item request has been placed! ×
Item request cannot be made. ×
loading   Processing Request
  • المؤلفون: Osman Abubaker, Ayman
  • نوع التسجيلة:
    Electronic Resource
  • الدخول الالكتروني :
    http://urn.kb.se/resolve?urn=urn:nbn:se:kth:diva-323733
    TRITA-EECS-EX ; 2022:176
  • معلومة اضافية
    • Publisher Information:
      KTH, Skolan för elektroteknik och datavetenskap (EECS) 2022
    • نبذة مختصرة :
      Neonatal sepsis is associated with most cases ofmortality in the neonatal intensive care unit. Major challengesin detecting sepsis using suitable biomarkers has lead people tolook for alternative approaches in the form of Machine Learningtechniques. In this project, Random Forest classification wasperformed on a sepsis data set provided by Karolinska Hospital.We particularly focused on tackling class imbalance in the datausing sampling and cost-sensitive techniques. We compare theclassification performances of Random Forests in six differentsetups; four using oversampling and undersampling techniques;one using cost-sensitive learning and one basic Random Forest.The performance with the oversampling techniques were betterand could identify more sepsis patients than the other setups.The overall performances were also good, making the methodspotentially useful in practice.
      Neonatal sepsis är orsaken till majoriteten av mortaliteten i neonatal intensivvården. Svårigheten i att detektera sepsis med hjälp av biomarkörer har lett många att leta efter alternativa metoder. Maskininlärningstekniker är en sådan alternativ metod som har i senaste tider ökat i användning inom vård och andra sektorer. I detta project användes Random Forest klassifikations algoritmen på en sepsis datamängd given av Karolinska Sjukhuset. Vi fokuserade på att hantera klassimbalansen i datan genom att använda olika provtagningsoch kostnadskänsliga metoder. Vi jämförde klassificeringsprestanda för Random Forest med sex olika inställningar; fyra av de använde provtagingsmetoderna; en av de använde en kostnadskänslig metod och en var en vanlig Random Forest. Det visade sig att modellens prestanda ökade som mest med översamplings metoderna. Den generella klassificeringsprestandan var också bra, vilket gör Random Forests tillsammans med ingsmetoderna potentiellt användbar i praktiken.
      Kandidatexjobb i elektroteknik 2022, KTH, Stockholm
    • الموضوع:
    • Note:
      application/pdf
      English
    • Other Numbers:
      UPE oai:DiVA.org:kth-323733
      1372274373
    • Contributing Source:
      UPPSALA UNIV LIBR
      From OAIster®, provided by the OCLC Cooperative.
    • الرقم المعرف:
      edsoai.on1372274373
HoldingsOnline