A Machine-Learning-Based Investigation of ADHD Diagnosis Using the HYPERAKTIV Dataset

Nora Fink

Read the full article

Discuss this preprint

Start a discussion What are Sciety discussions?

Listed in

This article is not in any list yet, why not save it to one of your lists.

Abstract

Attention-Deficit/Hyperactivity Disorder (ADHD) is a common neuropsychiatric condition affecting up to 5% of adults worldwide, imposing significant burdens on daily functioning, social interactions, and overall quality of life. Traditional diagnostic practices largely rely on subjective evaluations and clinical observations. Recent computational approaches have explored objective diagnostic support using wearable sensors and machine-learning algorithms, but reproducibility and standard benchmarks remain limited. In this paper, we present a full end-to-end study using the publicly available HYPERAKTIV dataset, which comprises motor activity data, heart-rate data, computerized test scores (CPT-II), and comprehensive patient information (demographics, diagnostic assessments, medication use). We examine data from 103 participants—51 diagnosed with ADHD and 52 clinical controls—and propose a supervised-learning pipeline that includes data preprocessing, feature extraction, hyperparameter tuning, model evaluation, and result visualization. We achieve promising results using Logistic Regression (73.08% accuracy), Random Forest (76.92%), and XGBoost (80.77%). Our findings confirm the feasibility of combining objective sensor data and classic neuropsychological testing to differentiate adult ADHD from other clinical conditions. This paper provides a step-by-step methodology, complete with code references, experiment details, metrics, and interpretive insights. We compare our work against another study on the same dataset (Hicks et al., HYPERAKTIV: An Activity Dataset from Adult Patients with ADHD) and discuss new aspects, such as additional feature engineering and improved classification performance. Finally, we contribute an extensive discussion on the limitations and potential future directions, encompassing multi-modal data fusion, interpretability, and real-world clinical applications.

Version published to 10.35542/osf.io/j6mvd_v1 on OSF Preprints
Sep 29, 2025

Decoding Dystonia: unveiling neural patterns with interpretable EEG-Based Machine Learning

This article has 11 authors:
1. Caroline Alves
2. Artur José Marques Paulo
3. Danilo Donizete de Faria
4. João Ricardo Sato
5. Vanderci Borges
6. Sonia de Azevedo Silva
7. Henrique Ballalai Ferraz
8. Francisco A. Rodrigues
9. Christiane Thielemann
10. Michael Moeckel
11. Patricia de Carvalho Aguiar
This article has no evaluationsLatest version Sep 17, 2025
Machine Learning Reveals a Multimodal, Transdiagnostic Signature of Emotion Dysregulation Vulnerability Across Patients, Offspring, and Controls

This article has 9 authors:
1. Luigi Saccaro
2. Thomas Larrieu
3. Farnaz Delavari
4. Celine Oellaton
5. Ben Meuleman
6. Nader Perroud
7. Dimitri Van De Ville
8. Nicolas Toni
9. Camille Piguet
This article has no evaluationsLatest version Oct 10, 2025
A High-Accuracy Machine-Learning Approach for Dyslexia Screening Based on Gamified Interaction Data

This article has 2 authors:
1. Nora Alice Fink
2. Michael Fink
This article has no evaluationsLatest version Sep 25, 2025

Discuss this preprint

Listed in

Abstract

Article activity feed

Related articles

Decoding Dystonia: unveiling neural patterns with interpretable EEG-Based Machine Learning

Machine Learning Reveals a Multimodal, Transdiagnostic Signature of Emotion Dysregulation Vulnerability Across Patients, Offspring, and Controls

A High-Accuracy Machine-Learning Approach for Dyslexia Screening Based on Gamified Interaction Data