Artículo de Investigación
Redes neuronales para predecir índice de masa corporal según estatura y circunferencia de cintura
Neural networks to predict Body Mass Index according to height and waist circumference
Alberto Guevara Tirado1* https://orcid.org/0000-0001-7536-7884
1Universidad Científica del Sur. Lima, Perú.
*Correspondencia. Correo electrónico: albertoguevara1986@gmail.com
Introducción:
El índice de masa corporal (IMC) es un indicador de riesgo de sufrir enfermedades
asociadas al exceso de grasa corporal.
Objetivo:
Evaluar la red neuronal como predictor del IMC según estatura y circunferencia
de cintura.
Métodos:
Estudio analítico, transversal de 2004 adultos venezolanos pertenecientes
al estudio de prevalencia del síndrome metabólico de la ciudad de Maracaibo.
Las variables fueron IMC, estatura y circunferencia de la cintura. Se utilizaron
redes neuronales tipo perceptrón multicapa, evaluada mediante gráficos de dispersión,
curva característica operativa de receptor y tablas de clasificación.
Resultados:
Para el IMC cuantitativo, el error relativo fue de 0,191 y 0,180 en el entrenamiento
y las pruebas, respectivamente. Para las categorías del IMC, el porcentaje de
predicciones incorrectas en el entrenamiento y las pruebas fueron del 25,50
% y 20,80 %, respectivamente. La red neuronal desarrollada para predecir cuantitativamente
el IMC a partir de la altura y la circunferencia de la cintura tuvo un coeficiente
R2de 0,812 y cualitativamente, un área bajo la curva de 0,968, 0,919,
0,844 y 0,950 para bajo peso, peso normal, sobrepeso y obesidad, respectivamente.
La red neuronal para predecir las categorías del IMC tuvo porcentajes de predicciones
correctas de 37,50 %, 74 %, 79,80 % y 84,40 % para bajo peso, normopeso, sobrepeso
y obesidad, respectivamente.
Conclusiones:
El uso de redes neuronales tipo perceptrón multicapa es eficiente para predecir
el IMC cuantitativa y cualitativamente a partir de la estatura y la circunferencia
de cintura.
Palabras clave: circunferencia abdominal; estatura; índice de masa corporal; peso corporal; redes neurales de la computación; toma de decisiones asistida por computador.
Introduction:
The Body Mass Index (BMI) is an indicator of risk of suffering from diseases
associated with excess body fat.
Objective:
To evaluate the neural network as a predictor of BMI according to height and
waist circumference.
Methods:
Analytical, and cross-sectional study of 2004 Venezuelan adults belonging to
the Prevalence of Metabolic Syndrome study of the City of Maracaibo. The variables
were BMI, height and waist circumference. Multilayer perceptron-type neural
networks were used, evaluated using scatter-plots, receiver operating characteristic
curve and classification tables.
Results:
For quantitative BMI, the relative error was 0.191 and 0.180 in training
and testing, respectively. For BMI categories, the percentage of incorrect predictions
in training and testing were 25.50 % and 20.80 %, respectively. The neural network
developed to quantitatively predict the BMI from height and waist circumference
had an R 2 coefficient of 0.812 and qualitatively, an area under
the curve of 0.968, 0.919, 0.844 and 0.950 for low weight, normal weight, overweight,
and obesity, respectively. The neural network to predict BMI categories had
percentages of correct predictions of 37.50 %, 74 %, 79.80 % and 84.40 % for
underweight, normal weight, overweight, and obesity, respectively.
Conclusions:
The use of multilayer perceptron-type neural networks is efficient to predict
the BMI quantitatively and qualitatively from height and waist circumference.
Keywords: abdominal circumference; body mass index; body weigh; computational neural networks; computer-assisted decision making; height.
Recibido: 15/10/2024
Aprobado:
06/02/2025
INTRODUCCION
El índice de masa corporal (IMC) es una herramienta utilizada para determinar si una persona tiene un peso saludable en relación con su altura, aunque presenta limitaciones para estimar la adiposidad abdominal.(1) Es una medida objetiva que requiere el uso de una báscula y un tallímetro. Un IMC elevado se ha asociado con resistencia a la insulina(2) y cáncer,(3) ya que un IMC superior a 30 aumenta 5 veces el número de células progenitoras en sangre y favorece la tumorigénesis.(4) También incrementa el riesgo de diabetes tipo 2, hipertensión y dislipidemia,(5) apnea obstructiva del sueño,(6) reflujo gastroesofágico(7) y problemas reproductivos.(8) Es una medida ampliamente utilizada en salud pública, para estimar la prevalencia de sobrepeso y obesidad a escala mundial, las cuales afectan a casi 2 mil millones de personas(9) y aproximadamente al 53,50 % de los adultos venezolanos.(10)
Para calcular el IMC se necesita una balanza para medir el peso corporal y un tallímetro, para medir la estatura. Sin embargo, en algunas situaciones, como la incapacidad para mantenerse de pie o la falta de balanzas adecuadas, puede ser difícil obtener estas mediciones. En este contexto, el uso de redes neuronales artificiales está ganando popularidad en las ciencias de la salud, debido a su potencial para generar modelos predictivos que complementen las decisiones clínicas y de investigación.(11)
El objetivo de esta investigación es evaluar el uso de redes neuronales como predictor del IMC basado en la estatura y la circunferencia de cintura.
MÉTODOS
Diseño
Estudio analítico y de corte transversal proveniente de una plataforma de acceso abierto (https://f1000research.com/). La base de datos secundaria forma parte del estudio de prevalencia del síndrome metabólico de la ciudad de Maracaibo (MMSPS), Venezuela.(12)
Sujetos
La base de datos secundaria incluyó a 2004 adultos venezolanos (1050 hombres y 904 mujeres) de 18 años en adelante, residentes en la ciudad de Maracaibo, Venezuela. No se aplicaron criterios de exclusión, ni se realizaron procesos de muestreo o aleatorización, ya que se utilizó la totalidad de los encuestados de la base de datos.
La información fue recopilada a través de historias clínicas, donde también se evaluaron antecedentes médicos y familiares de enfermedades cardiovasculares y endocrino-metabólicas.
Las características de la población estudiada presentaron una distribución amplia en las variables evaluadas; reflejan una muestra diversa en términos de composición corporal. El IMC que se utilizó para evaluar la relación entre el peso y la estatura de los participantes, mostró valores mínimos y máximos de 14,22 y 68,80, respectivamente. La media del IMC fue de 28,31, con una desviación estándar (DS) de 6,23, lo que indicó una variabilidad considerable.
En cuanto a la estatura, los participantes tuvieron alturas que oscilaron entre 1,35 y 1,95 metros. La media fue de 1,64 metros y la DS de 0,09, lo que sugirió que la mayoría se encontraba dentro de un rango típico para la población general, aunque se observaron algunos casos extremos. El perímetro de cintura (CC), considerado un indicador importante de la distribución de grasa abdominal y un predictor de riesgo metabólico, varió entre 58 y 184 cm. La media fue de 94,64 cm y la DS de 15,28, lo que evidenció diferencias significativas entre los participantes en términos de adiposidad central. Finalmente, el peso corporal presentó valores que fluctuaron entre 36,40 y 126 kg, con una media de 76,49 kg y una DS de 19,69.
Variables
La variable dependiente fue el IMC, calculado mediante la fórmula de Quetelet. Además, esta variable se analizó con la escala de IMC del Centro de Control de Enfermedades (CDC), que clasifica a los individuos en categorías cualitativas: Bajo peso (< 18,4 kg/m²), peso normal (18,5-24,9 kg/m²), sobrepeso (25-29,9 kg/m²) y obesidad (> 30 kg/m²).(13)
Las variables independientes incluyeron la estatura (en centímetros), medida con una cinta métrica vertical, y la circunferencia de cintura (en centímetros), medida con una cinta métrica plástica en puntos equidistantes entre la cresta costal e ilíaca. Los adultos evaluados estaban descalzos, en posición erguida, con ropa ligera y la cabeza recta.
Procedimiento
La información fue recopilada a partir de una base de datos secundaria del repositorio de datos abierto F1000 Research. Los datos de interés para la investigación (IMC, CC y estatura, fueron estudiados mediante el programa IBM-SPSS v. 25, mediante el análisis de redes neuronales, perceptrón multicapa. En los ajustes del perceptrón, se colocó como variable dependiente al IMC cuantitativo (derivado de la fórmula de Quetelet) y el IMC cualitativo (basado en la clasificación de CDC), mientras que como variables independientes se colocaron la estatura y la circunferencia de cintura. Los valores de hiperparámetros fueron seleccionados automáticamente por el perceptrón multicapa. Se activó la opción de guardar las categorías y valores pronosticados, para cada variable dependiente.
Procesamiento
Se utilizaron tablas para la estadística descriptiva; se obtuvieron frecuencias absolutas, así como medidas de tendencia central y de dispersión. La prueba de hipótesis fue realizada mediante regresión lineal múltiple; la hipótesis nula (H0) establece que no hay relación significativa entre las variables independientes (circunferencia de cintura y estatura) y la variable dependiente (IMC); mientras que, la hipótesis alternativa (H1) sugiere que sí existe una relación significativa (p< 0,05).
Las redes neuronales perceptrón multicapa es una arquitectura análoga a las neuronas biológicas, capaz de resolver problemas no linealmente separables, gracias a su estructura de múltiples capas; modela relaciones no lineales entre los datos de entrada y salida. Como clasificadores, son flexibles, adaptables y manejan diferentes tipos de datos. Al tener múltiples capas de neuronas, se considera una técnica de aprendizaje profundo que permite modelar relaciones complejas y aprender representaciones de características más abstractas en los datos, con la capacidad de aproximar cualquier relación no lineal entre los datos de entrada y salida; representa una amplia variedad de funciones. La red neuronal fue entrenada para predecir el IMC a partir de la estatura y la circunferencia de cintura.
El resultado cuantitativo del IMC predicho por el perceptrón se contrastó con los valores del IMC obtenido con la fórmula de Quetelet, en un gráfico de dispersión de puntos para observar si la distribución de los datos obtenidos era homogénea. Asimismo, se incluyó el coeficiente de determinación R², que evalúa la precisión con la que un modelo estadístico predice un resultado,(14) así como la curva de característica operativa del receptor (COR), con área bajo la curva (AUC), para evaluar la capacidad predictiva del modelo de red neuronal.
La validación del modelo entrenado con la población venezolana se realizó utilizando datos adicionales de diferentes bases de datos nacionales. Primero, se incorporaron 4363 registros de estatura y circunferencia de cintura de la Encuesta Nacional de Salud y Nutrición (ENSANUT) de México. Posteriormente, se añadieron 11 918 registros de la Encuesta Nacional Demográfica de Salud (ENDES) de Perú. Se crearon 2 gráficos de dispersión que incluyeron el coeficiente de determinación R2, correspondiente a los valores pronosticados de las bases de datos de cada país.
Los hallazgos se midieron con un valor de p significativo menor de 0,05 con un intervalo de confianza del 95 %. El análisis se realizó con el programa IBM-SPSSv. 25.
Aspectos bioéticos
La base de datos provino del repositorio de datos abierto F1000Research (https://f1000research.com/), de acceso abierto, por lo que no se requirió de autorizaciones de uso o comités de ética. La investigación se desarrolló en base a una fuente secundaria, así como el carácter reservado de la información personal de la unidad de análisis (los encuestados). Se respetó lo establecido en las normas de Helsinki. Las bases de datos, incluidos los archivos complementarios, están disponibles en el siguiente enlace: https://f1000research.com/articles/6-1337/v1#DS0
RESULTADOS
Los resultados del modelo muestran que la constante es 12.659 (p< 0,001), la circunferencia de cintura tiene un coeficiente de 0,375 (p< 0,001) y la estatura tiene un coeficiente de -12,078 (p< 0,001), lo que indica que ambos factores tienen un impacto significativo en el IMC. Se concluye que tanto la circunferencia de cintura como la estatura influyen significativamente en el IMC (tabla 1).
Se realizaron 2 estimaciones del IMC, una cuantitativa, con un error relativo de 0,191 y 0,180 en el entrenamiento y prueba, respectivamente, así como un error de suma de cuadrados de 135,206 en el entrenamiento, y 46,435 en la prueba. Para la estimación cualitativa de las categorías del IMC de la CDC, el porcentaje de pronósticos incorrectos en el entrenamiento y prueba fueron 25,50 % y 20,80 %, respectivamente, con un error de entropía cruzada de 862,315 en el entrenamiento, y de 301,042 en la prueba (tabla 2).
La red neuronal desarrollada para determinar cuantitativamente el IMC a partir de la estatura y circunferencia de cintura tuvo 1 capa de entrada con 2 unidades, 1 capa oculta con 2 unidades, y una capa de salida con 1 unidad. La función de activación de capa oculta fue mediante tangente hiperbólica, mientras que la función de salida fue identidad. El grafico de dispersión tuvo una distribución mayormente homogénea, con un coeficiente R 2 de 0,812, lo que implica que 82 % de la variación de la puntuación de IMC de la fórmula de Quetelet puede ser explicado, mediante el IMC predicho por el perceptrón multicapa, a partir de la estatura y circunferencia de cintura (Fig. 1).
La estructura de la red neuronal tipo perceptrón multicapa, para determinar cualitativamente las categorías del IMC propuestas por la CDC, tuvo 1 capa de entrada con 2 unidades, 1 capa intermedia con 4 unidades, y una capa de salida con 4 unidades. La función de activación de la capa oculta fue mediante tangente hiperbólica, mientras que la de salida fue softmax. Asimismo, en el análisis COR, el AUC del modelo fue de 0,968 para bajo peso, 0,919 para peso normal, 0,844 para sobrepeso, y 0,950 para obesidad, lo que indica que el modelo de red neuronal tiene una capacidad de predicción sobresaliente (Fig. 2).
La red neuronal basada en estatura y circunferencia de cintura, diseñada para predecir las categorías de IMC de la CDC, en la fase de prueba, tuvo un bajo porcentaje de pronósticos correctos para predecir bajo peso (37,50 %), tuvo un 74 % de pronósticos correctos para peso normal, así como un 79,80 % y 84,40 % para sobrepeso y obesidad, respectivamente (tabla 3).
El modelo entrenado a partir de la población venezolana se probó, añadiendo 4363 datos de estatura y circunferencia de cintura de una base de datos mexicana, correspondiente a la ENSANUT. Se encontró un valor R2 de 0,968, lo que indica que el 97 % de la variación del IMC de la fórmula de Quetelet pudo ser explicada con el modelo basado en circunferencia de cintura y estatura. También se probó añadiendo 11 918 datos de estatura y circunferencia de cintura de la base de datos peruana de la ENDES. Se encontró un valor R2 de 0,775, lo que indica que el 78 % de la variación del IMC de la fórmula de Quetelet pudo ser explicado con el modelo de IMC basado en circunferencia de cintura y estatura (Fig. 3).
DISCUSIÓN
Se observó que el uso de redes neuronales simples tipo perceptrón multicapa, basadas en la estatura y la circunferencia de cintura (CC), tuvo una alta capacidad para predecir los valores cuantitativos del IMC según la fórmula de Quetelet, así como para categorizar el IMC de acuerdo con la clasificación del CDC. No se encontraron antecedentes bibliográficos que exploren el uso de redes neuronales para determinar el IMC utilizando otras medidas antropométricas. El estudio más cercano fue realizado por Kurisi K y otros,(15) quienes utilizaron redes neuronales artificiales convolucionales, para predecir el peso mediante electrocardiogramas de 12 derivaciones en pacientes con anorexia nerviosa.
La red neuronal diseñada para determinar el IMC cuantitativamente mostró un coeficiente R2 superior al 80 %, lo que indica que los resultados pueden ser cercanos, pero no idénticos al uso tradicional de la balanza y el peso corporal. Por otro lado, la red neuronal diseñada para categorizar el IMC según la clasificación del CDC tuvo un desempeño pobre para detectar casos de bajo peso, pero mostró una adecuada capacidad para detectar el peso normal y una mayor capacidad para pronosticar correctamente casos de sobrepeso y obesidad. Por lo tanto, esta red neuronal no sería recomendable para categorizar pacientes con trastornos o enfermedades que cursen con pérdida de peso corporal, aunque podría ser útil para descartar la presencia de sobrepeso y obesidad.
El modelo entrenado con la población venezolana mostró un excelente ajuste al ser probado con datos de la ENSANUT de México, obtuvo un coeficiente R2 de 0,968, lo que indica que el 97 % de la variabilidad del IMC calculado mediante la fórmula de Quetelet, pudo ser explicada por el modelo basado en la circunferencia de cintura y la estatura. Al probarse con datos de la ENDES de Perú, el modelo obtuvo un coeficiente R2 de 0,775, que explica el 78 % de la variabilidad del IMC, lo que sugiere un buen ajuste, aunque menor en comparación con los datos mexicanos, posiblemente debido a diferencias en las características de las poblaciones o en la calidad de los datos.
Aunque las balanzas (mecánicas y digitales) son el instrumento principal para determinar el peso corporal, necesario para calcular el IMC según la fórmula de Quetelet, el uso de esta red neuronal entrenada puede ser relevante en ciertas condiciones: No requiere la obtención del peso corporal y solo necesita una cinta métrica, podría ser aplicable cuando la medición del peso corporal con balanza sea difícil en individuos con incapacidad para la bipedestación, como personas con paraplejia, diplejía, hemiplejia, cuadriplejia, trastornos osteomioarticulares, en rehabilitación física, pacientes hospitalizados, pacientes en sillas de ruedas, entre otros. Esto facilitaría la reducción de la carga física y mental para el personal de enfermería o cuidadores, al movilizar a pacientes postrados.(16)
También podría ser útil en pacientes que pueden ponerse de pie, pero tienen una capacidad limitada para mantenerse en esa posición, como aquellos con debilidad física, especialmente adultos mayores o con enfermedades crónicas debilitantes, así como personas con bipedestación conservada, pero sin capacidad para seguir instrucciones para las mediciones, como en pacientes con trastornos mentales. Además, podría ser relevante en zonas de bajos recursos socioeconómicos, donde las balanzas mecánicas o digitales no sean accesibles, o donde las balanzas diseñadas para pacientes postrados, no estén disponibles debido a su alto costo. Esta red neuronal tuvo la ventaja de ser fácilmente implementable, con mínimos conocimientos para el manejo de la introducción de datos en el programa IBM-SPSS, lo que evita la necesidad de calculadoras o conexión a internet y permite mantener un registro de los pacientes evaluados.
Entre las limitaciones del estudio se encontró que la información provino de una base de datos secundaria, lo que podría introducir sesgos de información y clasificación. Se requieren investigaciones adicionales para evaluar la posibilidad de usar esta red neuronal entrenada como un método indirecto de estimación del IMC en las situaciones previamente planteadas. Aunque el coeficiente R2 fue elevado al estimar el IMC cuantitativo, según la fórmula de Quetelet, esto significa que los resultados se acercan, pero no son idénticos a la medición directa del peso corporal para obtener el IMC, por lo que su uso debe quedar a criterio del personal de salud según el contexto o circunstancia del sujeto a evaluar. De manera similar, en cuanto a la clasificación del IMC, esta red neuronal no tuvo una capacidad adecuada para identificar casos de bajo peso, siendo más eficiente para detectar sobrepeso y obesidad, por lo que su uso debe evitarse en pacientes con posible desnutrición o malnutrición que cursen con pérdida de peso.
El uso de redes neuronales tipo perceptrón multicapa fue eficiente para predecir el IMC cuantitativa y cualitativamente, a partir de la estatura y la circunferencia de cintura en una población de Maracaibo, Venezuela. El uso de esta herramienta de predicción puede ser beneficioso para su aplicación en personas con capacidad parcial o total para la bipedestación, aunque se requiere ampliar esta investigación hacia este tipo de pacientes.
REFERENCIAS BIBLIOGRÁFICAS
1. Wu Y, Li D, Vermund SH. Advantages and limitations of the body mass index (BMI) to assess adult obesity [Internet]. Int J Environ Res Public Health. 2024;21(6):757. DOI: 10.3390/ijerph21060757
2. Wondmkun YT. Obesity, insulin resistance, and type 2 diabetes: Associations and therapeutic implications [Internet]. Diabetes Metab Syndr Obes. 2020;13:3611-6. DOI: 10.2147/dmso.s275898
3. Stone TW, McPherson M, Gail Darlington L. Obesity and cancer: Existing and new hypotheses for a causal connection [Internet]. EBioMedicine. 2018;30:14-28. DOI: 10.1016/j.ebiom.2018.02.022
4. Bellows CF, Zhang Y, Chen J, Frazier ML, Kolonin MG. Circulation of progenitor cells in obese and lean colorectal cancer patients [Internet]. Cancer Epidemiol Biomarkers Prev. 2011; 20(11):2461-8. DOI: 10.1158/1055-9965.epi-11-0556
5. Held C, Hadziosmanovic N, Aylward PE, Hagström E, Hochman JS, Stewart RAH, et al. Body mass index and association with cardiovascular outcomes in patients with stable coronary heart disease - A STABILITY substudy [Internet]. J Am Heart Assoc. 2022;11(3): e023667. DOI: 10.1161/jaha.121.023667
6. Leppänen T, Kulkas A, Mervaala E, Töyräs J. Increase in body mass index decreases duration of apneas and hypopneas in obstructive sleep apnea [Internet]. Respir Care. 2019;64(1):77-84. DOI: 10.4187/respcare.06297
7. Vaishnav B. Gastroesophageal reflux disease and its association with body mass index: Clinical and endoscopic study [Internet]. J Clin Diagn Res. 2017; DOI: 10.7860/jcdr/2017/24151.9562
8. Zhu L, Zhou B, Zhu X, Cheng F, Pan Y, Zhou Y, et al. Association between body mass index and female infertility in the United States: Data from national health and nutrition examination survey 2013-2018 [Internet]. Int J Gen Med. 2022;15:1821-31. DOI: 10.2147/ijgm.s349874
9. CDC. Adult BMI calculator [Internet]. Centers for Disease Control and Prevention. 2024. [acceso: 26/09/2024]. Disponible en: https://www.cdc.gov/healthyweight/assessing/bmi/adult_bmi/english-_bmi_calculator/bmi_calculator.html
10. Overweight and obesity: prevalence Venezuela 2010-2022 [Internet]. Statista. 2023. [acceso: 26/09/2024]. Disponible en: https://www.statista.com/statistics/1466625/overweight-obesity-prevalence-venezuela/
11. Bikku T. Multi-layered deep learning perceptron approach for health risk prediction [Internet]. J Big Data. 2020;7(1):[aprox. 24 p.]. DOI: 10.1186/s40537-020-00316-7
12. Salazar J, Bermúdez V, Calvo M, Olivar LC, Luzardo E, Navarro C, et al. Optimal cutoff for the evaluation of insulin resistance through triglyceride-glucose index: A cross-sectional study in a Venezuelan population [Internet]. F1000Res. 2018; 6:1337. DOI: 10.12688/f1000research.12170.3
13. Nuttall FQ. Body mass index: Obesity, BMI, and health A critical review [Internet]. Nutr Today. 2015;50(3):117-28. DOI: 10.1097/nt.0000000000000092
14. Alexander DLJ, Tropsha A, Winkler DA. Beware of R2: Simple, unambiguous assessment of the prediction accuracy of QSAR and QSPR models [Internet]. J Chem Inf Model. 2015;55(7):1316-22. DOI: 10.1021/acs.jcim.5b00206
15. Kurisu K, Yamazaki T, Yoshiuchi K. Predicting extremely low body weight from 12-lead electrocardiograms using a deep neural network [Internet]. Sci Rep. 2024 [acceso: 26/09/2024];14(1):1-8. Disponible en: https://www.nature.com/articles/s41598-024-55453-3
16. Freitag E, Edgecombe G, Baldwin I, Cottier B, Heland M. Determination of body weight and height measurement for critically ill patients admitted to the intensive care unit: A quality improvement project [Internet]. Aust Crit Care. 2010;23(4):197-207. DOI: 10.1016/j.aucc.2010.04.003
Conflictos de interés
El autor declara que no existen conflictos de interés.
Contribuciones de los autores
Autor único.
Declaración de disponibilidad de datos
Datos disponibles en https://f1000research.com/, con la denominación "Data for the study 'Optimal cutoff for the evaluation of insulin resistance through triglyceride-glucose index: A cross-sectional study in a Venezuelan population", disponible en: http://dx.doi.org/10.5256/f1000research.12170.d171840. Son accesibles según los términos de licencia Creative CommonsCC0 1.0.