Los matemáticos de la RUDN y la Universidad Libre de Berlín han propuesto una nueva forma de usar redes neuronales para trabajar con datos ruidosos de grandes dimensiones

Los matemáticos de la RUDN y la Universidad Libre de Berlín han propuesto una nueva forma de usar redes neuronales para trabajar con datos ruidosos de grandes dimensiones

Los matemáticos de la RUDN y la Universidad Libre de Berlín propusieron un nuevo enfoque para estudiar las distribuciones de probabilidad de los datos observados utilizando redes neuronales artificiales. El nuevo enfoque interactúa mejor con los llamados valores atípicos, con aquellos objetos de datos de entrada que se distinguen significativamente de la muestra general.

La restauración de la distribución de probabilidad de los datos observados por redes neuronales artificiales es la parte más importante del aprendizaje automático. La distribución de probabilidad no solo nos permite predecir el comportamiento del sistema estudiado, sino también cuantificar la incertidumbre con la que se hacen los pronósticos. La principal dificultad es que, por regla general, solo se observan los datos en sí mismos, pero sus distribuciones de probabilidad en una forma exacta no están disponibles. Para resolver este problema, se utilizan métodos bayesianos y aproximados. Pero su uso aumenta la complejidad de la red neuronal y, en consecuencia, su entrenamiento. La combinación de métodos bayesianos con otros (por ejemplo, con el método delta) permite reducir la incertidumbre.

Los matemáticos de la RUDN y la Universidad Libre de Berlín utilizaron pesos deterministas para redes neuronales, y los resultados de las redes codificaron la distribución de variables latentes para la distribución marginal (privada) deseada. Obtuvieron una fórmula que permite estimar correctamente la varianza de la distribución de los datos observados. Un análisis de la dinámica de aprendizaje de tales redes les permitió obtener una fórmula que estima correctamente la varianza de la distribución de los datos observados, a pesar de la presencia de valores atípicos en los datos. El modelo propuesto se probó con diferentes datos: sintético y real; sobre los datos que contienen emisiones y sobre aquellos de los cuales fueron eliminados previamente. El nuevo método permite restaurar las distribuciones de probabilidad con mayor precisión en comparación con otros métodos modernos. La precisión se estimó utilizando el método AUC (el área bajo de la curva es el área debajo del gráfico que permite estimar el error cuadrático medio de las predicciones según el tamaño de la muestra estimado por la red como «confiable»; cuanto mayor sea el puntaje AUC, mejores serán las predicciones).

El artículo fue publicado en la revista Artificial Intelligence

Ciencia
29 Nov
Mathématicien de l'URAP a élaboré une approche de thérapie individuelle de l'hémophilie et de la thrombose

Un employé de l’URAP en collaboration avec des collègues des états-UNIS et de la France, a élaboré une méthode qui permet de décrire la coagulation du sang, tenant compte des caractéristiques des patients. Cela vous permettra de faire le diagnostic et de choisir le dosage de médicaments pour le traitement de l’hémophilie, de la thrombosea et d’autres troubles de la coagulation.

Ciencia
25 Nov
Los químicos de RUDN encontraron un catalizador eficiente para la síntesis de materias primas de la industria química

Los químicos de RUDN han demostrado la efectividad de los complejos metálicos para catalizar la producción de cianhidrinas, sustancias importantes para la industria química. Los químicos lograron alcanzar el 96,3% de eficiencia de reacción.

Ciencia
17 Nov
Los químicos amistad de los pueblos creado inusual plana de cristal con propiedades magnéticas

Los químicos amistad de los pueblos creado metal-contiene una conexión con una plana arquitectura. Repentina de la estructura se ha formado gracias a la espontáneamu capturael dióxido de carbono del aire en el curso de la reacción. Cristal tienen propiedades magnéticas. Epuede ser útil para la creación de dispositivos de almacenamiento de datos.