Executive Secretary

III Simposio Internacional Sobre “Generación y Transferencia de Conocimiento para la Transformación Digital

SITIC 2025

Estrategias para la detección y manejo de datos fuera de distribución (OOD) en modelos generativos de imágenes sintéticas

Resumen

La generación de imágenes sintéticas mediante modelos generativos representa un área de gran avance; no obstante, persiste el reto de identificar y manejar datos fuera de distribución (OOD). Este trabajo propone estrategias para abordar este problema en modelos generativos, empleando arquitecturas como Wasserstein GAN con penalización de gradiente (WGAN-GP) y StyleGAN2-ADA (con aumento adaptativo del discriminador). La propuesta incluye el entrenamiento de dichos modelos sobre conjuntos de datos específicos para la generación de imágenes sintéticas. Se emplea la métrica Frechet Inception Distance (FID), que permite estimar diferencias estadísticas globales entre distribuciones reales y generadas, como aproximación indirecta al problema OOD. Además, se integran técnicas como SeTAR, orientada a ajustar internamente las representaciones del modelo para una mejor discriminación de ejemplos OOD, y ABET, que combina energía y escalado de temperatura aprendido para mejorar la sensibilidad ante entradas no vistas, sin requerir datos OOD en el entrenamiento. Las estrategias implementadas permiten incrementar la capacidad de los modelos para distinguir entre datos en distribución y fuera de distribución, favoreciendo la generación de imágenes más coherentes y relevantes en distintos escenarios. Asimismo, se promueve una mayor fidelidad visual y estabilidad en la salida de los modelos, especialmente en situaciones donde los datos reales son limitados o críticos. La propuesta fortalece su aplicabilidad en contextos donde la confianza y la calidad del contenido sintético resultan esenciales.

Abstract

The generation of synthetic images through generative models represents an area of significant progress; however, the challenge of identifying and handling out-of-distribution data (OOD) persists. This work proposes strategies to address this problem in generative models, using architectures such as Wasserstein GAN with gradient penalty (WGAN-GP) and StyleGAN2-ADA (with adaptive discriminator augmentation). The approach involves training these models on specific datasets for synthetic image generation. The Frechet Inception Distance (FID) metric is employed to estimate global statistical differences between real and generated distributions, serving as an indirect approximation to the OOD problem. Additionally, techniques like SeTAR—designed to internally adjust the model’s representations for improved discrimination of OOD examples—and ABET, which combines energy and learned temperature scaling to enhance sensitivity to unseen inputs without requiring OOD data during training, are incorporated. The implemented strategies increase the models’ capability to differentiate between in-distribution and out-of-distribution data, promoting the generation of more coherent and contextually relevant images. They also improve visual fidelity and output stability, especially in scenarios where real data are scarce or critical. This work enhances applicability in domains where the reliability and quality of synthetic content are vital.