نبذة مختصرة : With the recently growing expansion and improvement of Artificial Intelligence (AI), it has been seen that it can be very useful to help humans make decisions, thus increasing efficiency, making decisions faster, and reducing the workload of human experts. In this thesis, we focus on how already trained Artificial Intelligence models can be used as a decision support system in the film industry sector, specifically for experts who set the age ratings of films. For the visual modality, the model SlowFast networks were used and for the audio modality, a standard ResNet model with 18 layers pretrained on Kinetics-400 was used. These audiovisual models have been trained on the Vidharm dataset, an open dataset of 3589 video clips from film trailers annotated by professionals. In this work we propose three systems with the objective of being applied in real life in the near future. We have statistically analyzed the data given by those AI models and we have related these data to the data given by a real human. Each one of the systems has its advantages and limitations. Still, in general, we have obtained satisfactory results even though having a better dataset with more clips or having models with better accuracy would have made the systems perform significantly better.
Con la reciente expansión y mejora de la inteligencia artificial (IA), se ha podido ver que puede ser muy útil para ayudar a los humanos a tomar decisiones, aumentando así la eficiencia, a tomar decisiones más rápido y reducir la carga de trabajo de los humanos expertos. En esta tesis, nos enfocamos en cómo los modelos de Inteligencia Artificial ya entrenados pueden ser utilizados como sistema de apoyo a la toma de decisiones en el sector de la industria cinematográfica, específicamente para expertos que marcan la edad de las calificaciones de las películas. Para la modalidad visual se utilizó el modelo de redes SlowFast y para la modalidad de audio, un modelo ResNet estándar con 18 capas preentrenadas en Kinetics-400. Estos modelos audiovisuales han sido entrenados en el conjunto de datos de Vidharm, una base de datos de 3589 clips de videos de trailers de películas anotados por profesionales. En este trabajo propondremos tres sistemas con el objetivo de ser aplicados en la vida real en un futuro próximo. Hemos analizado estadísticamente los datos proporcionados por esos modelos de IA y los hemos relacionado con los datos proporcionados por un ser humano real. Cada uno de los sistemas tiene sus ventajas y limitaciones. Aún así, en general, hemos obtenido resultados satisfactorios a pesar de haber un mejor conjunto de datos con más clips o tener modelos con mayor precisión habría hecho que los sistemas funcionaran significativamente mejor.
Amb la recent expansió i millora de la intel·ligència artificial (IA), s'ha pogut veure que pot ser molt útil per ajudar els humans a prendre decisions, augmentant així l'eficiència, a prendre decisions més ràpid i reduir la càrrega de treball dels humans experts. En aquesta tesi, ens enfoquem com els models d'Intel·ligència Artificial ja entrenats poden ser utilitzats com a sistema de suport a la presa de decisions al sector de la indústria cinematogràfica, específicament per a experts que marquen l'edat de les qualificacions de les pel·lícules. Per a la modalitat visual es va utilitzar el model de xarxes SlowFast i per la modalitat d'àudio, un model ResNet estàndard amb 18 capes preentrenades a Kinetics-400. Aquests models audiovisuals han estat entrenats al conjunt de dades de Vidharm, una base de dades de 3589 clips de vídeos de tràilers de pel·lícules anotats per professionals. En aquest treball proposarem tres sistemes amb l'objectiu de ser aplicats a la vida real en un futur proper. Hem analitzat estadísticament les dades proporcionades per aquests models d'IA i les hem relacionat amb les dades proporcionades per un ésser humà real. Cadascun dels sistemes té els seus avantatges i limitacions. Tot i així, en general, hem obtingut resultats satisfactoris tot i haver-hi un millor conjunt de dades amb més clips o tenir models amb més precisió hauria fet que els sistemes funcionessin significativament millor.
No Comments.