2023 apunta a convertse en el año en el que la inteligencia artificial transformará el modo en que realizamos consultas en Internet. Sin embargo, tiene pinta de que la cosa no se va a quedar solo ahí. Recientemente, Microsoft, una de las tecnológicas que más apuesta por el desarrollo y adopción de la IA, comparado la creación de una nueva herramienta multimodal conocida como Cosmos-1. Es capaz de analizar imágenes, resolver rompecabezas visuales, reconocer texto y comprender las instrucciones del usuario.
una diferencia de ChatGPTel nuevo Bing o el futuro Bard en el que trabaja Google, Kosmos-1 es capaz de trabajar con imágenes. El resto de herramientas, mientras tanto, solo tienen capacidad para responder mediante el uso de texto a las cuestiones plantadas por los usuarios. Y no siempre con los mejores resultados.
Precisamente, el funcionamiento multimodal de esta nueva AIque es capaz de analizar imágenes y texto, se considera como «una necesidad para lograr una inteligencia artificial general, en términos de adquisición de conocimientos y conexión con el mundo real», según recogen los investigadores detrás del desarrollo en declaraciones compartidas por el sitio especializado ‘Ars-Technica‘.
Los desarrolladores han mostrado varios ejemplos con las respuestas que encuentran la máquina a las cuestiones realizadas por el usuario en relación a imágenes. Por ejemplo, es capaz de explicar por qué una imagen en la que aparece un gato es graciosa o decir la fecha de estreno de una película después de una fotografía de la cinta en cuestión.
Sopesando los buenos resultados ofrecidos, se trata simplemente de un primer paso hacia la consecución de su IA multimodal que, probablemente, llegado el momento, sustituya a los chatbots que solo funcionan mediante y empleo de texto.
En principio, el lanzamiento de Kosmos-1 es un proyecto exclusivo de Microsoft y no es participante IA abierta, firme desde la creación de ChatGPT y en la que la tecnológica dueña de Windows ha invertido décadas de miles de millones de dólares en los últimos años. A pesar de que, por el momento, la nueva IA no está disponible, Microsoft ha confirmado que tiene planes de hacerla accesible a los desarrolladores.

