Información de contacto

Calle Pollensa, 6, 2ª Planta, Edificio ECU 2, 28290, Las Rozas de Madrid, Madrid

+ (34) 916 49 22 92 icon_widget_image info@medlabmg.com

Snomed2Vec, un nuevo enfoque de la búsqueda semántica

Ignacio Martínez ha presentado Snomed2Vec en el IEEE CBMS2019

Snomed2Vec es un nuevo enfoque en la búsqueda semántica. Detrás está Ignacio Martínez, Data Scientist en MMG, que ha aplicado el algoritmo Word2Vec a la ontología de SNOMED CT para encontrar los conceptos más similares. El analista ha presentado su idea en el 32.º International Symposium on Computer-Based Medical Systems (IEEE CBMS2019), celebrado esta semana en el Instituto Maimónides de Investigación Biomédica de Córdoba.

El comité científico del evento aceptó a principios de primavera su paper, escrito en colaboración con Ignacio San Román y Adrián Alonso, miembros del departamento de Investigación y Desarrollo de MMG igual que Martínez. En su caso, compagina su labor en la start-up española con su trabajo en el Hospital Rafael Méndez de Lorca (Murcia). Además, colabora con las universidades de Granada y Murcia.

Tal y como ha explicado el Data Scientist en su presentación, los sistemas de información hospitalaria utilizan registros electrónicos de salud para almacenar datos heterogéneos de los pacientes. En la mayoría de los casos, el corpus de los textos es demasiado libro. Por eso, es necesario normalizar los mismos para identificar los conceptos clínicos dentro de él. Para ello, hace falta mapear cada texto usando ontologías, como SNOMED-CT.

Qué aporta Snomed2Vec

Para facilitar la búsqueda de conceptos, Martínez ha diseñado una herramienta de inteligencia artificial bautizada como Snomed2Vec. Básicamente, se basa en la aplicación del algoritmo Word2Vec a la ontología de SNOMED CT. Ahora mismo, esta es el producto terminológico, codificado y multilingüe más preciso a nivel mundial. Se trata de una herramienta de reconocimiento de conceptos que sugiere cuál es el más similar de SNOMED-CT que aparece en un texto.

La herramienta utiliza la representación Word Embedding, que se basa en la idea de que la información contextual constituye por sí sola una representación viable de los términos lingüísticos. Word2Vec es una red neuronal poco profunda, para producir la representación de las palabras mediante vectores. Snomed2Vec aplica esa red a la citada ontología médica para ofrecer un nuevo enfoque a la búsqueda semántica, uno de los campos de trabajo de MMG.

El 32.º International Symposium on Computer-Based Medical Systems se ha celebrado en Córdoba entre el 5 y el 7 de junio. Es el evento sobre sistemas médicos informáticos más importante del mundo. Su objetivo es dar espacio a artículos de alta calidad sobre la industria y las aplicaciones de casos reales. Además, busca permitir a los investigadores mostrar sus resultados a la comunidad científica.