Es la combinación de los datos que residen en diferentes fuentes y proporcionan a los usuarios una visión unificada de estos datos. Este proceso se vuelve significativo en una variedad de situaciones científicas, como la combinación de los resultados de investigación de diferentes repositorios de bioinformática.
La integración de datos aparece cada vez con mayor frecuencia que el volumen y la necesidad de compartir y explotar los datos existentes. Se ha convertido en el foco de un extenso trabajo teórico, y numerosos problemas abiertos siguen sin resolverse.