Um data lake é um repositório que pode armazenar grandes volumes de dados e de conjuntos de dados, sejam eles estruturados, semiestruturados ou não estruturados. Um dos aspectos-chave de um data lake são os seus metadados, que
devem seguir o padrão American National Standards Institute (ANSI) já consagrado para metadados de data lakes.
descrevem completa e corretamente todos os dados persistidos.
precisam ser definidos antes da ingestão de dados.
podem ser consultados por meio do “information schema”.
podem ser parcialmente descobertos de forma automática.