Banco de questões Didata

Questão pública

Tecnologia da Informação · Bancos de Dados Distribuídos · Particionamento horizontal (sharding) e MapReduce em bancos de dados distribuídos

Múltipla escolha CESGRANRIO 2024 Média

O IBGE é responsável no Brasil pela Classificação Nacional de Atividades Econômicas (código CNAE). Considere que um órgão de atuação nacional, que possui infraestrutura de Tecnologia de Informação e Comunicação (TIC) em todos os estados brasileiros, deseja realizar um censo de pequenas e médias empresas em 10 estados do Brasil. Para guardar os dados dessas empresas, foi criado um banco de dados distribuído (BDD) relacional com particionamento horizontal, também conhecido como sharding em muitos SGBDs NoSQL, utilizando como critério de distribuição a UF onde se localiza a sede da empresa, de tal modo que as empresas do Rio de Janeiro têm seus dados guardados na infraestrutura de TIC desse órgão no Rio de Janeiro. Com os dados distribuídos dessa forma,

Escolha uma alternativa para tentar resolver.

Seu resultado está pronto

Entre na Didata para ver o gabarito comentado

A resposta isolada mostra pouco. Na Didata, ela entra no seu histórico, aponta o assunto que precisa de revisão e volta no momento certo.

Sua resposta

Gabarito comentado
Histórico por assunto
Revisão dos seus erros

Resolva com gabarito comentado

Gabarito, explicação e revisão espaçada — tudo para fixar de verdade.

Começar a praticar

Questões relacionadas

CESGRANRIO 2024

Sistemas de bancos de dados apresentam benefícios e desafios potencializados quando é possível adotar uma solução de gerência distribuída, coordenada por um sistema de banco de dados distribuído. Nesse contexto, uma importante questão de projeto refere- se à

Particionamento horizontal (sharding) e MapReduce em bancos de dados distribuídos · Tecnologia da Informação Fácil

CESGRANRIO 2024

O Banco Nossa Caixa é o primeiro banco do hemisfério sul a implantar o GDPS (Processamento Paralelo em Locais Geograficamente Distantes, na sigla em inglês), sistema que processa, simultaneamente, todos os dados da instituição em dois locais fisicamente separados. A tecnologia garante o armazenamento e a continuidade do funcionamento de todos os canais de atendimento e de negócios do banco, ainda que a operação de um dos equipamentos responsáveis por essas funções seja interrompida por um blecaute ou incêndio, por exemplo. O banco investiu R$ 80 milhões no projeto, que levou quatro anos desde a concepção até a implantação. Do Banco Nossa Caixa Disponível em: https://www.saopaulo.sp.gov.br/ultimas-noticias/ nossa-caixa-usa-sistema-pioneiro-de-processamento-de-dados/. Acesso em: 5 jan. 2024. No modelo de arquitetura Massively Parallel Processor, MPP, extensibilidade e escalabilidade são características comuns e vantajosas no armazenamento e no processamento de dados paralelos. Nesse contexto, qual modelo de processamento se enquadra à arquitetura MPP?

Particionamento horizontal (sharding) e MapReduce em bancos de dados distribuídos · Tecnologia da Informação Difícil

CESGRANRIO 2024

Para melhorar o processamento de grandes volumes de dados através de computação paralela ou distribuída, pode-se utilizar sharding, técnica que divide os dados em partes menores, chamadas shards. Essas partes são normalmente armazenadas em diferentes nós, ou sítios, de processamento em um sistema distribuído. O sharding é necessário para garantir a

Particionamento horizontal (sharding) e MapReduce em bancos de dados distribuídos · Tecnologia da Informação Média

Receita Federal - Auditor-Fiscal - FGV 2023

No âmbito de bancos dados, especialmente NoSQL, o Teorema CAP sustenta que há três requerimentos básicos que existem numa relação especial quando se projeta uma aplicação com uma arquitetura distribuída. Basicamente, respalda a tese de que não se pode obter os três simultaneamente. Esses três requerimentos são:

Teorema CAP (Teorema de Brewer) · Tecnologia da Informação Média

CESGRANRIO 2024

Para cientistas de dados, usar bibliotecas de Python 3.9 é crucial, mas também desafiador. A variedade e a constante evolução das opções exigem domínio das diferentes sintaxes e funcionalidades. Além disso, é fundamental otimizar o desempenho e garantir a interoperabilidade entre essas bibliotecas. Dominar esse ecossistema é uma habilidade essencial para extrair insights significativos dos dados. No processo de escolha, o cientista de dados deverá atentar que a biblioteca

Sem tópico · Tecnologia da Informação Média

CESGRANRIO 2024

Ao avaliar a performance de diversos modelos preditivos para um problema de regressão e outro de classificação, várias métricas podem ser utilizadas para determinar qual modelo oferece o melhor desempenho. Considere as métricas para regressão e classificação, bem como as técnicas de detecção de overfitting e underfitting. Nesse contexto, quais métricas devem ser utilizadas para determinar qual modelo oferece o melhor desempenho?

Sem tópico · Tecnologia da Informação Difícil

Notas, exercícios e revisão — em um só fluxo.

Pare de pular entre cinco apps. Envie seu material uma vez e tenha, em um só lugar, tudo pra entender, praticar, memorizar e acompanhar seu progresso.