Banco de questões Didata

Questão pública

Tecnologia da Informação · Aprendizado de Máquina (Machine Learning) · Matriz de confusão: precision e recall; Random Forest e redução de variância (robustez a outliers)

Múltipla escolha CESGRANRIO 2024 Difícil

As árvores de decisão são um modelo de aprendizado de máquina que opera por meio da construção de uma estrutura em forma de árvore para tomar decisões e que oferece uma compreensão clara da lógica de decisão e da hierarquia de características que contribuem para as predições finais. Elas são versáteis e podem ser usadas tanto para tarefas de classificação quanto para as de regressão. Nesse contexto, considere a construção de uma árvore de regressão usando a classe DecisionTreeRegressor do Scikit-Learn e seu treinamento em um conjunto de dados quadrático com max_depth=2, conforme mostrado a seguir: from sklearn.tree import DecisionTreeRegressor tree_reg = DecisionTreeRegressor(max_depth=2) tree_reg.fit(X, y) A árvore resultante é representada na Figura a seguir. GÉRON, A. Hands-on machine learning with Scikit-Learn, Keras, and TensorFlow: Concepts, Tools, and Techniques to Build Intelligent Systems. 2 ed. Sebastopol, CA: O’Reilly Media, Inc.: 2019, p. 183. Considerando-se o cenário apresentado e que se deseja fazer uma predição para uma nova instância, com x1 = 0.6, qual será o valor predito?

a

0.015

b

0.074

c

0.111

d

0.259

e

110

Resolva com gabarito comentado

Gabarito, explicação e revisão espaçada — tudo para fixar de verdade.

Começar a praticar

Questões relacionadas

6

CESGRANRIO 2024

Um pesquisador de ciência de dados foi encarregado de analisar a capacidade de um modelo de aprendizado de máquina em prever se um cliente é bom pagador. Para isso, possuía um conjunto de dados de testes rotulado, sobre o qual aplicou o modelo e obteve a matriz de confusão a seguir: Resultado do Modelo Positivo Negativo Positivo 45 5 Negativo 10 40 Considerando-se esse contexto, quais são, respectivamente, os valores aproximados, em 2 casas decimais, da precisão (precision) e da revocação (recall) obtidos pelo modelo?

Matriz de confusão: precision e recall; Random Forest e redução de variância (robustez a outliers) ·Tecnologia da Informação Difícil

CESGRANRIO 2024

Em uma nota técnica do Ipea sobre emprego público nos governos subnacionais brasileiros, no ano de 2016, aparece menção sobre o fato de as bases utilizadas possuirem outliers, ou valores atípicos. A construção de um modelo preditivo a partir dos dados dessas bases, usando árvores aleatórias, Random Forests,

Matriz de confusão: precision e recall; Random Forest e redução de variância (robustez a outliers) ·Tecnologia da Informação Média

CESGRANRIO 2024

No gráfico XY, são apresentados pontos que representam duas propriedades de elementos de duas classes, R e S. Os pontos da classe R, representados como círculos, são [(3,5),(3,4),(2,3)], enquanto os pontos da classe S, representados como quadrados, são [(4,3),(4,2),(4,1),(3,1),(2,2)]. É necessário classificar pontos novos, de acordo com o algoritmo K-NN, com K=3, considerando a distância euclidiana. Nesse contexto, as classes dos pontos [(3,2),(3,3) e (4,4)] são, respectivamente:

Matriz de confusão: precision e recall; Random Forest e redução de variância (robustez a outliers) ·Tecnologia da Informação Média

CESGRANRIO 2024

Um cientista de dados está utilizando SHapley Additive exPlanations (SHAP) para entender a importância das variáveis em um modelo de aprendizado de máquina que prevê a probabilidade de um cliente deixar de ser assinante de um serviço (churn). Considere o seguinte conjunto de dados simplificado com três características para um cliente específico: Característica Valor Contribuição Marginal ao Modelo – Valor de Shapley Tempo de Assinatura 12 (meses) 0,05 Número de Reclamações 3 0,20 Número de Acessos ao Suporte 10 0,15 A previsão base do modelo, que representa a probabilidade estimada de um cliente se tornar um churn quando nenhuma das características individuais é considerada, é de 0,30. Considerando-se esse contexto, qual é a probabilidade prevista pelo modelo para que esse cliente deixe de assinar o serviço?

Matriz de confusão: precision e recall; Random Forest e redução de variância (robustez a outliers) ·Tecnologia da Informação Fácil

CESGRANRIO 2024

Um cientista de dados está utilizando máquinas de vetor de suporte (SVM) em um projeto de classificação, pois deseja evitar o overfitting do modelo aos dados de treinamento. Qual das seguintes técnicas auxilia a prevenir o overfitting em SVM?

Matriz de confusão: precision e recall; Random Forest e redução de variância (robustez a outliers) ·Tecnologia da Informação Fácil

CESGRANRIO 2024

Em um projeto de classificação de textos, um modelo de machine learning foi aplicado em um conjunto de teste e apresentou os seguintes resultados: uma precisão de 80% e uma revocação de 70%. Com base nessas informações e considerando-se apenas a parte inteira da porcentagem, qual é o F1 Score desse modelo?

Matriz de confusão: precision e recall; Random Forest e redução de variância (robustez a outliers) ·Tecnologia da Informação Difícil

Notas, exercícios e revisão — em um só fluxo.

Pare de pular entre cinco apps. Envie seu material uma vez e tenha, em um só lugar, tudo pra entender, praticar, memorizar e acompanhar seu progresso.