Ferramentas de Big Data podem, entre suas diversas atividades, ampliar o relacionamento do consumidor com um determinado produto ou empresa por meio das análises de dados geradas por informações disponibilizadas por seus usuários. Analise as afirmações a seguir e assinale a alternativa que represente as ações que se encaixam em atividades que têm relação com o uso de Big Data.
I. Sugestão de novos artistas - baseada nas preferências musicais do cliente.
II. Realização de cadastro do usuário em sistemas de compras on-line.
III. Gerar descontos específicos - baseados nos hábitos de compras do cliente.
IV. Indicação de produtos relacionados a itens adquiridos em compras anteriores.
V. Proposta de uma rota de trânsito específica para evitar engarrafamentos.
Estão corretas:
I – II – III – V.
Incorreta. Item I correto: sistemas de Big Data utilizam preferências para realizar novas sugestões a seus usuários.
Item II errado: cadastros são atividades dos bancos de dados relacionais, portanto, estão fora do contexto das atribuições do Big Data.
Item III correto: hábitos de compras são utilizados em sistemas de Big Data para gerar novas oportunidades de compra por meio de pontos que podem ser usados em novas aquisições ou descontos efetivos no valor final do produto.
Item V correto: sistemas que sugerem rotas de trânsito coletam dados em tempo real para permitir ao usuário desvios em caso de retenção de fluxo devido a acidentes ou grandes quantidades de automóveis na mesma rota.
I – II – III – IV.
Incorreta. Item I correto: sistemas de Big Data utilizam preferências para realizar novas sugestões a seus usuários.
Item II errado: cadastros são atividades dos bancos de dados relacionais, portanto, estão fora do contexto das atribuições do Big Data.
Item III correto: hábitos de compras são utilizados em sistemas de Big Data para gerar novas oportunidades de compra por meio de pontos que podem ser usados em novas aquisições ou descontos efetivos no valor final do produto.
Item IV correto: sistemas de compras utilizam históricos de compras conjuntas para indicar outras mercadorias aos seus usuários. Exemplo quem comprou o item A, também comprou o item B.
I – III – IV – V.
Correta. Item I correto: sistemas de Big Data utilizam preferências para realizar novas sugestões a seus usuários.
Item III correto: hábitos de compras são utilizados em sistemas de Big Data para gerar novas oportunidades de compra por meio de pontos que podem ser usados em novas aquisições ou descontos efetivos no valor final do produto.
Item IV correto: sistemas de compras utilizam históricos de compras conjuntas para indicar outras mercadorias aos seus usuários. Exemplo quem comprou o item A, também comprou o item B.
Item V correto: sistemas que sugerem rotas de trânsito coletam dados em tempo real para permitir ao usuário desvios em caso de retenção de fluxo devido a acidentes ou grandes quantidades de automóveis na mesma rota.
II – III – IV – V
Incorreta. Item II errado: cadastros são atividades dos bancos de dados relacionais, portanto, estão fora do contexto das atribuições do Big Data.
Item III correto: hábitos de compras são utilizados em sistemas de Big Data para gerar novas oportunidades de compra por meio de pontos que podem ser usados em novas aquisições ou descontos efetivos no valor final do produto.
Item IV correto: sistemas de compras utilizam históricos de compras conjuntas para indicar outras mercadorias aos seus usuários. Exemplo quem comprou o item A, também comprou o item B.
Item V correto: sistemas que sugerem rotas de trânsito coletam dados em tempo real para permitir ao usuário desvios em caso de retenção de fluxo devido a acidentes ou grandes quantidades de automóveis na mesma rota.
Todas as afirmativas estão corretas.
Incorreta. O item II não representa uma atividade relacionada com o uso de Big Data.
Big Data pode ser definido como um grande volume de dados que trafega pela internet. Devido ao avanço da tecnologia, os serviços geram cada vez mais dados. As análises desses dados produzem informações de forma instantânea, ajudando na tomada de decisão em tempo real. O Big Data apresenta alguns aspectos que comumente chamamos de 5 Vs: volume, velocidade, variedade, veracidade e valor. Considerando essas características do Big Data, assinale a alternativa correta.
A variedade está relacionada com a quantidade extensa de dados armazenada e analisada.
Incorreta. A variedade está relacionada com dados advindos de vários tipos de mídias.
O volume está relacionado com a importância dos dados para a empresa.
Incorreta. O volume está relacionado com a quantidade extensa de dados analisada.
A veracidade está relacionada com a alta transmissão de dados recebidos e transmitidos.
Incorreta. A veracidade está relacionada com a confiabilidade dos dados.
O valor está relacionado com a importância dos dados para empresa.
Correta. O valor de um dado está relacionado com a importância desse dado para as regras de negócio da empresa.
A velocidade está relacionada com a confiabilidade dos dados coletados.
Incorreta. A velocidade está relacionada com a alta transmissão de dados recebidos e transmitidos.
Com o aumento da quantidade de massas de dados geradas no advento da Web 2.0 foi necessário modificar a forma de armazenamento. Os bancos de dados existentes não comportavam mais esses tipos de dados que passaram a ser modelados de diversas formas (MATOS, 2019). Considerando esse contexto, assinale a alternativa que contém a modelagem de dados utilizada em ferramentas de Big Data.
SQL (Structured Query Language).
Incorreta. O SQL é uma modelagem para banco de dados relacional, Big Data utiliza modelagem de dados não relacional.
NoSQL (Not Only SQL).
Correta. NoSQL é uma tecnologia para modelagens de dados não relacionais. Como o Big Data armazena diversos tipos de dados, essa modelagem é adequada às ferramentas de armazenamento em massa.
ETL (Extract, Transforming and Loading).
Incorreta. ETL refere-se à ferramenta utilizada para combinar dados de diversas fontes, essencial na criação de ferramentas de Big Data.
OLAP (On-line Analytical Process).
Incorreta. OLAP é capacidade para manipular e analisar um grande volume de dados sob múltiplas perspectivas.
KDD (Knowledge Discovery in Databases).
Incorreta. É um processo que tem por finalidade a descoberta de conhecimento a partir da mineração de dados.
Segundo previsões, a internet das coisas (Internet of Things - IoT) será uma das maiores responsáveis pela geração dos dados processados em ferramentas de Big Data. Dentre as alternativas a seguir, assinale a que se refere a uma aplicação de IoT e que utiliza ferramentas de Big Data.
Envio de informações sobre batimentos cardíacos realizado em uma atividade física encaminhado por meio de uma smart band.
Correta. Esse tipo de atividade é realizada por meio de sensores que, conectados à internet, enviam as informações para uma ferramenta de análises de dados, aplicando os conceitos de IoT.
Recomendações de novas conexões de uma rede social, baseado no ciclo de amizade atual.
Incorreta. Esse tipo de atividade é realizado por sistemas que fazem o cruzamento de dados ou ferramentas de machine learning.
Descontos gerados para um cliente imediatamente após atingir um valor total de compras no mês.
Incorreta. Essa tarefa é realizada por ferramentas de BI que analisam dados de compra do cliente.
Recomendações de novos vídeos de um artista no Youtube, baseado em um vídeo assistido e utilizando ferramentas de machine learning.
Incorreta. Essas atividades são realizadas por meio de ferramentas de machine learning, analisando possíveis escolhas do usuário, não estão relacionadas com IoT.
Sugestão de compra de um produto, baseado em compras conjuntas realizadas por outros clientes.
Incorreta. Essas atividades são realizadas por ferramentas de análise de dados que relacionam compras feitas, criando uma relação entre os itens comprados, ou ferramentas de machine learning que analisam as escolhas de outros usuários.
O termo IoT (Internet of Things) surgiu em 1999, quando o tecnólogo Kevin Ashton o utilizou para mostrar que a utilização dos dados capturados pelos humanos estava relacionada a uma nova revolução da internet, uma vez que o uso de computadores impulsionou a gerar e coletar dados sem a necessidade da intervenção humana.
Assinale a alternativa correta em relação ao conceito de IoT.
Ambiente de objetos virtual com conexão com a internet por meio de diversos softwares pequenos e embutidos.
Incorreta. A internet das coisas não funciona em ambiente com objetos virtual e com conexão com a internet, além disso, necessita realizar a conexão em diversos tipos de sensores pequenos e embutidos.
Ambiente de objetos virtuais com conexão com a internet por meio de diversos dispositivos que são considerados embutidos.
Incorreta. A internet das coisas não funciona em ambiente virtual e com conexão com a internet, além disso, necessita de determinados tipos de sensores embutidos.
Ambiente de objetos nas nuvens sem conexão com a internet por meio de diversos hardware pequenos.
Incorreta. A internet das coisas não funciona com objetos nas nuvens sem conexão com à internet, além disso, não funciona com conexão com diversos hardwares pequeno.
Ambiente de objetos físicos com conexão com a internet por meio de diversos tipos de sensores pequenos e embutidos.
Correta. A internet das coisas funciona com objetos físicos utilizando conexão com a internet, além disso, essa conexão deve ser feita por meio de diversos sensores pequenos e embutidos.
Ambiente de objetos nas nuvens sem conexão com a rede local por meio de diversos cabos de redes físicos.
Incorreta. A internet das coisas não funciona em objetos nas nuvens sem conexão com a rede local, sendo assim, necessita da conexão com a internet. Além disso, não necessita de cabo de internet para realizar sua conexão, mas, sim, de diversos tipos de sensores.
O uso da arquitetura tradicional de cloud computing para IoT possui restrição na sua eficiência e desempenho, principalmente quando propõe suporte a serviços da internet das coisas, que necessitam de comunicação frequente e resposta em tempo real entre os dispositivos. Diante disso, surgiu a utilização de outras arquiteturas como edge computing e fog computing para IoT.
Sendo assim, assinale a alternativa correta em relação às características dessas arquiteturas que melhoraram a relevância da IoT na comunicação de dados.
O aumento do processamento de dados e a diminuição do tempo de comunicação dos dados.
Correta. O aumento do processamento de dados dentro ou à margem da rede e a diminuição do tempo de comunicação dessas aplicações em tempo real e com ambiente distribuído são considerados características relacionadas à IoT das arquiteturas edge computing e fog computing.
A diminuição do processamento de informação e a diminuição do tempo de transferência dos dados.
Incorreta. A diminuição do processamento de informação e a diminuição de transferência de dados não são consideradas características relacionada à IoT das arquiteturas edge computing e fog computing.
O aumento do processamento de dados e o aumento do tempo de comunicação dos dados.
Incorreta. O aumento do tempo de comunicação dos dados não é considerado uma característica relacionada à IoT das arquiteturas edge computing e fog computing.
A redução da variação de dados e o aumento do tempo da transferência dos dados.
Incorreta. A redução da variação de dados e o aumento da transferência de dados não são considerados características relacionadas à IoT das arquiteturas edge computing e fog computing.
A redução da permissão de dados e a elevação do tempo de mudança dos dados.
Incorreta. A redução da permissão de dados e a elevação do tempo de mudança de dados não são consideradas características relacionadas à IoT das arquiteturas edge computing e fog computing.
Os protocolos de comunicação são considerados a base de uma rede de comunicação e padronização na internet das coisas. Esses protocolos na internet das coisas são organizados por três camadas, utilizadas pelo modelo TCP/IP.
Assinale a alternativa que apresenta corretamente as três camadas do protocolo de comunicação utilizado em IoT.
Camada de mídia, camada da rede e camada de aplicativo.
Correta. As três camadas do protocolo de comunicação estão corretas. A camada de mídia é representada pela interface e o rádio, que transmitem os dados pelo ar; a camada de rede é formada pelo empacotamento dos dados do sensor para transporte pela rede; e a camada de aplicativo é representada por metadados para explorar a carga útil de dados brutos.
Camada de mídia, camada da rede e camada de enlace.
Incorreta. As camadas de mídia e rede estão corretas. Porém, a camada de enlace não é considerada uma camada do protocolo de comunicação utilizado em IoT. A camada de mídia é representada pela interface e o rádio, que transmitem os dados pelo ar, enquanto a camada de rede é formada pelo empacotamento dos dados do sensor para transporte pela rede. Já a camada de enlace é considerada uma das sete camadas do modelo ISO (International Organization for Standardization).
Camada de mídia, camada de transporte e camada de aplicativo.
Incorreta. As camadas de mídia e aplicativo estão corretas. Porém, a camada de transporte não é considerada uma camada do protocolo de comunicação utilizado em IoT. A camada de mídia é representada pela interface e o rádio, que transmitem os dados pelo ar, enquanto a camada de aplicativo é representada por metadados para explorar a carga útil de dados brutos. Já a camada de transporte é considerada uma das sete camadas do modelo ISO (International Organization for Standardization).
Camada de mídia, camada física e camada de aplicativo.
Incorreta. As camadas de mídia e aplicativo estão corretas. Porém, a camada física não é considerada uma camada do protocolo de comunicação utilizado em IoT. A camada de mídia é representada pela interface e o rádio, que transmitem os dados pelo ar, enquanto a camada de aplicativo é representada por metadados para explorar a carga útil de dados brutos. Já a camada física é considerada uma das sete camadas do modelo ISO (International Organization for Standardization).
Camada de sessão, camada da rede e camada de aplicativo.
Incorreta. As camadas de rede e aplicativo estão corretas. Porém, a camada de sessão não é considerada uma camada do protocolo de comunicação utilizado em IoT. A camada de rede é formada pelo empacotamento dos dados do sensor para transporte pela rede, enquanto a camada de aplicativo é representada por metadados para explorar a carga útil de dados brutos. Já a camada de sessão é considerada uma das sete camadas do modelo ISO (International Organization for Standardization).
As aplicações IoT devem possuir dispositivos inteligentes e conectados como maneira de utilizar cada informação compartilhada na sua vida cotidiana. Existem diversas aplicações de IoT no mundo real, como em casas inteligentes, carros conectados e cidades inteligentes.
Sendo assim, assinale a alternativa correta em relação à aplicação IoT que torna os espaços da residência tão comuns, como a utilização dos smartphones.
Smart City.
Incorreta. Com a utilização de Smart City, é possível transformar os espaços da cidade com infraestrutura e serviços essenciais mais inteligente, interligado e eficiente.
Smart TV.
Incorreta. Com a utilização de Smart TV é possível tornar a TV mais conectada, com a junção da televisão com a internet.
Smart Switch.
Incorreta. Com a utilização de Smart Switch Home, é possível transferir seus dados e informações pessoais de qualquer dispositivo de mesmo sistema operacional para esse sistema.
Smart Bracelet.
Incorreta. Com a utilização de bracelet, é possível conectar diversas funcionalidades do relógio de maneira inteligente.
Smart Home.
Correta. Com a utilização de Smart Home, é possível tornar os espaços da residência inteligente com a utilização dos smartphones, assim como reduzir tempo, dinheiro e energia desses produtos encontrados na residência.
Agentes inteligentes são capazes “de fazer uma leitura do ambiente em que está inserido e, a partir daí, propor soluções que maximizem as chances de sucesso. A Inteligência Artificial, que antes estava restrita às grandes empresas, hoje influencia a compra de produtos, muda o ambiente, melhora o dia a dia corporativo e facilita a vida das pessoas, de maneira racional” (ALVES, 2019, on-line).
Conforme a classificação dos sistemas ao longo da evolução da IA (Inteligência Artificial), os agentes inteligentes citados no texto, podem ser classificados corretamente como:
sistemas que pensam como seres humanos.
Incorreta. Nesse tipo de sistema, é necessário ter a programação das faculdades mentais para começar a criar o pensamento humano.
sistemas que agem como seres humanos.
Incorreta. Esses sistemas requerem a atuação como humanos no sentido comportamental. A inteligência, aqui, é criada para executar funções que também podem ser executadas por humanos, como o Teste de Turing.
sistemas que pensam de forma racional.
Incorreta. Esse tipo de sistema é baseado em notações lógicas.
sistemas que agem de forma racional.
Correta. Nesse tipo de sistema tem-se a utilização de um agente que analisa o ambiente e propõe formas racionais de pensar conforme foi programado.
sistemas especialistas.
Incorreta. Um sistema especialista imita o comportamento de um especialista em uma área do conhecimento.
Leia o trecho a seguir.
“São softwares movidos por Inteligência Artificial, capazes de executar pequenas tarefas e fornecer informações solicitadas pelo usuário. Eles partem, em resumo, da conta do usuário, reconhecimento de voz e de sua geolocalização para acessar várias fontes sobre clima, trânsito, horários, entre outros temas. São exemplos desses softwares: Siri, Alexa, Cortana entre outros” (RAHDE, 2019, on-line).
Com base no texto acima, podemos afirmar que esses softwares podem ser definidos como qual tipo de utilização de inteligência artificial (IA) em nosso dia a dia?
Assistentes pessoais.
Correta. Esses softwares executam tarefas diárias e, a partir do reconhecimento de voz, podem realizar e sugerir opções para o dia a dia do usuário.
Chatbots.
Incorreta. Esse software tem o objetivo de sanar as dúvidas dos usuários após uma conversa on-line.
Leitor de e-mail.
Incorreta. O leitor de e-mail utilizando IA se propõe a fazer a varredura nos e-mails dos usuários e realizar classificações, como spam, e enviá-los para a lixeira.
Análise de dados.
Incorreta. A análise de dados é uma técnica que permite que, após analisar uma quantidade enorme de dados, seja oferecido um padrão para o usuário poder otimizar rotinas.
Gestores de pessoas.
Incorreta. Esse tipo de sistema está interessado em encontrar um padrão para uma possível vaga de emprego ofertada.
Termos fuzzy são utilizados diariamente em linguagem natural para representar dados incertos ou, como são denominados em computação, nebulosos. Tais dados são considerados muito vagos e/ou subjetivos e não possuem um limite muito bem definido.
Com base na definição dos termos fuzzy, qual das alternativas abaixo aplica corretamente esse conceito ao termo sublinhado? Assinale a alternativa correta.
O dólar está com cotação de R$ 3,50 (reais) na bolsa de valores.
Incorreta. O termo “cotação” foi definido em seu limiar em 3.50, portanto, não há incerteza no valor da cotação.
O trabalho está realizado, de forma concluída, em 100%.
Incorreta. O termo “realizado” tem o limite de 100% para ser considerado realizado.
A água está muito quente.
Correta. O termo “muito” está incerto na frase, pois não se tem um limite que informe o que torna a água quente.
Siga a estrada por 10 km.
Incorreta. “10 km” refletem, matematicamente, o limite que se deve seguir pela estrada.
O idoso tem uma escala de idade a partir de 50 anos.
Incorreta. O idoso tem uma escala definida, em seu limiar, em a partir de 50 anos. Não há outras classificações de idade nessa frase.
Considere o trecho a seguir:
“Este estudo usa ‘algoritmos evolutivos genéticos’ para prever o crescimento urbano, mirando especificamente o distrito de Minato em Tóquio. O arquiteto Ivan Pazos, principal autor do novo estudo, explicou a ciência por trás do algoritmo: ‘Operamos dentro da computação evolutiva, um ramo da inteligência artificial e aprendizagem automática que usa as regras básicas da genética e a lógica da seleção natural de Darwin para fazer previsões’” (ABDALLAH, on-line).
As regras básicas de um algoritmo simples como o da matéria acima fazem uso de operações básicas da genética. Diante disso, analise as assertivas a seguir.
I. A primeira operação é a inicialização da população, que é uma amostra de indivíduos coletada de forma padronizada para descartar indivíduos que não se encaixam no problema.
II. A segunda operação é o cálculo de aptidão, que consiste em analisar os indivíduos da população inicial e fornece um ranking selecionando os melhores indivíduos.
III. A terceira operação é, após receber os indivíduos ranqueados, a seleção dos indivíduos para gerar uma nova população.
IV. A quarta operação é o cruzamento, em que é realizado um corte de forma configurada na primeira lista de indivíduos da seleção, para, assim, gerar duas listas de indivíduos que serão cruzados.
V. A quinta operação é a mutação que seleciona um indivíduo qualquer da nova geração e modifica seu gene, para que seja gerada uma nova população de indivíduos.
Estão corretas as afirmativas:
I, II e III, apenas.
Incorreta. A afirmativa I está incorreta, pois a amostra de indivíduos é feita de forma aleatória. A afirmativa II está incorreta, pois, no cálculo de aptidão, os indivíduos não são selecionados. A afirmativa III está correta, pois os indivíduos recebem um número para selecionar os indivíduos mais aptos para a solução do problema.
I, III e IV, apenas.
Incorreta. A afirmativa I está incorreta, pois a amostra de indivíduos é feita de forma aleatória. A afirmativa III está correta, pois os indivíduos recebem um número para selecionar os indivíduos mais aptos para a solução do problema. A afirmativa IV está incorreta, pois o corte na primeira lista de indivíduos é feito de forma aleatória.
II e III, apenas.
Incorreta. A afirmativa II está incorreta, pois, no cálculo de aptidão, os indivíduos não são selecionados. A afirmativa III está correta, pois os indivíduos recebem um número para selecionar os indivíduos mais aptos para a solução do problema.
III e IV, apenas.
Incorreta. A afirmativa III está correta, pois os indivíduos recebem um número para selecionar os indivíduos mais aptos para a solução do problema. A afirmativa IV está incorreta, pois o corte na primeira lista de indivíduos é feito de forma aleatória.
III e V, apenas.
Correta. A afirmativa III está correta, pois os indivíduos recebem um número para selecionar os indivíduos mais aptos para a solução do problema. A afirmativa V está correta, pois a mutação consiste na modificação de um gene da lista de indivíduos anteriores para gerar uma nova geração.
A Amazon Alexa, uma assistente virtual inteligente que conversa com o usuário para realizar suas tarefas diárias, e o Amazon Polly, um serviço que realiza a transformação de texto em falas reais, são produzidos pela empresa Amazon, a qual informou que tais serviços já estão realizando a conversão do texto em falas utilizando redes neurais em camadas.
Sobre as redes neurais em camadas, pode-se afirmar que:
a rede em camadas possui somente duas: a de entrada e a de saída. O processamento é realizado por uma IA externa.
Incorreta. O processamento é realizado pelos neurônios de processamento.
na rede em camadas, a primeira etapa é receber os estímulos do ambiente, que só podem ser aqueles que são pré-configurados na rede.
Incorreta. Os estímulos são realizados de forma aleatória.
em uma rede em camadas, a camada de neurônios de saída emite informações vagas e imprecisas.
Incorreta. As saídas são respostas de forma binária.
as camadas de uma rede neural são: neurônios de entrada, processamento e saída, que visam responder o problema de forma binária.
Correta. Em uma rede neural em camadas, as etapas são: entrada, processamento e saída, sendo realizadas por neurônios que serão treinados até atingir a solução correta do problema de forma binária. As respostas ao problema são valores binários.
em uma rede em camadas, a camada de entrada recebe os dados advindos do estímulo de forma padronizada.
Incorreta. Os dados vêm de forma aleatória, e a rede neural de entrada interpreta qual valor ela precisa receber para enviar para a fase de processamento.
Um dos principais papéis em ciência de dados é o do cientista de dados, o qual possui um conjunto de características importantes para realizar a análise de extensas quantidades de dados nessa área. Além disso, é correto afirmar que a função principal de um cientista de dados é:
ser ágil na resolução dos algoritmos de ciência de dados.
Incorreta. O cientista de dados precisa ser ágil na solução do problema, aplicando um algoritmo que responda perfeitamente ao problema.
encontrar dados que podem ser relevantes ou não para os negócios.
Incorreta. O cientista de dados precisa encontrar apenas dados relevantes para o negócio, para, assim, solucionar os problemas.
é considerado um “pescador de dados”, que busca os dados certos para a solução do problema proposto.
Correta. Uma das habilidades do cientista de dados é buscar o dado correto, para solucionar o problema de forma eficiente.
propor-se a criar redes neurais, como recurso trivial para buscar o conhecimento para a solução do problema proposto.
Incorreta. Não é a função principal do cientista de dados criar redes neurais, mas, sim, analisar grandes quantidades de dados; não pode ser considerada um recurso trivial, pois podem ter outras soluções.
implantar soluções para aprendizado de máquina.
Incorreta. Soluções de aprendizados de máquina são implementadas por profissionais de inteligência artificial.
Um fluxo de atividades determina quais passos devem ser seguidos para se chegar a um resultado. Os passos se propõem a ser esquemas de tarefas que, se seguidos sequencialmente em uma ordem predefinida, garantem a solução do problema.
Em ciência de dados, tem-se um fluxo de atividades com cinco tarefas, que são:
faça uma pergunta interessante, obtenha os dados, explore os dados, modele os dados e visualize e divulgue os resultados.
Correta. Esta é a sequência correta em um fluxo de atividades em ciência de dados, em que se começa com uma pergunta e depois são obtidos, explorados e modelados os resultados e, ao final, a partir da visualização de dados, os resultados são divulgados.
faça uma análise prévia dos dados, obtenha os dados, explore os dados, modele os dados e visualize e divulgue os resultados.
Incorreta. Não se começa o fluxo com uma análise prévia dos dados, mas com um questionamento.
minere os dados, obtenha os dados, explore os dados, modele os dados e visualize e divulgue os resultados.
Incorreta. Não se começa o fluxo com uma mineração dos dados, mas com um questionamento.
faça uma pergunta interessante, obtenha os dados, explore os dados, modele os dados e visualize e categorize os resultados.
Incorreta. Os resultados não são categorizados, mas dispostos em forma de respostas para a pergunta descrita no primeiro passo.
faça uma pergunta interessante, obtenha os dados, explore os dados, minere os dados e visualize e divulgue os resultados.
Incorreta. Os dados não são minerados, mas modelados no fluxo de atividades.
Para que a ciência de dados possa ser implementada são necessários alguns recursos tecnológicos como linguagens de programação, estruturas de armazenamento e processamento de dados e banco de dados. Qual das alternativas a seguir refere-se a exemplos de banco de dados?
Java e Mysql.
Incorreta. Java é uma linguagem de programação.
Mysql e Nosql.
Correta. São tipos de banco de dados muito utilizados em ciência de dados.
Nosql e Java.
Incorreta. Java não é um tipo de banco de dados, mas, sim, uma linguagem de programação.
PHP e Mysql.
Incorreta. PHP não é um tipo de banco de dados, mas, sim, uma linguagem de programação.
Ruby e Nosql.
Incorreta. Ruby não é um tipo de banco de dados, mas, sim, uma linguagem de programação.
Considere o trecho a seguir:
“A equipe do Booz Allen conseguiu desenvolver um aplicativo para os treinadores da MLB para prever qualquer lançamento de arremessador com até 75% de precisão, mudando a maneira como as equipes se preparam para um jogo, formação da equipe adversário e o melhor arremesso com base em alguns parâmetros” (3 EXEMPLOS…, 2019, on-line).
Pode-se afirmar que o aplicativo mencionado no contexto anterior está utilizando técnicas de ciência de dados, pois:
com as predições do aplicativo, o treinador procura formas específicas para se preparar para o jogo.
Correta. As previsões têm a capacidade de analisar a formação de uma equipe adversária e executar previsões para antecipar como estruturar suas jogadas.
por meio das previsões do aplicativo, a equipe fica limitada em suas jogadas.
Incorreta. As previsões não limitam as jogadas da equipe, mas funcionam como formas de auxiliá-la para executar os melhores arremessos em suas jogadas.
as equipes treinam movimentos específicos, mas não sabem qual é o melhor momento para o arremesso.
Incorreta. O aplicativo analisa várias formas de arremesso, até chegar em um arremesso ideal com base em várias características do jogador, fazendo com que o aplicativo informe o momento ideal do arremesso.
as equipes antecipam as suas jogadas, mas não conseguem analisar como será a formação da equipe adversária.
Incorreta. O aplicativo oferece várias formas de combinação das equipes adversárias, o que influencia no melhor arremesso da equipe do Booz, resultando na melhor estruturação das suas partidas.
mediante as predições do aplicativo, o jogo não mudará a forma como acontece.
Incorreta. As previsões são a base para a formação do jogo, mas pode existir casos de exceção não analisados pelo aplicativo que podem mudar a forma como o jogo acontece.
Analise as definições a seguir em relação aos tipos de aprendizado de máquina.
1) Supervisionado.
2) Semissupervisionado.
3) Não supervisionado.
4) Por reforço.
I - ( ) É um tipo de aprendizagem de máquina que investiga como agentes de software devem agir em determinados ambientes, utilizando técnicas de tentativa e erro.
II - ( ) É considerado um tipo de aprendizado de máquina que realiza o treinamento de dados rotulados para solução de uma tarefa, tendo a intervenção humana.
III - ( ) É um tipo de aprendizado de máquina que trabalha tanto com dados rotulados quanto com dados não rotulados, melhorando significativamente a acurácia.
IV - ( ) É classificado como um tipo de aprendizado de máquina em que a aprendizagem ocorre com dados não rotulados, ou seja, não dizemos ao computador o que é aquela entrada.
V - ( ) É uma forma de ensinar ao computador qual ação priorizar dada uma determinada situação, por meio de várias tentativas. Por reforço.
Em seguida, assinale a alternativa que relaciona cada item das descrições acima com o tipo de aprendizado de máquina de forma correta:
I - 1, II - 1, III - 2, IV - 3 e V - 4.
Incorreta. O item I não pode ser classificado como supervisionado, mas por reforço, posto que utiliza técnicas de tentativa e erro. O item II é supervisionado, pois há a supervisão humana nesse tipo de aprendizagem. O item III é semissupervisionado, pois a característica principal desse tipo de aprendizagem é trabalhar com os dois tipos de dados: rotulados e não rotulados. O item IV é não supervisionado, pois a máquina não sabe a classificação da entrada de dados e, assim, pode realizar previsões incalculáveis, sendo o resultado algo imprevisível. O item V é aprendizagem por reforço, pois são necessárias várias tentativas para que a máquina seja treinada.
I - 4, II - 3, III - 2, IV - 3 e V - 4.
Incorreta. O item I pode ser classificado como por reforço, posto que utiliza técnicas de tentativa e erro. O item II é supervisionado e não pode ser classificado como não supervisionado, pois há a supervisão humana nesse tipo de aprendizagem. O item III é semissupervisionado, pois a característica principal desse tipo de aprendizagem é trabalhar com os dois tipos de dados: rotulados e não rotulados. O item IV é não supervisionado, pois a máquina não sabe a classificação da entrada de dados e, assim, pode realizar previsões incalculáveis, sendo o resultado algo imprevisível. O item V é aprendizagem por reforço, pois são necessárias várias tentativas para que a máquina seja treinada.
I - 4, II - 1, III - 2, IV - 3 e V - 4.
Correta. O item I pode ser classificado como por reforço, posto que utiliza técnicas de tentativa e erro. O item II é supervisionado, pois há a supervisão humana nesse tipo de aprendizagem. O item III é semissupervisionado, pois a característica principal desse tipo de aprendizagem é trabalhar com os dois tipos de dados: rotulados e não rotulados. O item IV é não supervisionado, pois a máquina não sabe a classificação da entrada de dados e, assim, pode realizar previsões incalculáveis, sendo o resultado algo imprevisível. O item V é aprendizagem por reforço, pois são necessárias várias tentativas para que a máquina seja treinada.
I - 4, II - 1, III - 2, IV - 4 e V - 4.
Incorreta. O item I pode ser classificado como por reforço, posto que utiliza técnicas de tentativa e erro. O item II é supervisionado, pois há a supervisão humana nesse tipo de aprendizagem. O item III é semissupervisionado, pois a característica principal desse tipo de aprendizagem é trabalhar com os dois tipos de dados: rotulados e não rotulados. O item IV é não supervisionado e não pode ser classificado por reforço, pois não está sendo utilizado o método de tentativa e erro. O item V é aprendizagem por reforço, pois são necessárias várias tentativas para que a máquina seja treinada.
I - 1, II - 1, III - 2, IV - 3 e V - 4.
Incorreta. O item I pode ser classificado como por reforço, posto que utiliza técnicas de tentativa e erro. O item II é supervisionado, pois há a supervisão humana nesse tipo de aprendizagem. O item III é semissupervisionado, pois a característica principal desse tipo de aprendizagem é trabalhar com os dois tipos de dados: rotulados e não rotulados. O item IV é não supervisionado, pois a máquina não sabe a classificação da entrada de dados e, assim, pode realizar previsões incalculáveis, sendo o resultado algo imprevisível. O item V é aprendizagem por reforço, pois são necessárias várias tentativas para que a máquina seja treinada.
Analise a situação a seguir:
“A partir de dados de animais em um zoológico, deve-se aproximar animais por suas características, ou seja, a partir dos dados como ‘quantidade de pernas’, ‘quantidade de dentes’, ‘põe ovo’, ‘tem pelos’ e vários outros, procuramos animais que estão mais próximos. Poderíamos, assim, separar animais em mamíferos, aves ou répteis, mas sem ‘contar’ ao algoritmo sobre estas classificações. Apenas comparando a distância entre dados o algoritmo mostraria que um tigre está “mais próximo” de um leão do que de uma garça” (HONDA, 2017, on-line)
Nesse contexto, pode-se utilizar que tipo de método estatístico de aprendizado de máquina?
Regressão.
Incorreta. Esse tipo de método utiliza dados rotulados, isto é, aqueles que são informados ao algoritmo.
Classificação.
Incorreta. Utiliza dados não rotulados (não são informadas as entradas para o algoritmo) e precisa da intervenção humana.
Supervisionado.
Incorreta. Não é um tipo de método estatístico, mas, sim, de aprendizado de máquina.
Aprendizagem por reforço.
Incorreta. Não é um tipo de método estatístico, mas, sim, de aprendizado de máquina.
Clusterização.
Correta. Os dados não rotulados só serão agrupados (Clustering) conforme são encontradas as relações entre as variáveis.
É considerada uma subárea do aprendizado de máquina e tem como objetivo simular a rede neural do cérebro humano, por meio da utilização de algoritmos de alto nível. O contexto apresentado no enunciado da questão refere-se à(ao):
inteligência artificial.
Incorreta. Inteligência Artificial é a área de ciência da computação concentrada em criar programas e máquinas que podem exibir comportamentos considerados inteligentes.
machine learning.
Incorreta. Aprendizado de máquina é a utilização de algoritmos para estruturar os dados e reconhecer padrões para que o computador aprenda a solucionar um problema.
deep learning.
Correta. É a parte do aprendizado de máquina que, por meio de algoritmos de alto nível, imita a rede neural do cérebro humano.
ciência de dados.
Incorreta. É um campo interdisciplinar que utiliza métodos, processos, algoritmos e sistemas científicos para extrair valor dos dados.
aprendizado por reforço.
Incorreta. Não é uma subárea do aprendizado de máquina, mas, sim, um tipo de aprendizado.
Em sistemas de recomendação de compras on-line, são utilizados mecanismos de aprendizado de máquina. É quase inacreditável o fato de que o programa sabe qual produto você tem mais chances de comprar! De que forma esses sistemas estão utilizando aprendizado de máquina?
Por meio do histórico de compras anteriores e visualização de determinados produtos.
Correta. Os sistemas de aprendizado de máquina são capazes de prever itens que você pode gostar, de acordo com suas compras anteriores ou hábitos de visualização.
Criando uma rede neural para entender o perfil do consumidor.
Incorreta. Dessa forma seria deep learning, que consiste na utilização de redes neurais artificiais, e não machine learning, que é a forma como a máquina aprende a solucionar um problema.
Simulando um consumidor que realiza compras on-line.
Incorreta. Isso seria para treinar uma rede neural, que teria o comportamento de um consumidor que realizaria compras on-line de forma automática.
Analisando grande quantidade de dados de perfis de consumidores de produtos on-line.
Incorreta. É utilizado como técnicas de análise de dados em ciência de dados, que visam categorizar os dados para, assim, gerar informação relevante.
Com base na forma de pagamento do consumidor.
Incorreta. O objetivo não é analisar a forma de pagamento, mas, sim, os produtos que serão comprados pelo consumidor.