Descrição
Apostila Concurso Petrobras 2022 Ciência de Dados
Cargo: ÊNFASE 7: CIÊNCIA DE DADOS
Editora: DOMINA CONCURSOS
Edição: 2021/2022
Nível: Superior
Banca: Cebraspe
Edital: Acesso ao Edital
Quantidade de Páginas: 1209
Não é só uma apostila!
Material teórico completo elaborado totalmente de acordo com o novo edital.
Acompanha provas anteriores com gabarito para testar seu aprendizado.
Só hoje, de R$109,98 por R$54,99
50% de Desconto
Conhecimentos Básicos
(Totalmente de Acordo com Edital 2021/2022)
LÍNGUA PORTUGUESA: 1 Compreensão e interpretação de textos de gêneros variados. 2 Reconhecimento de 33 tipos e gêneros textuais. 3 Domínio da ortografia oficial. 4 Domínio dos mecanismos de coesão textual. 4.1 Emprego de elementos de referenciação, substituição e repetição, de conectores e de outros elementos de sequenciação textual. 4.2 Emprego de tempos e modos verbais. 5 Domínio da estrutura morfossintática do período. 5.1 Emprego das classes de palavras. 5.2 Relações de coordenação entre orações e entre termos da oração. 5.3 Relações de subordinação entre orações e entre termos da oração. 5.4 Emprego dos sinais de pontuação. 5.5 Concordância verbal e nominal. 5.6 Regência verbal e nominal. 5.7 Emprego do sinal indicativo de crase. 5.8 Colocação dos pronomes átonos. 6 Reescrita de frases e parágrafos do texto. 6.1 Significação das palavras. 6.2 Substituição de palavras ou de trechos de texto. 6.3 Reorganização da estrutura de orações e de períodos do texto. 6.4 Reescrita de textos de diferentes gêneros e níveis de formalidade.
LÍNGUA INGLESA: 1 Compreensão de textos escritos em língua inglesa. 2 Itens gramaticais relevantes para o entendimento dos sentidos dos textos.
Conhecimentos Específicos
(Totalmente de Acordo com Edital 2021/2022)
BLOCO I: 1 Aprendizado supervisionado: Regressão e Classificação. 1.1 Métricas de avaliação. 1.2 Overfitting e underfitting de modelos. 1.3 Regularização. 1.4 Seleção de modelos: Erro de Generalização. 1.5 Validação Cruzada. 1.6 Conjuntos de Treino, Validação e Teste. 1.7 Trade off entre Variância e Viés. 1.8 Algoritmos: Regressão Linear e Regressão Logística. 1.9 Árvores de decisão e random forests. 1.10 Máquina de suporte de vetores. 1.11 Naive Bayes. 1.12 K-NN. 1.13 Ensembles. 1.14 Aprendizado supervisionado com Python scikit-learn. 1.15 Conceitos de otimização de hiperparâmetros. 2 Aprendizado não supervisionado. 2.1 Redução de dimensionalidade: PCA. 2.2 Agrupamento K-Means. 2.3 Mistura de Gaussianas. 2.4 Agrupamento Hierárquico. 2.5 Regras de associação. 2.6 Aprendizado não supervisionado com Python scikit-learn. 3 Redes neurais artificiais. 3.1 Conceitos Básicos em Redes Neurais Artificiais: Definições e Arquitetura. 3.2 Funções de Ativação. 3.3 Otimização de Redes Neurais Artificiais: método do gradiente, método do gradiente estocástico, algoritmo backpropagation, métodos de inicialização dos pesos, Vanishing Gradients. 3.4 Métodos de regularização: penalização com normas L1 e L2, Dropout e Early Stopping. 3.5 Definições básicas de Redes Neurais Convolucionais. 3.6 Definições básicas de Redes Neurais Recorrentes. 3.7 Redes neurais com Python: treino de modelos com Keras e Pytorch.
BLOCO II: 1 Machine learning aplicado. 1.1 Noções de Visão computacional com redes neurais convolucionais. 1.2 Classificação de imagens. 1.3 Detecção de objetos. 1.4 Segmentação de objetos e instâncias. 1.5 Noções de Processamento Natural de Linguagem. 1.6 Stopwords, stemização e n-grams. 1.7 TF-IDF. 1.8 Modelagem de tópicos (LDA, NMF). 1.9 Word embeddings: CBOW e Skip Gram. 1.10 Conceitos Básicos em Séries Temporais. 2 Manipulação, tratamento e visualização de dados. 2.1 Técnicas de visualização de dados (questão 1/2). 2.2 Técnicas de visualização de dados (questão 2/2). 2.3 Lidando com valores faltantes. 2.4 Lidando com dados categóricos. 2.5 Normalização numérica. 2.6 Detecção e tratamento de outliers. 2.7 Manipulação de dataframes com Python Pandas: leitura de dados tabulares, seleção de linhas e colunas, agregação de dados, preenchimento de valores faltantes, remoção de duplicados, junção de dataframes. 3 Banco de dados e data warehouse. 3.1 Modelo entidade-relacionamento. 3.2 Mapeamento lógico relacional. 3.3 Normalização. 3.4 Linguagem de definição e manipulação de dados (SQL). 3.5 Conceitos de data warehousing e modelagem multidimensional (esquema estrela). 3.6 Conceitos gerais de Hadoop: HDFS, MapReduce, YARN e Spark. 3.7 Conceitos de Bancos NoSQL e Armazenamento orientado a objeto (object store).
BLOCO III: 1 Cálculo. 1.1 Précálculo: Conjuntos, Coordenadas Cartesianas, Cônicas e Produtos Notáveis. 1.2 Funções. 1.3 Limites. 1.4 Derivadas. 1.5 Derivadas parciais. 1.6 Máximos e Mínimos. 1.7 Esboços de Gráficos de Funções. 1.8 Integrais. 2 Álgebra Linear para Ciência de Dados. 2.1 Notação de vetores e matrizes. 2.2 Operações com vetores e matrizes; produto escalar e produto vetorial. 2.3 Matriz identidade, inversa e transposta. 2.4 Transformações lineares. 2.5 Normas (L1, L2). 2.6 Autovalores e autovetores. 2.7 Decomposição SVD. 2.8 Álgebra linear e operações matriciais com Python Numpy. 3 Probabilidade e estatística. 3.1 Conceitos de Probabilidade: Modelo de probabilidade, Probabilidade Condicional, Independência, Variáveis Aleatórias, Esperança, Variância e Covariância. 3.2 Distribuições Contínuas e Discretas: Normal, t-Student, Poisson, Exponencial, Binomial, Dirichlet. 3.3 Distribuições multidimensionais; matriz de covariância. 3.4 Estatísticas Descritivas. 3.5 Inferência Estatística: Teorema do Limite Central, Teste de Hipótese e Intervalo de Confiança, Estimador de Máxima Verossimilhança, Inferência Bayesiana. 3.6 Coeficiente de correlação de Pearson. 3.7 Histogramas e curvas de frequência. 3.8 Diagrama boxplot. 3.9 Avaliação de outliers. 4 Algoritmos e estrutura de dados. 4.1 Complexidade de algoritmos e notação assintótica (Big O). 5 Conceitos modernos de sistemas de informação. 5.1 Conceitos Nuvem: IaaS, PaaS e SaaS. 5.2 Conceitos de Containers: construção, registro, execução e orquestração. 5.3 Conceitos básicos de DevOps: versionamento com git, pipeline e CI/CD.
Apostila Concurso Petrobras 2022 Ciência de Dados