Pular para o conteúdo principal

Exercícios resolvidos em Linguagem Python - para iniciantes

Esta lista de exercícios resolvidos é um manual para ajudar todo aluno iniciante e não só, a adquirir e aprimorar as habilidades necessárias para se trabalhar com Python, de forma rápida e consistente. Estude e desfrute do conteúdo. 1º Exercício      Faça um programa que informe a versão do Python que você está utilizando Solução import sys print ( "Versão do Python" ) print (sys.version) print ( "Informação da versão instalada" ) print (sys.version_info) Atenção :     -  O módulo sys fornece funções e variáveis usadas para manipular diferentes partes do ambiente de tempo de execução do Python;     - Pra quem ainda não está familiarizado com a linguagem, um módulo  é um arquivo contendo definições e comandos em Python para serem usados em outros programas. 2º Exercício      Faça um programa em linguagem Python que converta metros para centímetros. Solução print ( ' \t ----Conversão de medida---- ' ) metros = int ( input ( 'Informe o valor em metros: 

O que é Pipelines de Dados?

Um pipeline de dados é um meio de mover dados de um local(origem) para um destino(Um Data Warehouse ou Data Lake por exemplo).

Ao longo do caminho, os dados são transformados e otimizados, chegando a um estado em que podem ser analisados e usados para desenvolver insights de negócios.

Um pipeline de dados é essencialmente o conjunto das etapas envolvidas na agregação, organização e movimentação de dados.


Os pipelines de dados modernos automatizam muitas das etapas  manuais envolvidas na transformação e otimização do carregamento de dados


Normalmente , o pipeline inclui carregar dados brutos em uma tabela de preparação ( área intermediária ou staging area) para armazenamento temporário e, em seguida, alterá-los antes de inseri-los no destino.


Pipeline de dados é um conceito e pode ser implementado de muitas formas diferentes, desde ferramentas de automação em ambiente local, ferramentas em nuvem ou mesmo via programação em linguagens como Python, R, Scala, C++ ou Java.


Componentes de um pipeline de dados


1- Origem(banco de dados, arquivos Excel, CSV,PDF): temos que tomar os devidos cuidados com a forma como extraímos os dados, quando extraímos os dados, se por acaso tivermos mais de uma fonte de dados, como nós vamos combinar esses dados para depois aplicar a etapa nº2 que é a de processamento.

2- Processamento: é a limpeza dos dados, a transformação. Normalmente é a etapa mais complexa. Cada pipeline atende a um objetivo e podemos ter dezenas ou centenas dela, dependendo da infraestrutura de dados da empresa.


3- Destino: é o lugar onde vou colocar  os dados depois de limpo, processado  e organizado.  Eu posso gravar em um Data Lake, Data Warehouse, banco de dados. Eu posso armazenar esses dados ou posso usar esses dados à medida  que eu vou processando. o destino pode ser o uso em tempo real principalmente em projetos de Machine Learning.


Pipeline de dados x Pipeline ETL


Os sistemas de extração, Transformação e Carga(ETL-Extract,Transform, Load) são um tipo de pipeline de dados, pois eles movem dados de uma origem , transformam os dados e , em seguida, carregam os dados em um destino. Geralmente, ETL é apenas um subprocesso de um pipeline de dados.


O termo ETL foi criado em uma época onde normalmente o único destino era um Data Warehouse e o processo era bem menos complexo. Atualmente, ETL faz parte de um processo maior de pipeline de dados.


Características dos Pipelines de Dados Modernos


Pipelines de dados robustos podem equipar uma empresa adequadamente para obter, coletar, gerenciar, analisar e usar dados com eficiência e então usar os dados para gerar novas oportunidades de mercado e fornecer processos de negócios mais eficientes e econômicos.


Os pipelines de dados modernos tornam mais rápida e eficiente a extração de informações dos dados coletados. 


As principais características ao considerar um pipeline de dados incluem:


  • Processamento de dados contínuo e extensível;

  • A elasticidade e agilidade da nuvem;

  • Recursos isolados e independentes para processamento de dados;

  • Acesso democratizado a dados e gerenciamento de autoatendimento;

  • Alta disponibilidade e recuperação de desastres.


Faça o Quiz e teste seus conhecimentos


1 - Um _____________ de dados é um meio de mover dados de um local (a origem) para um destino (um Data Warehouse ou Data Lake por exemplo). 


a) pipeline 

b) modelo

c) canal

d) tubo


2- Ao longo do caminho em um pipeline de dados, os dados são transformados e otimizados, chegando a um estado em que podem ser analisados e usados para desenvolver insights de negócios.

  

a) Verdadeiro

b) Falso


3 - Um pipeline de dados é essencialmente o conjunto das etapas envolvidas na agregação, organização e movimentação de dados. 


a) Verdadeiro

b) Falso


4 - Os pipelines de dados ____________ automatizam muitas das etapas manuais envolvidas na transformação e otimização do carregamento de dados.

 

a) manuais

b) antigos 

c) modernos

d) futuros


5 - Pipeline de dados é um conceito e pode ser implementado de muitas formas diferentes, desde ferramentas de automação em ambiente local, ferramentas em nuvem ou mesmo via programação em linguagens como:

a) Linguagem Python

b) Linguagem R

c) Linguagem Scala

d) Linguagem Java

e) Linguagem C++

f) Todas as alternativas acima estão corretas


6- Um pipeline de dados é uma série de etapas de _________ de dados. 

 

a) análise

b) processamento

Comentários

Postagens mais visitadas deste blog

Exercícios resolvidos em Linguagem Python - para iniciantes

Esta lista de exercícios resolvidos é um manual para ajudar todo aluno iniciante e não só, a adquirir e aprimorar as habilidades necessárias para se trabalhar com Python, de forma rápida e consistente. Estude e desfrute do conteúdo. 1º Exercício      Faça um programa que informe a versão do Python que você está utilizando Solução import sys print ( "Versão do Python" ) print (sys.version) print ( "Informação da versão instalada" ) print (sys.version_info) Atenção :     -  O módulo sys fornece funções e variáveis usadas para manipular diferentes partes do ambiente de tempo de execução do Python;     - Pra quem ainda não está familiarizado com a linguagem, um módulo  é um arquivo contendo definições e comandos em Python para serem usados em outros programas. 2º Exercício      Faça um programa em linguagem Python que converta metros para centímetros. Solução print ( ' \t ----Conversão de medida---- ' ) metros = int ( input ( 'Informe o valor em metros: 

Como abrir uma página da web utilizando Python?

Simples, você pode abrir páginas da Web de forma rápida, segura e fácil. Veja só, durante os estudos das bibliotecas padrão do Python descobri que para abrir um navegador web a partir de um script, devo importar o módulo webbrowser. Em seguida, usar webbrowser.open () que vai receber o link que quero abrir como argumento e executar o serviço, ou seja, basta inserir um endereço do youtube nele, na verdade pode ser qualquer link que você desejar. Exemplo webbrowser.open( "https://www.huicode.com.br/p/exercicios-resolvidos-de-linguagem-c.html" ) Para funcionar temos que importar o módulo webbrowser, que vai ser a maneira de dizer ao python que queremos usar webbrowser e todas as suas funcionalidades no programa. import webbrowser webbrowser.open( "https://www.huicode.com.br/p/exercicios-resolvidos-de-linguagem-c.html" ) Funcionooou, uhuhu. Nem parece, mas o módulo webbrowser é um módulo muito empregado em projetos de sites de filmes. Tem muitas utilidades, acredite.

CÁLCULO DA ÁREA DE UM TRIÂNGULO - LINGUAGEM C

Escreva um programa para calcular a área de um triângulo, sendo dados a sua base e a  sua altura. A = (B*H)/2 Solução #include <stdio.h> int main() {   // Variáveis  float area,base,altura;  // Entrada de Dados  printf( "\n Informe a base do triângulo: " );  scanf( "%f" ,&base);  printf( "\n Informe a altura do triângulo: " );  scanf( "%f" ,&altura);   // Processamento dos dados  area=(base*altura)/2;  // Exibição do resultado  printf( "\n Area do triângulo=%.1f\n" ,area);   return 0; }