Com Python, podemos adicionar uma nova coluna a um DataFrame existente.
Pré-requisito
- Antes de prosseguir, certifique-se de que você tem instalado a biblioteca Pandas. Para instalar , digite esse comando no terminal da sua IDE: pip install pandas
Eu vou importar uma base de dados de venda que está em uma pasta no meu computador
# importando a biblioteca de pandas
import pandas as pd
# pegar o arquivo xlsx(excel) que está no caminho a seguir
meu_arquivo = pd.read_excel("C:\\Users\\PHILCO15A\\Music\\python\\vendas.xlsx")
# Mostrando os dados
print(meu_arquivo)
Executando as linhas de código, teremos o seguinte:
Exemplo
Criar a coluna custo_total que vai ser o somatório da coluna ValorCusto e CustoEntrega
# importando a biblioteca de pandas
import pandas as pd
# pegar o arquivo xlsx(excel) que está no caminho a seguir
meu_arquivo = pd.read_excel("C:\\Users\\PHILCO15A\\Music\\python\\vendas.xlsx")
print(meu_arquivo)
# Somar as colunas ValorCusto e CustoEntrega pegando desde a primeira linha até a 100
print('************************************** Arquivo com a coluna nova ******************************')
meu_arquivo['custo_total'] = meu_arquivo.loc[0 : 100,['CustoEntrega' , 'ValorCusto']].sum(axis = 1)
print(meu_arquivo)
- A função loc() selecionou todas as 100 primeiras linhas e trouxe as colunas 'CustoEntrega' e 'ValorCusto' para realizar a soma. Se no meu arquivo tivesse 1.000 linhas e quisesse trazer todas as linhas, a função loc() ficaria assim: meu_arquivo.loc[0 : , ['CustoEntrega' , 'ValorCusto']].sum(axis = 1)
Comentários
Postar um comentário