Pular para o conteúdo principal

Remover certos caracteres da string em Python

A linguagem Python é uma das principais linguagens para realizar os processos de ETL(Extração, Transformação e carga). Em muitos casos, temos um dataset(arquivo) e precisamos fazer uma transformação nos dados, removendo certos caracteres.

Para realizar esta tarefa, usamos a função re.sub()  da biblioteca re . 

A função  re.sub()  serve para buscar um padrão no texto e substituí-lo por outro. Com isso, ela retorna uma nova string, a que tomou o lugar da anterior. Em caso de não encontrar o padrão, retorna a string normal.

O exemplo de código a seguir demonstra como podemos usar o método re.sub() para substituir caracteres da string em Python. Neste exemplo, vou substituir por nada
import re

texto = "Hey! What's up?"
print('Texto original:  '+texto)

string_com_caracteres_removidos = re.sub("\!|\'|\?","",texto)
print('Texto com carateres removidos:  '+string_com_caracteres_removidos)

Executando as linhas de código, teremos como saída:
Eu poderia substituir a palavra "Hey" por um "Olá"
import re

texto = "Hey! What's up?"
print('Texto original:  '+texto)

string_com_palavra_modificada = re.sub("Hey","Olá",texto)
print('Texto com palavra modificada:  '+string_com_palavra_modificada)
Executando as linhas de código, teremos como saída:
#LinguagemPython #BibliotecaPandas #datascience #introdução_LinguagemPython #PythonLanguage #ComoAprenderPython #ExercíciosdePython #pip_em_python #arquivo_CSV #DataFrame #DataFrame_em_python #iloc() #loc() #função re.sub()   #biblioteca re #Python #funções_em_python #Tratamento_de_dados.

Comentários