v2.5.2
Giriş yap

PYTHON: wikipedia sayfalarındaki "[a]" gibi ifadeleri kaldırma

egemennk1
548 defa görüntülendi

Projemde Beautiful Soup modülü ile wikipedia sayfalarında ki açıklamaları çekiyorum. Fakat bazı yazıların arasında "[a]" gibi ibareler olabiliyor. Bunları pythonda nasıl kaldırabilirim?
Not: Regex ile yapılabileceği düşünüyorum fakat çok fazla regex bilmiyorum.

abdullahx
983 gün önce
import requests, re
from bs4 import BeautifulSoup as bs

req = requests.get("https://tr.wikipedia.org/wiki/D%C3%BCnya_Kad%C4%B1nlar_G%C3%BCn%C3%BC")

soup = bs(req.content, "lxml")

c = soup.select("#bodyContent")[0].text
content = re.sub("\[.*\]", "", c)

print(content)