De fato o primeiro post do blog – Its Python baby!

Melhor maneira de começar a programar hoje em dia, na minha opinião, é com python, meu interesse é puramente por scripts, então ele é melhor ainda.
Decidi iniciar com algo do meu interesse e ando interessado em raspagem de dados, então:

Instalei o Python 3 (www.python.org)

Aprendi a instalar módulos:
Entrei no diretório onde esta o .exe do python pelo cmd, e dei o comando:

Python -m pip install requests   – Esse -m é de módulos, o pip deve ser um gerenciador de instalação, install você já sabe, e o requests é um módulo que trabalha com método get e set da web.

Depois instalei isso aqui ó:

Python -m pip install BeautifulSoup   – BeautifulSoup é um módulo que serve para gerenciar html e etc… (Eu e você precisamos pesquisar mais sobre), mas deu erro com essa sintaxe aí, perdi 10 minutos pesquisando, onde me deram a solução de executar o CMD como administrador mas não funcionou também, logo em seguida descobri a solução:

Python -m pip install BeautifulSoup4 – Isso aí, só coloquei o 4 ao lado e foi.

Estudei através deste dois sites :

https://imasters.com.br/desenvolvimento/raspando-dados-scrapping-de-sites-com-python-requests-e-lxml/?trace=1519021197&source=single

https://imasters.com.br/desenvolvimento/aprendendo-sobre-web-scraping-em-python-utilizando-beautifulsoup/?trace=1519021197&source=single

E por fim consegui fazer este lindo programinha inútil que dá o código fonte de um site aleatório:

import requests
from bs4 import BeautifulSoup
page = requests.get(“https://imasters.com.br/desenvolvimento/aprendendo-sobre-web-scraping-em-python-utilizando-beautifulsoup/?trace=1519021197&source=single&#8221😉
soup = BeautifulSoup(page.content,’html.parser’)
print(soup.prettify())

Preciso começar do 0 na linguagem, aprender a comentar o código, manipular arquivos e lembrar de sempre atualizar isto aqui, é gostoso escrever sem compromisso algum com o português e com qualquer estrutura de texto convencional.

Tchau! Até mais!

Deixe uma resposta

O seu endereço de e-mail não será publicado. Campos obrigatórios são marcados com *