programador, cientista, pythonista e minimalista. Recife, Brasil

Bibliotecas Python para carregar Dataset's

Publicado em: . | Por: Gileno Filho | Arquivado em: tutoriais

Desde que a biblioteca Pandas se tornou bastante popular em análise de dados com Python, várias outras libs surgiram para auxiliar a importação de dados para objetos do tipo DataFrame (utilizados pelo Pandas).

Neste artigo irei comentar sobre duas libs:

  • db.py: Facilita a importação de bancos de dados para DataFrame's
  • PyDataset: Prover uma forma simples de acessar diversos datasets públicos - dataset's disponibilizados por bibliotecas da linguagem R

PyDataset

{% notebook notebooks/datasets-pydataset.ipynb %}

db.py

O db.py faz conexão com os bancos relacionais mais utilizados, mas de acordo com o banco de dados será necessário instalar alguma biblioteca adicional, mais detalhes em:

No exemplo abaixo irei utilizar o sqlite3, que é o único que não precisa de nenhuma instalação adicional porque a lib de comunicação já vem com a instalação Python. O arquivo do banco sqlite3 está aqui:

{% notebook notebooks/datasets-db-py.ipynb %}

A db.py tem mais algumas opções, basta acessar o link acima e verá que é bem fácil fazer consultas que retornem DataFrame's do Pandas para realizar algum tipo de análise em memória.

Qualquer dúvida ou sugestão basta comentar abaixo!

python dados

COMPARTILHAR:

Comentários

comments powered by Disqus

Sobre

Website e Blog de Gileno Filho, escrevo sobre: Desenvolvimento, Python, Django, Ciência de Dados, Engenharia de Avaliações, Inteligência Artificial e Design Minimalista.

Social