- Aula 01 – Apresentação, programa e ementa
- Aula 02 – Introdução a Ciência de Dados
- Vídeo – Inside a Google Data Center
- Aula 03 – Discussão dos textos e documentário “O prazer da estatística”
- Aula 04 – Estatística da vida cotidiana
- Aula 05 – Identificando padrões de texto usando uma planilha
- Tutorial no Excel – extrair partes de um texto
- Vídeo aula – como extrair partes de um texto
- Aula 06 – Condicionais em Excel e determinação de uma quantidade de classes de uma distribuição
- Aula 07 – Tabela dinâmica e iniciando processos de extração de dados
- BDTD – Biblioteca Digital de Teses e Dissertações
- Tutorial de Tabela Dinâmica
- Vídeo aula de Tabela Dinâmica
- Exercício – relatório analítico das instituições e autores mais produtivos no tema “mineração de dados” na BDTD.
- Aula 08 – Localização de dados – PROCV
- Aula 09 – Exercícios (fazer os exercícios a partir da página 88)
- Aula 10 – Apresentação do OpenRefine
- Arquivo de trabalho – Base de artigos científicos
- Curso do Open Refine aberto na web
- Aula 11 – Limpeza de dados com OpenRefine
- Aula 12 – Projeto
- Aula 13 – GREL – General Expression Language – Open Refine
- Aula 14 – Reconciliação entidades com Wikidata
- Aula 15 – Introdução ao Python utilizando o Jupyter
- Aula 16 – Introdução ao Pandas
- Aula 17 – Exercício com Pandas
- Faça uma busca pelo tema “Ciência da Informação” na BDTD;
- Exporte os resultados em formato CSV;
- Carregue os dados no Pandas, atentando para usar como parâmetro de carga sep=”;”;
- Análise os resultados:
- calcule as estatísticas descritivas básicas dos campos números;
- calcule as estatísticas básicas agrupadas por universidade;
- faça uma tabela e gere um gráfico (no Excel) por:
- total de produção por ano;
- total de produção por tipo: mestrado e doutorado;
- total de produção por universidade.
- Aula 18 – Exercício com Pandas – gráficos no próprio Pandas
- Aula 19 – Pandas – trabalhando com dados em HTML
- Projeto final
- Planilha de notas