1 Introdução

1.1 Apresentação

Esse material está em fase inicial de desenvolvimento e será utilizado para apoiar as aulas de MAE0111 - Análise Exploratória de Dados.

O objetivo principal da apostila é funcionar como um resumo e auxiliar os estudantes na compreensão dos conceitos teóricos, com capítulos curtos e por meio de exercícios ao final de cada capítulo.

Comentários e correções podem ser enviadas para gabi.scarpini@usp.br.


1.2 Programa

  1. A profissão de Estatística. A Estatística como metodologia de todas as ciências experimentais. O mercado de trabalho. O perfil profissional do Estatístico. A Estatística acadêmica: pós-graduação e pesquisa.
  2. Apresentação de problemas reais analisados no CEA – Centro de Estatística Aplicada da USP, com ênfase na análise descritiva dos dados. Conclusões dos estudos.
  3. Estatística descritiva e inferência estatística, tipos de dados, bancos de dados, ordem de grandeza, precisão e arredondamento de dados quantitativos, proporções e porcentagens, taxas e números índices, sugestões para construção e apresentação de gráficos e tabelas.
  4. Representação gráfica e tabular da distribuição de dados: tabelas de frequências, gráficos de barras e do tipo “torta”, histogramas, densidade suavizada e função de distribuição empírica.
  5. Medidas-resumo: medidas de posição, de dispersão, de assimetria e curtose, gráficos do tipo boxplot.
  6. Modelos para distribuições de frequências: gráficos de probabilidade.
  7. Associação entre variáveis qualitativas: tabelas de contingência de dupla entrada, coeficientes de associação, sensibilidade e especificidade, risco relativo, razão de chances, tabelas de contingência de múltiplas entradas.
  8. Associação entre variáveis quantitativas: gráficos de dispersão, covariância, correlação linear, matriz de covariâncias, matriz de correlações.
  9. Associação entre uma variável quantitativa e uma variável qualitativa: homogeneidade de distribuições, gráficos de médias, gráficos de perfis.
  10. Outros tópicos: elaboração de relatórios técnicos, uso do aplicativo R, dashboards.

1.3 Bibliografia

  • Damiani, A., Milz, B., Lente, C., Falbel, D., Correa, F., Trecenti, J., Luduvice, N., Lacerda, T., Amorim, W. Ciência de Dados em R, Curso-R link

  • Peng, R.D. Exploratory Data Analysis with R, Leanpub. link

  • Mayer, F.P, Bonat, W.H., Zeviani, W.M., Krainski, E.T., Ribeiro Jr, P.J. Estatística Computacional com R. link

  • Grolemund, G. Wickham, H. R for Data Science. link (versão em português: link)

  • Chang, W. R Graphics Cookbook, 2nd edition. link

  • Grolemund, G. Hands-On Programming with R. link


1.4 Bibliografia Jupiterweb

  • Morettin, P. A., Bussab, W. O. (2017). Estatística Básica. 9a edição. Saraiva Educação SA.

  • Wickham, H., Grolemund, G. (2017). R for data science: import, tidy, transform, visualize, and model data, O’Reilly Media, Inc. link

  • Tukey,J. W. (1977). Exploratory Data Analysis. Reading: Addison Wesley.

  • Cairo, A. (2016). The truthful art: Data, charts, and maps for communication. New Riders.

  • Tufte, E. R. (1983). The Visual Display of Quantitative Information, Cheshire: Graphics Press.

  • Few, S. (2012). Show Me the Numbers: Designing Tables and Graphs to Enlighten, 2a ed. Analytics Press.


1.5 Bibliografia Complementar

  • Relatórios do CEA – Centro de Estatística Aplicada – USP.

  • Magalhães, M. N, de Lima, A. C. P. (2015). Noções de Probabilidade e Estatística. 7a edição. Editora da Universidade de São Paulo.

  • Murteira, B. F. J., Black, G. H. J.. (1983). Análise Exploratória de Dados - Estatística Descritiva, Lisboa: McGraw Hill.

  • Wexler, S., Shaffer, J., & Cotgreave, A. (2017). The big book of dashboards: visualizing your data using real-world business scenarios. John Wiley & Sons.

  • ChambersJ. M., ClevelandW. S., Tukey, P. A.. (1983). Graphical Methods for Data Analysis. Boston: Duxbury Press.

  • W. M. Cleveland. (1993). Visualizing Data, Summit, New Jersey: Hobart Press.

  • W. M. Cleveland. (1994). The Elements of Graphing Data, Summit: Hobart Press.