[MÚSICA] Qual a melhor forma de visualizar os seus dados? Olhando para as duas imagens da tela, o que é melhor termos de compreensão dos dados? Olhar para a tabela cheia de informações ou olhar para dos gráficos apresentados? Ao final desse vÃdeo, você estará pronto para compreender e analisar dados gráficos. Por mais que os gráficos possam te assustar, eles são formas muito visuais e resumidas de apresentar informações. Olhando para gráfico é fácil compreender diferenças, identificar proporções e relações. Então, os gráficos são como mapas e auxiliam nas análises exploratórias para identificar o caminho a ser seguido. Vamos aprender os principais tipos de gráficos que são utilizados para compreensão e representação dos dados. O primeiro gráfico é o gráfico de barras. Nele, os dados são representados, como diz o nome, por barras que podem ser verticais, como no gráfico, ou podem ser horizontais como no gráfico da direita. Esses gráficos são utilizados para representar a frequência de diferentes variáveis. Quando as variáveis são categóricas, como as apresentadas na tela, permite uma fácil identificação das relações entre as categorias. Vamos analisar o gráfico da esquerda que representa a variável quantidade de filhos. Você pode perceber que o gráfico apresenta tÃtulo que identifica o assunto. Isso é a variável de análise. Tem também os eixos, nesse caso, o eixo 'x', que é o horizontal, representa as categorias: não tem filhos, tem filho, dois filhos, três filhos. E o eixo 'y', vertical, representa as quantidades. Perceba que a regra geral do gráfico é que haja proporcionalidade entre as métricas utilizadas. Então, o eixo apresenta uma escala de cinco cinco pontos. Com essas informações, você já pode analisar os dados apresentados. Vamos lá! A barra mais alta representa a maior frequência, o que mais acontece na amostra analisada. Então, podemos perceber que dos 100 respondentes, 33 não tem filhos. Ok. Mas olha como é importante compreender as informações. Nós podemos dizer que a maioria dos respondentes não tem filhos? Pense pouquinho! Não. Porque de todas as outras respostas todos têm filhos. Continuando, podemos ver que dos indivÃduos que têm filhos, a maioria tem três filhos que corresponde a 28 pessoas. 24 pessoas têm dois filhos e 15 pessoas têm filho. No gráfico da direita, você pode ver que é gráfico que apresenta informações sobre o sexo dos respondentes. Veja, então, que na amostra analisada tem muito mais mulheres do que homens. O próximo gráfico que você pode utilizar pesquisas, e ver muito nas apresentações de informações, é o gráfico de linhas. Sua maior utilização, justamente, pela linha indicar uma idéia de continuidade, é na apresentação de dados ao longo do tempo. Por meio das linhas, ele contribui para a identificação de tendências que são representadas pelo crescimento ou pelo queda das linhas. Se você observar os gráficos na tela, verá que ambos tratam da satisfação ao longo dos anos. O dado apresentado deve ser aquele que irá te trazer a informação necessária. Você pode ver, também, que o eixo 'x', ou eixo horizontal, indica o tempo que, nesse gráfico, está anos. E o eixo 'y', vertical, apresenta a quantidade de pessoas satisfeitas também com uma escala de cinco cinco unidades. Olhando para o gráfico da esquerda, você verá que 2018 haviam 33 pessoas satisfeitas. De 2018 para 2019 houve uma queda, ficando com somente 15 pessoas satisfeitas. E 2020, houve aumento para 24 pessoas; e 2021, também, aumento para 28 pessoas. No gráfico da direita, você pode notar que tem uma variável a mais. O cruzamento de dados será explorado com maior profundidade na próxima aula, mas, aqui, ele foi utilizado para você ver que o gráfico de linhas pode comparar a evolução dos dados ao longo do tempo com diferentes categorias. No gráfico da tela, veja a diferença de satisfação para homens e mulheres. Podemos analisar que tem muito mais mulheres satisfeitas do que homens e que o comportamento de queda 2019, e crescimento a partir de 2020, é a mesma para os dois grupos. Esse tipo de gráfico pode ser usado para acompanhar a evolução de diferentes setores, empresas, produtos, tipos de mercados, segmentos de clientes e qualquer outra categoria que fizer sentido na sua pesquisa. O gráfico de setores, bastante conhecido como gráfico de pizza pelo seu formato, é usado para representar a proporção entre a distribuição da variável analisada. Nos gráficos apresentados estão as variáveis que analisamos anteriormente no gráfico de barras. Uma caracterÃstica nova é que no gráfico de setores, a cor é relevante, pois identifica a categoria por meio de uma legenda. De outra forma, esse gráfico apresenta uma proporção representada por meio da distribuição nos ângulos do cÃrculo. Nesse caso, o cÃrculo representa 100% da amostra, o todo, e cada parte vai representar percentual desse todo. Existem outros tipos de gráficos como o gráfico de pontos, que se assemelha ao gráfico de barras e linhas, mas é identificado por meio de pontos; o gráfico de dispersão que relaciona as duas variáveis; entre outros. Aqui, você visualizou os mais utilizados para análise exploratória de dados, mas como produzir bons gráficos? Essa é uma questão muito importante de se fazer para que o objetivo da utilização dos gráficos seja cumprido. Quantas vezes você já visualizou algum gráfico com informação faltando? Ou sem legenda, ou com muita informação, ou qualquer outra caracterÃstica que fez com o gráfico ficasse mais difÃcil de interpretar. Se o objetivo é visualizar e apresentar as informações de maneira mais visual, mais intuitiva, vamos analisar alguns pontos de atenção para a sua construção. O gráfico precisa mostrar os dados, são eles os protagonistas da imagem que será apresentada, então, dê foco a eles. Só assim você conseguirá induzir o leitor a pensar nos dados apresentados. Também, você deve evitar distorcer os dados. A forma com que o gráfico é apresentado pode gerar diferentes interpretações, ou enfatizar alguma caracterÃstica especÃfica. Veja o conjunto de gráficos na tela! Analisando os dois gráficos superiores, você verá que, além de não apresentar tÃtulo, apresentam os mesmos dados, mas com uma escala do eixo 'y' bem diferente. É sempre importante verificar qual a escala ideal. Normalmente, os gráficos já apresentam uma escala automática quando são construÃdos, mas é possÃvel alterá-la. No gráfico da direita, a escala foi alterada para 600 pontos. Perceba como isso minimiza os dados apresentados e distorce a informação. No caso dos gráficos apresentados abaixo, algumas caracterÃsticas também podem ser identificadas. Primeiro, é que são muito coloridas, o que pode prejudicar a visualização. Mas o mais importante é que apresentam dados que devem ser comparados entre eles com escalas diferentes. Se você não olhar para os números, somente para as barras, que é o principal objetivo do gráfico, você vai achar que o comportamento dos homens e das mulheres é muito parecido. Mas quando você olha para o eixo 'y', verá que tem uma escala bem diferente e terá uma decepção. Então, sempre que for apresentar dados relacionados utilize a mesma escala. Por fim, os gráficos devem encorajar o leitor a comparar diferentes partes dos dados fazendo com que grandes bases de dados sejam compreensÃveis. Então, quando gráfico não dá conta de trazer a informação necessária, gráficos adicionais, ou que explorem partes especÃficas do conteúdo, podem ser relevantes. [MÚSICA]