Leitura de dados csv no R

Uma tarefa bastante corriqueira para quem usa o R é fazer com que o programa trabalhe com dados no formato csv para podermos fazer nossas tarefas, como fazer uma estatística descritiva ou alguns testes de hipótese, por exemplo.

O R tem algumas funções que fazem o programa ler esses arquivos sem muita dificuldade, porém esse é um dos tópicos que geram mais dúvidas entre os alunos logo que aprendem como fazer tal tarefa por conta de alguns detalhes, às vezes tão pequenos quanto um ponto. Para começar a esclarecer alguns detalhes, vamos lembrar como é um arquivo csv.

O que é um arquivo csv?

CSV é uma abreviação que significa Comma-separated values (valores separados por vírgula). É um arquivo de apenas uma planilha que contém dados separados por um sinal de pontuação, como vírgula, ponto e vírgula ou ponto. Os programas Excel e Calc, por exemplo, leem esse tipo de arquivo. Porém o bloco de notas mostra, sem a formatação dos outros programas, os dados deste tipo de arquivo.

CalcBloco de notas

Nas imagens acima podemos ver o mesmo arquivo aberto nos dois programas: Calc e Bloco de Notas. No segundo fica explícito a forma como as colunas estão sendo separadas (neste caso, com vírgulas). Para abrir o arquivo com o Bloco de Notas, pressione o botão direito do mouse sobre o arquivo, selecione “Abrir com” e escolha o programa.

Pasta de trabalho do R

Precisamos saber em que pasta do computador está o diretório de trabalho do R,  não só para fazer leitura de dados, mas também para várias outras funcionalidades do programa. É muito simples fazer isso, basta usar a função getwd() deste jeito, sem nada dentro dos parênteses. O R vai retornar em que pasta do seu computador ele está “trabalhando”.

Para facilitar a leitura de dados, uma opção é colocar o arquivo csv na pasta do diretório de trabalho do R, pois assim basta apenas colocar o nome do arquivo  nas funções de leitura de dados. A outra opção é não usar a função getwd() e usar todo o caminho do local do arquivo dentro das funções.

Ler o arquivo csv no R

Agora que já sabemos basicamente como funciona esse tipo de arquivo e o diretório de trabalho do R, podemos fazer a leitura com o R sem muitos problemas. Para isso podemos usar duas funções: read.csv() ou read.csv2(). Como o próprio nome das funções já mostra, estes comandos fazem com que o R leia esse tipo de arquivo. Vamos então entender como utilizar essas funções.

A primeira coisa que devemos saber é o nome do nosso arquivo csv a ser lido. Este deve ser especificado como um argumento dessas funções entre aspas. Caso o arquivo esteja na mesma pasta do diretório de trabalho do R, basta colocar apenas o nome do arquivo entre aspas. Porém se o arquivo estiver em outra pasta, devemos colocar o local completo do arquivo.

Existe uma pequena diferença entre esses dois comandos citados acima. Dois argumentos dessas funções têm default (valor padrão) diferentes em cada uma. São eles: sep (separador de colunas) e dec (separador de casas decimais). Em read.csv(), o default é sep=”,”dec=”.”. Já em read.csv2() temos sep=”;”  dec=”,”.

Local do arquivo no Windows

Existe um pequeno detalhe para os usuários de Windows no momento de utilizar o local do arquivo na leitura de dados. Para um arquivo que está na área de trabalho, o local é: C:\Users\Nome\Desktop, porém se colocarmos o local como está, com contra-barra (\), o R retornará um erro. Existem duas maneiras de solucionarmos este problema: Trocar todas as contra-barras (\) por barras (/), o que resultaria em: C:/Users/Nome/Desktop ou adicionar mais uma contra-barra no local, o que resultaria em: C:\\Users\\Nome\\Desktop.

Exemplo: Se temos um arquivo chamado Renda.csv que tem ponto como separador de casas decimais e vírgula como separador de colunas, então a leitura no R seria feita da seguinte forma:

Caso o arquivo esteja na mesma pasta do R:

read.csv(“Renda.csv”)

ou

read.csv2(“Renda.csv” , sep=”,” , dec=”.”)

Caso o arquivo esteja em uma pasta diferente (neste caso, na área de trabalho):

read.csv(“C:/Users/Nome/Desktop/Renda.csv”)

ou

read.csv2(“C:/Users/Nome/Desktop/Renda.csv” , sep=”,” , dec=”.”)

ou

read.csv(“C:\\Users\\Nome\\Desktop\\Renda.csv”)

ou

read.csv2(“C:\\Users\\Nome\\Desktop\\Renda.csv” , sep=”,” , dec=”.”)

Leitura de arquivo direto da internet

Também podemos ler um arquivo direto da internet. Para isso devemos clicar com o botão direito sobre o arquivo e selecionar a opção “Copiar endereço do link”. No R, basta colar o link do arquivo no local onde você normalmente colocaria o diretório de um arquivo do seu computador, assim:

read.csv2(“http://www.exemplo.com/arquivos/exemplo.csv” , sep=”,” , dec=”.”)

Comments

comments

Esta entrada foi publicada em Uncategorized e marcada com a tag , . Adicione o link permanente aos seus favoritos.

11 respostas para Leitura de dados csv no R

  1. Pingback: WordCloud no R – SER | Estatística é com R!

  2. Alberto disse:

    Muito bem explicado parabéns 😉

  3. Pingback: Anônimo

  4. Samuel Ritter disse:

    Valeu irmão!! Salvou meus estudos!!!

  5. Roberta Pimenta disse:

    Excelente explicação. Bastante didático, muito útil. Grata!

  6. Vitor Salgado disse:

    Muito bom, Obrigado!

  7. Vicente de Paula Pereira disse:

    de acordo com a definição que vocês deram acima para csv e csv2, acredito que vocês se enganaram ao mostrarem exemplos. Favor verificar, pois fiquei em dúvida.

  8. raposa21 disse:

    Existe alguma forma de configurar o R para ler as barras assim \ ?
    Obrigado, ótimo post.

  9. Henrique Matheus Cardoso disse:

    Olá gostaria de saber qual comando utilizo para carregar uma tabela csv que encontra-se neste local no meu computador [1] “C:/Users/Henrique/Documents”.

Deixe uma resposta