o corpus do português


Os corpora
Nova interface
Tamanho dos corpus
Comparar com outros corpora
Recursos
Pesquisadores (inglês)

Seja voluntário!

Problemas (inglês)
Contatar




English Português

Criado pelo Professor Mark Davies, BYU. Financiado pelo National Endowment for the Humanities (2004, 2015). Faz parte da coleção corpora da BYU.

  Corpus Tamanho Criado Mais informação
1 Género / Histórico 45 milhões de palavras 2004-06 Info
2 Web / Dialetos 1 bilhão de palavas 2015-16 Info

A nova adição ao Corpus do Português (2016) contém uma base de dados com cerca de um bilhão de palavras de páginas da web de quatro países de língua portuguesa (Brasil, Portugal, Angola, Moçambique). Este corpus permite que analise o Português mais recente (os textos foram recolhidos entre 2013-14), e comparar entre os diferentes dialetos.

O novo corpus também é muito maior do que o corpus anterior - mais de 50 vezes maior para o português moderno (um bilhão de palavras, em comparação a apenas 20 milhões de palavras a partir de 1900 no corpus original). Enquanto no corpus anterior teria 20-25 ocorrências, com o novo tem 1.000 ou mais.