o corpus do português


Os corpora
Nova interface
Tamanho dos corpus
Comparar com outros corpora
Recursos
Pesquisadores (inglês)

Seja voluntário!

Problemas (inglês)
Contatar




English Português

Criado pelo Professor Mark Davies, BYU. Financiado pelo National Endowment for the Humanities (2004, 2015). Faz parte da coleção corpora da BYU.

  Corpus Tamanho Criado Mais informação
1 Género / Histórico 45 milhões de palavras 2004-06 Info
2 Web / Dialetos 1 bilhão de palavas 2015-16 Info

Este é o "original" Corpus do Português (2006), mas com uma nova interface de usuário (2016).

O corpus contém uma base de dados com 45 milhões de palavras dos anos 1200 de 1900, e pode ser usado para verificar a história do Português. Para o século XX, é dividido igualmente entre gêneros de estilo falado, ficção, jornais e textos acadêmicos.

A nova interface para o corpus foi lançada no verão de 2016. Permite criar "corpora virtuais" (por exemplo, um determinado conjunto de autores, fontes, ou tópicos). Também tem uma interface muito mais "limpa", melhores arquivos de ajuda, e funciona muito bem em dispositivos móveis.

Clique aqui para utilizar a antiga interface de 2008.