o corpus do português


Os corpora
Nova interface
Tamanho dos corpus
Comparar com outros corpora
Recursos
Pesquisadores (inglês)

Seja voluntário!

Problemas (inglês)
Contatar




Existem vários recursos que são baseados na versão antiga do Corpus do Português (que foi lançado em 2006), tais como:

O Corpus do Português antigo era bastante pequeno (apenas 20 milhões de palavras para a época de 1900 [século XX] ). Como resultado, criámos diferentes recursos para o Inglês, que não poderiam ser criados para Português até que um corpus muito maior estivesse disponível. Com o nnovo corpus de um bilhão de palavras, podemos agora, criar muitos desses recursos. Estes incluem:

  • Dados de texto completos, o que significa que o usuário teria dois bilhões de palavras ao seu dispor.

  • Dados atualizados, semelhantes à frequência de palavras, colocados, e n-gramas de dados (incluindo os principais 40.000 lemas de Português)

  • WordAndPhrase para o Português, o que lhe permitirá navegar os 40.000 lemas mais comuns para ver frequência, definição, colocados, concordâncias, e sinónimos - tudo em uma página. Além disso vai ser capaz de introduzir os seus próprios textos e analisá-los com os dados do corpus (disponível no verão de 2017).