o corpus do português


Os corpora
Nova interface
Tamanho dos corpus
Comparar com outros corpora
Recursos
Pesquisadores (inglês)

Seja voluntário!

Problemas (inglês)
Contatar




Nota: esta página refere-se aos corpora de inglês do corpus.byu.edu, contudo o Corpus do Português usa a mesma interface nova, que foi lançada em 2016.


Em maio de 2016 lançamos uma nova versão do corpora BYU. A seguir encontram-se as alterações mais importantes da interface e arquitetura dos corpora. (Problemas?...)

1. Melhor apoio para dispositivos móveis

A interface anterior tinha muitos quadros. Funcionava bem com computadores (laptops e desktop), mas não tão bem, com telefones celulares ou tabletes. A nova interface do usuário foi concebida a partir do zero, para funcionar em telas de qualquer tamanho. As seguintes imagens são as da tela de um telefone portátil, da esquerda para a direita são: a interface de busca, a tela com os resultados de busca, a tela com PCEC (palavras-chave em contexto) e PCEC expandidas. Sem dúvida a interface funciona muito melhor em telas grandes, porém o mais importante a salientar, é que os corpora tem agora uma melhor visibilidade e funcionam muito bem em qualquer dispositivo. (Nota: a interface do usuário antigo continua disponível on-line, pelo menos por agora).


2. Interface mais limpa e simples de usar

O formulário de pesquisa da interface anterior era bem mais complexa (abaixo, à esquerda). A interface nova é muito mais limpa e simples de usar (abaixo, à direita). Todas as funcionalidades anteriores ainda se encontram presentes (a capacidade de limitar e comparar seções do corpus, decidir como classificar os dados, etc), contudo agora esses elementos do formulário só aparecem quando necessários.

Interface anterior

 

Novo: vista de lista simples

Novo: vista de colocados


3. Arquivos de ajuda mais úteis

Arquivos de ajuda contextuais aparecem sempre que clicar em um elemento do formulário (listas, colocados, comparar as palavras, seções, corpora virtual, etc). Em cada um desses arquivos existem pesquisas de amostra que podem ser modificadas livremente e personalizadas.


4. Sintaxe de busca mais intuitiva e simples

Alguns sistemas de buscas de sintaxes, são em nossa opinião desnecessariamente complexos, como por exemplo a sintaxe CQP à esquerda. A consulta de sintaxe anterior da BYU era muito mais simples, mas ainda havia muitos parênteses, pontos finais, asteriscos, etc., sem duvida bastante complicado, quando se esta usando o teclado de um celular. Assim sendo simplificamos as buscas de sintaxe, como mostrado à direita. Os usuários podem ainda usar qualquer combinação do antigo e do novo sintaxe. (Para mais informações, incluindo os códigos novos para classes de palavras, clique em LIST [LISTA] no formulário de pesquisa de um corpus e em seguida Part of speech [Classe de palavras].

Tipo de pesquisa Sintaxe CQP Sintaxe da BYU anterior Sintaxe nova Exemplos
Palavra [word = "nooks"] nooks nooks nooks and crannies
Lema (forma da palavra) [lemma = "decide"] [decide] DECIDE DECIDE that it
Parte do discurso [tag = "NN."] [nn*] NOUN fast NOUN
Sinónimos Not possible [=soft] =soft soft, smooth, quiet
Lista de Palavras Personalizada Not possible [emailAddress@clothes] @clothes dress, shoe, sock
Combinação dos anteriores [lemma = "end" & pos = "VV."] [end].[v*] END_v end, ends, ended, ending
Combinação dos anteriores [lemma = "eat"] [tag = "NN."] [eat] * [nn*] EAT * NOUN ate the bananas, eat some cake
Combinação dos anteriores Not possible [[emailAddress@clothes]] @CLOTHES dress, dresses, shoe, shoes
Combinação dos anteriores Not possible [[=clean]].[v*] =CLEAN_v cleans, scoured, washing
Combinação dos anteriores Not possible [wear] * [=nice] [email@clothes] WEAR * =nice @CLOTHES wore some good-looking pants


5. Corpora virtuais

No início de 2015, adicionamos a capacidade de criar um "corpus virtual" ao corpus Wikipedia. Em apenas alguns segundos, os usuários podem criar um corpus virtual de textos relacionados com biologia, budismo, investimentos, basquetebol - ou milhares de outros tópicos. Estes corpus podem ser modificados adicionando, eliminando ou mudando os textos para lugares diferentes. Os usuários podem limitar suas pesquisas a um corpus virtual específico (por exemplo colocados da palavra estresse em psicologia ou engenharia), e comparar a frequência de uma palavra ou frase em seus corpora virtual. E o melhor de tudo, os usuários podem criar listas de palavras-chave para qualquer um dos corpora virtual, em apenas alguns segundos.

Está agora também disponível a função do "corpus virtual" a todos os corpora da BYU, que lhe permite rapidamente e facilmente criar e usar corpus virtuais a partir de qualquer um dos textos nestas corpora. Por exemplo, pode criar um corpus virtual de textos de revistas Cosmopolita ou Astronomia (Coca), artigos de imprensa relacionados a New Deal 1932-1938 (COHA), páginas web a partir de um determinado site de cricket no Reino Unido (GloWbE) , discursos de Winston Churchill, de 1939 a 1945 que mencionam Alemanha (Hansard), ou artigos de jornais de setembro de 2015 sobre a crise de refugiados na Europa (AGORA). Clique em TEXTOS/VIRTUAIS em qualquer um dos corpus para muito mais detalhes e exemplos destes corpora virtual


Esperamos que estes novos recursos e corpora sejam um benefício para o seu ensino, aprendizagem e pesquisa.