Making the most of a 100-year-old dictionary
-
Upload
alberto-simoes -
Category
Education
-
view
263 -
download
5
description
Transcript of Making the most of a 100-year-old dictionary
![Page 1: Making the most of a 100-year-old dictionary](https://reader034.fdocuments.in/reader034/viewer/2022042700/554be480b4c9056b348b48dd/html5/thumbnails/1.jpg)
Making the most of a100-year-old dictionary
Alberto Simões, Álvaro Iriarte
![Page 2: Making the most of a 100-year-old dictionary](https://reader034.fdocuments.in/reader034/viewer/2022042700/554be480b4c9056b348b48dd/html5/thumbnails/2.jpg)
http://dicionario-aberto.net
Tarefa 1: Criar utilizador no Dicionário-Aberto.
1. Aceder ao sítio do dicionário;2. Usar ligação “entrar/registar”;3. Preencher formulário “registar”;4. Visitar caixa do correio, e esperar pelo e-mail de
registo;5. Confirmar registo no sítio do dicionário;6. Entrar no sítio do dicionário com o utilizador criado.
![Page 3: Making the most of a 100-year-old dictionary](https://reader034.fdocuments.in/reader034/viewer/2022042700/554be480b4c9056b348b48dd/html5/thumbnails/3.jpg)
Parte IHistória do Dicionário Aberto
![Page 4: Making the most of a 100-year-old dictionary](https://reader034.fdocuments.in/reader034/viewer/2022042700/554be480b4c9056b348b48dd/html5/thumbnails/4.jpg)
Não existência de um “dicionário livre de língua”, da língua Portuguesa para PLN:
Disponível para acesso local; Disponível em formato electrónico; Disponível em formato legível por computador;
Motivação
![Page 5: Making the most of a 100-year-old dictionary](https://reader034.fdocuments.in/reader034/viewer/2022042700/554be480b4c9056b348b48dd/html5/thumbnails/5.jpg)
Inexistência de mão de obra para a criação de um dicionário de raiz;
Inexistência de editoras interessadas em disponibilizar versões livres dos seus dicionários;
Existência de dicionários com mais de 90 anos, no domínio público… em formato papel!
Problemas
![Page 6: Making the most of a 100-year-old dictionary](https://reader034.fdocuments.in/reader034/viewer/2022042700/554be480b4c9056b348b48dd/html5/thumbnails/6.jpg)
Desafiar equipa portuguesa dos Distributed Proofreaders do Projecto Gutenberg para transcrever um destes dicionários;
Dicionário escolhido: Novo Diccionário da Língua Portuguesa de Cândido de Figueiredo (1913)
Razão: digitalizado (imagens) pela Biblioteca Nacional.
Desafio
![Page 7: Making the most of a 100-year-old dictionary](https://reader034.fdocuments.in/reader034/viewer/2022042700/554be480b4c9056b348b48dd/html5/thumbnails/7.jpg)
Processo demorado, por etapas, por voluntários; Obrigado, Manuela!
Revisto por mais voluntários; Obrigado, Rita!
Processo com mais de quatro anos!
Transcrição
![Page 8: Making the most of a 100-year-old dictionary](https://reader034.fdocuments.in/reader034/viewer/2022042700/554be480b4c9056b348b48dd/html5/thumbnails/8.jpg)
Transcrição num dialecto tipo Wiki;
Adição diária de 100/200 palavras, desde início de 2007; Sítio on-line a partir de Junho de 2007! Palavras adicionadas disponíveis no dia
seguinte!
Incorporação terminada a 2 de Março de 2010!
Incorporação
![Page 9: Making the most of a 100-year-old dictionary](https://reader034.fdocuments.in/reader034/viewer/2022042700/554be480b4c9056b348b48dd/html5/thumbnails/9.jpg)
Estatísticas
![Page 10: Making the most of a 100-year-old dictionary](https://reader034.fdocuments.in/reader034/viewer/2022042700/554be480b4c9056b348b48dd/html5/thumbnails/10.jpg)
Estatísticas
![Page 11: Making the most of a 100-year-old dictionary](https://reader034.fdocuments.in/reader034/viewer/2022042700/554be480b4c9056b348b48dd/html5/thumbnails/11.jpg)
Formato usado simples para ser aprendido e usado pelos voluntários;
Formato demasiado vago e ambíguo;
Transformação num formato XML rico; Subconjunto do TEI para dicionários; De forma completamente automática!!
Estruturação
![Page 12: Making the most of a 100-year-old dictionary](https://reader034.fdocuments.in/reader034/viewer/2022042700/554be480b4c9056b348b48dd/html5/thumbnails/12.jpg)
Dicionário com grafia de 1913!
Modernização da grafia de forma semi-automática:1. Construção de regras de conversão;2. Validação manual! 3. Voluntários responsáveis, precisam-se.!
Modernização
![Page 13: Making the most of a 100-year-old dictionary](https://reader034.fdocuments.in/reader034/viewer/2022042700/554be480b4c9056b348b48dd/html5/thumbnails/13.jpg)
Modernização
![Page 14: Making the most of a 100-year-old dictionary](https://reader034.fdocuments.in/reader034/viewer/2022042700/554be480b4c9056b348b48dd/html5/thumbnails/14.jpg)
Disponível em PDF e Base de Dados SQL; Disponível como motor de pesquisa para
Firefox; Disponível em ePub; Disponível em StarDict; Disponível em API RESTless:
Aplicação para iOS disponível; Aplicação para Android e Win8 em
desenvolvimento.
Outras Funcionalidades
![Page 15: Making the most of a 100-year-old dictionary](https://reader034.fdocuments.in/reader034/viewer/2022042700/554be480b4c9056b348b48dd/html5/thumbnails/15.jpg)
Parte IIInterface Geral
![Page 22: Making the most of a 100-year-old dictionary](https://reader034.fdocuments.in/reader034/viewer/2022042700/554be480b4c9056b348b48dd/html5/thumbnails/22.jpg)
Parte IIIPesquisa Avançada
![Page 23: Making the most of a 100-year-old dictionary](https://reader034.fdocuments.in/reader034/viewer/2022042700/554be480b4c9056b348b48dd/html5/thumbnails/23.jpg)
Pesquisa por afixos;
Ocorrências nas definições;
Relações léxico-conceptuais entre termos
introduzidos;
Resultados ordenados por relevância.
Pesquisa Avançada
![Page 24: Making the most of a 100-year-old dictionary](https://reader034.fdocuments.in/reader034/viewer/2022042700/554be480b4c9056b348b48dd/html5/thumbnails/24.jpg)
Pesquisa por “prefixo”
![Page 25: Making the most of a 100-year-old dictionary](https://reader034.fdocuments.in/reader034/viewer/2022042700/554be480b4c9056b348b48dd/html5/thumbnails/25.jpg)
Pesquisa por “sufixo”
![Page 26: Making the most of a 100-year-old dictionary](https://reader034.fdocuments.in/reader034/viewer/2022042700/554be480b4c9056b348b48dd/html5/thumbnails/26.jpg)
Pesquisa de “infixos”
![Page 27: Making the most of a 100-year-old dictionary](https://reader034.fdocuments.in/reader034/viewer/2022042700/554be480b4c9056b348b48dd/html5/thumbnails/27.jpg)
base de dados conceptuais / dicionário onomasiológico / dicionário de produção ou codificador
(mais do que um thesaurus, que ordena palavras por sinónimos, hiperónimos ou outras relações léxico-conceptuais)
Pesquisa Reversa
![Page 28: Making the most of a 100-year-old dictionary](https://reader034.fdocuments.in/reader034/viewer/2022042700/554be480b4c9056b348b48dd/html5/thumbnails/28.jpg)
dicionário codificador:
endurecer + metal ⇒ temperar
Pesquisa Reversa
![Page 29: Making the most of a 100-year-old dictionary](https://reader034.fdocuments.in/reader034/viewer/2022042700/554be480b4c9056b348b48dd/html5/thumbnails/29.jpg)
Criação de uma ontologia de forma automática usando padrões (Hearst 1992)
Pesquisa Ontológica
![Page 30: Making the most of a 100-year-old dictionary](https://reader034.fdocuments.in/reader034/viewer/2022042700/554be480b4c9056b348b48dd/html5/thumbnails/30.jpg)
Pesquisa Ontológica
Completação da Ontologia por regras matemáticas
Permite que se use informação incompleta: Verbete A indica sinonímia com B. Verbete B não faz qualquer referência a A…
![Page 32: Making the most of a 100-year-old dictionary](https://reader034.fdocuments.in/reader034/viewer/2022042700/554be480b4c9056b348b48dd/html5/thumbnails/32.jpg)
Pesquisa Ontológica
![Page 33: Making the most of a 100-year-old dictionary](https://reader034.fdocuments.in/reader034/viewer/2022042700/554be480b4c9056b348b48dd/html5/thumbnails/33.jpg)
Parte IVExercícios
![Page 34: Making the most of a 100-year-old dictionary](https://reader034.fdocuments.in/reader034/viewer/2022042700/554be480b4c9056b348b48dd/html5/thumbnails/34.jpg)
Palavras Cruzadas:
_ _ _ _ _ _ _ F E U (Vértebra; 10 letras)
E P I _ _ _ _ _ _ _ (Vértebra; 10 letras)
Procura por Afixos
![Page 35: Making the most of a 100-year-old dictionary](https://reader034.fdocuments.in/reader034/viewer/2022042700/554be480b4c9056b348b48dd/html5/thumbnails/35.jpg)
Dicionário de Rimas (gráficas)
Que palavras rimam com “camafeu”?
Pesquisa por Afixos
![Page 36: Making the most of a 100-year-old dictionary](https://reader034.fdocuments.in/reader034/viewer/2022042700/554be480b4c9056b348b48dd/html5/thumbnails/36.jpg)
Estudo de Morfologia (produtividade de
afixos):
Todos os adjectivos em -vel (como amável) podem formar advérbios em -velmente (amavelmente)?
Pesquisa por Afixos
![Page 37: Making the most of a 100-year-old dictionary](https://reader034.fdocuments.in/reader034/viewer/2022042700/554be480b4c9056b348b48dd/html5/thumbnails/37.jpg)
Estudo de Morfologia (produtividade de afixos):
Um professor de Língua Portuguesa disse aos
alunos que o sufíxo "-ería" em Espanhol, é sempre
"-aria" em Português.
cafeteríaES = cafetariaPT
É verdade?
Pesquisa por Afixos
![Page 38: Making the most of a 100-year-old dictionary](https://reader034.fdocuments.in/reader034/viewer/2022042700/554be480b4c9056b348b48dd/html5/thumbnails/38.jpg)
Dicionários Ideológicos/Onomasiológicos:
O que acontece à “água” com o “frio”?
Quem é o “médico” dos “olhos”?
Que palavras derivam do prefixo grego
“orthos”?
Pesquisa Reversa
![Page 39: Making the most of a 100-year-old dictionary](https://reader034.fdocuments.in/reader034/viewer/2022042700/554be480b4c9056b348b48dd/html5/thumbnails/39.jpg)
Procurar “sargaço”.
O que difere da pesquisa reversa?
Pesquisa Ontológica
![Page 40: Making the most of a 100-year-old dictionary](https://reader034.fdocuments.in/reader034/viewer/2022042700/554be480b4c9056b348b48dd/html5/thumbnails/40.jpg)
Procurar “pirilampo” na pesquisa reversa, e
na pesquisa ontológica.
Quais são as diferenças?
Pesquisa Ontológica
![Page 41: Making the most of a 100-year-old dictionary](https://reader034.fdocuments.in/reader034/viewer/2022042700/554be480b4c9056b348b48dd/html5/thumbnails/41.jpg)
Que variedades de oliveiras (ou “espécie de
oliveiras”) há?
Uso da pesquisa reversa
Uso da pesquisa ontológica
Pesquisa Ontológica
![Page 42: Making the most of a 100-year-old dictionary](https://reader034.fdocuments.in/reader034/viewer/2022042700/554be480b4c9056b348b48dd/html5/thumbnails/42.jpg)
Making the most of a100-year-old dictionary
Alberto Simões, Álvaro Iriarte