Qualitative Model of Location Relations Learned from Human ... · coisas, uma nomeação das...

6
1 Abstract— This work proposes a qualitative model of location and orientation relations defined over spatial expressions in Brazilian Portuguese. This model was automatically obtained from applying Linear Discriminant Analysis on data obtained with two questionnaires applied to human volunteers. Results suggest that the final model is consistent with the human use of spatial expressions in most of the situations observed. Keywords— Qualitative spatial representation, Orientation, LDA, Machine Learning I. INTRODUÇÃO OM o advento da robótica, surgiu a necessidade da comunicação humano-robô e, com ela, pesquisas visando encontrar uma maneira de tornar esta comunicação mais simples e natural ao ser humano [1] [2] [3]. Paralelamente a isso, muitos pesquisadores têm investido na área de Representação e Raciocínio Qualitativo [3] [4], que torna a interpretação de um dado domínio mais natural, uma vez que não se trabalha com valores quantitativos, mas com categorias qualitativas, facilitando a derivação de novas informações a partir das anteriores. Intuitivamente, pode-se dizer que o raciocínio qualitativo se aproxima mais da forma de pensar do ser humano do que o raciocínio quantitativo [5]. A área de Raciocínio Espacial Qualitativo (REQ) estuda métodos que modelam adequadamente sistemas espaciais, facilitando a inferência e a representação de relações entre entidades espaciais. Neste artigo vamos investigar um modelo de Representação Espacial Qualitativa similar ao OPRA [6], no qual as entidades são pontos orientados, o ambiente espacial tem duas dimensões e a orientação é relativa (conforme seção III-B). Neste modelo, as relações entre os elementos no espaço são baseadas apenas da direção relativa entre eles. As categorias qualitativas desse modelo foram aprendidas utilizando-se um método de análise de discriminantes lineares (Seção III-C). Este aprendizado automático se deu a partir de dados obtidos por meio de dois questionários respondidos por falantes de língua Portuguesa do Brasil (Seção IV-A). É importante ressaltar que, para que o modelo aprendido pudesse ser considerado um modelo de Raciocínio Espacial Qualitativo, seria necessário o desenvolvimento de formalizações matemáticas que permitissem um raciocínio, que será tema para trabalhos futuros. II. TRABALHOS CORRELATOS Na área de Raciocínio Espacial e Linguagem Natural existem diversos trabalhos que elaboram modelos tanto para a aprendizagem de relações espaciais quanto para interpretação de linguagem natural. Alguns deles serão descritos a seguir. T.C. Truchlaeff and P. E. Santos are with the Electrical and Electronics Eng. Dep. of Centro Universitário da FEI, S. Paulo, Brazil; M. Lopes is with the Linguistics Department, University of S. Paulo, S. Paulo, Brazil. Corresponding author: P.E. Santos ([email protected]) Discutindo a necessidade de estudar as expressões espaciais como base para formas gerais, mais abstratas de raciocínio sempre presentes em descrições e inferências na língua natural, Lopes e Santos [7] argumentam que é necessário conhecer o uso de tais expressões em seu contexto original (isto é, na língua natural) para, a seguir, buscar modelos lógicos que possam formalizá-los. Uma das dificuldades enfrentadas, amplamente reconhecidas, está na grande variabilidade interpretativa do uso dessas expressões (ver, a esse respeito, [8], um trabalho especificamente voltado à preposição em do português). Basicamente, a dificuldade está em conciliar um mapeamento semântico entre expressões e interpretações com as diferenças introduzidas pelo uso concreto das expressões nos contextos conversacionais e textuais. Como ilustração, a locução formada por junto mais uma preposição (a, com, de...) pode significar configurações bastante diferentes entre si. Uma das maneiras de percebê-lo é testar que outras expressões são admitidas como intercambiáveis a essas locuções: TV está junto à parede da sala. (mais perto da parede que do centro da sala) O quarto do bebê fica junto ao dos pais. (ao lado / atrás / à frente) Ela foi ao teatro junto com seu irmão. (: o mesmo que “Ela foi ao teatro com seu irmão”) Se entendidas do ponto de vista estrito do mapeamento semântico, portanto, essas expressões bastante simples acarretariam inconsistências. O uso das expressões espaciais na língua natural, entretanto, não se por mero acaso, evidentemente. Algumas expressões são muito mais usadas que outras e algumas interpretações para elas são também mais recorrentes do que outras. Isso permite que alguns sistemas computacionais alcancem bons resultados nas tarefas de compreensão da língua natural. Dobnik et al. [1] descrevem um sistema de aprendizagem para um robô móvel assimilar expressões espaciais em linguagem natural tal como “mova-se para frente de vagar” ou “você está na frente de uma escrivaninha”. O aprendizado é feito a partir de dados obtidos pelo robô, como sua posição (e dos outros objetos do ambiente), sua direção, sua velocidade (linear e angular), entre outros; e de descrições humanas feitas em linguagem natural, como “a cadeira está atrás de você”. Estes dados são obtidos da seguinte maneira: alguém controla o robô e o coloca em situações específicas enquanto outra pessoa descreve a situação em linguagem natural. O aprendizado foi realizado utilizando o Weka [9], um conjunto algoritmos de aprendizagem de máquina implementados utilizando uma estrutura de dados comum, possibilitando a experimentação de diversos métodos de aprendizagem de maneira simples. Tellex et al. [2] desenvolveram um novo modelo para interpretação de comandos em linguagem natural com o objetivo de controlar um sistema autônomo móvel em um ambiente C Qualitative Model of Location Relations Learned from Human Data T. C. Truchlaeff, P. E. Santos, Member, IEEE, e M. Lopes. 764 IEEE LATIN AMERICA TRANSACTIONS, VOL. 16, NO. 3, MARCH 2018

Transcript of Qualitative Model of Location Relations Learned from Human ... · coisas, uma nomeação das...

1Abstract— This work proposes a qualitative model of location and orientation relations defined over spatial expressions in Brazilian Portuguese. This model was automatically obtained from applying Linear Discriminant Analysis on data obtained with two questionnaires applied to human volunteers. Results suggest that the final model is consistent with the human use of spatial expressions in most of the situations observed.

Keywords— Qualitative spatial representation, Orientation,

LDA, Machine Learning

I. INTRODUÇÃO

OM o advento da robótica, surgiu a necessidade da comunicação humano-robô e, com ela, pesquisas visando

encontrar uma maneira de tornar esta comunicação mais simples e natural ao ser humano [1] [2] [3]. Paralelamente a isso, muitos pesquisadores têm investido na área de Representação e Raciocínio Qualitativo [3] [4], que torna a interpretação de um dado domínio mais natural, uma vez que não se trabalha com valores quantitativos, mas com categorias qualitativas, facilitando a derivação de novas informações a partir das anteriores. Intuitivamente, pode-se dizer que o raciocínio qualitativo se aproxima mais da forma de pensar do ser humano do que o raciocínio quantitativo [5]. A área de Raciocínio Espacial Qualitativo (REQ) estuda métodos que modelam adequadamente sistemas espaciais, facilitando a inferência e a representação de relações entre entidades espaciais.

Neste artigo vamos investigar um modelo de Representação Espacial Qualitativa similar ao OPRA [6], no qual as entidades são pontos orientados, o ambiente espacial tem duas dimensões e a orientação é relativa (conforme seção III-B). Neste modelo, as relações entre os elementos no espaço são baseadas apenas da direção relativa entre eles. As categorias qualitativas desse modelo foram aprendidas utilizando-se um método de análise de discriminantes lineares (Seção III-C). Este aprendizado automático se deu a partir de dados obtidos por meio de dois questionários respondidos por falantes de língua Portuguesa do Brasil (Seção IV-A). É importante ressaltar que, para que o modelo aprendido pudesse ser considerado um modelo de Raciocínio Espacial Qualitativo, seria necessário o desenvolvimento de formalizações matemáticas que permitissem um raciocínio, que será tema para trabalhos futuros.

II. TRABALHOS CORRELATOS

Na área de Raciocínio Espacial e Linguagem Natural existem

diversos trabalhos que elaboram modelos tanto para a aprendizagem de relações espaciais quanto para interpretação de linguagem natural. Alguns deles serão descritos a seguir.

T.C. Truchlaeff and P. E. Santos are with the Electrical and Electronics

Eng. Dep. of Centro Universitário da FEI, S. Paulo, Brazil; M. Lopes is with the Linguistics Department, University of S. Paulo, S. Paulo, Brazil.

Corresponding author: P.E. Santos ([email protected])

Discutindo a necessidade de estudar as expressões espaciais como base para formas gerais, mais abstratas de raciocínio sempre presentes em descrições e inferências na língua natural, Lopes e Santos [7] argumentam que é necessário conhecer o uso de tais expressões em seu contexto original (isto é, na língua natural) para, a seguir, buscar modelos lógicos que possam formalizá-los. Uma das dificuldades enfrentadas, amplamente reconhecidas, está na grande variabilidade interpretativa do uso dessas expressões (ver, a esse respeito, [8], um trabalho especificamente voltado à preposição em do português). Basicamente, a dificuldade está em conciliar um mapeamento semântico entre expressões e interpretações com as diferenças introduzidas pelo uso concreto das expressões nos contextos conversacionais e textuais. Como ilustração, a locução formada por junto mais uma preposição (a, com, de...) pode significar configurações bastante diferentes entre si. Uma das maneiras de percebê-lo é testar que outras expressões são admitidas como intercambiáveis a essas locuções:

TV está junto à parede da sala. (mais perto da parede que do centro da sala) O quarto do bebê fica junto ao dos pais. (ao lado / atrás / à frente) Ela foi ao teatro junto com seu irmão. (∅ : o mesmo que “Ela foi ao teatro com seu irmão”) Se entendidas do ponto de vista estrito do mapeamento

semântico, portanto, essas expressões bastante simples acarretariam inconsistências. O uso das expressões espaciais na língua natural, entretanto, não se dá por mero acaso, evidentemente. Algumas expressões são muito mais usadas que outras e algumas interpretações para elas são também mais recorrentes do que outras. Isso permite que alguns sistemas computacionais alcancem bons resultados nas tarefas de compreensão da língua natural.

Dobnik et al. [1] descrevem um sistema de aprendizagem para um robô móvel assimilar expressões espaciais em linguagem natural tal como “mova-se para frente de vagar” ou “você está na frente de uma escrivaninha”. O aprendizado é feito a partir de dados obtidos pelo robô, como sua posição (e dos outros objetos do ambiente), sua direção, sua velocidade (linear e angular), entre outros; e de descrições humanas feitas em linguagem natural, como “a cadeira está atrás de você”. Estes dados são obtidos da seguinte maneira: alguém controla o robô e o coloca em situações específicas enquanto outra pessoa descreve a situação em linguagem natural. O aprendizado foi realizado utilizando o Weka [9], um conjunto algoritmos de aprendizagem de máquina implementados utilizando uma estrutura de dados comum, possibilitando a experimentação de diversos métodos de aprendizagem de maneira simples.

Tellex et al. [2] desenvolveram um novo modelo para interpretação de comandos em linguagem natural com o objetivo de controlar um sistema autônomo móvel em um ambiente

C

Qualitative Model of Location Relations Learned from Human Data

T. C. Truchlaeff, P. E. Santos, Member, IEEE, e M. Lopes.

764 IEEE LATIN AMERICA TRANSACTIONS, VOL. 16, NO. 3, MARCH 2018

semiestruturado. O modelo, chamado Generalized Grounding Graphs (G3), generaliza técnicas de Predições Estruturadas, desenvolvidas anteriormente, possibilitando que as estruturas possam ser variáveis, permitindo o aprendizado e a inferência de informações independentes do domínio. O sistema proposto executa comandos em linguagem natural como “Coloque a caixa no caminhão”. O modelo foi treinado utilizando um grande conjunto de dados, onde cada exemplo é um par de: comando em linguagem natural e ação executada pelo robô. A grande diferença entre os trabalhos [2] e [1] está no fato de que o modelo G3 possibilita a análise de sentenças mais complexas, que possuem estruturas linguísticas compostas e com hierarquias, como, por exemplo, “Coloque a caixa no palete ao lado do caminhão”. O trabalho apresentado em [1] somente aceita frases utilizando palavras e estruturas específicas.

Os artigos [2] e [1] trabalham com expressões espaciais complexas e interpretação de linguagem natural, enquanto o trabalho descrito no presente artigo busca modelar expressões espaciais mais simples, como “Frente” e “Atrás”. Em contra- partida, o trabalho descrito aqui modela essas expressões em forma de Representação Espacial Qualitativa, o que permite a elaboração de uma formalização de REQ.

Em [3] foi desenvolvido um sistema para traduzir sentenças sobre relações espaciais em linguagem natural para relações em representação espacial qualitativa. Este sistema é dividido em duas etapas: a primeira identifica e extrai automaticamente, das expressões, as partes que contém informações especificamente espaciais; a segunda etapa mapeia estas partes em termos de um modelo de representação espacial qualitativa chamado Region Connection Calculus (RCC) [10]. Para aprender o sistema de tradução, foi utilizado o método de aprendizagem de máquina Support Vector Machines (SVM).

O sistema apresentado em [3] mostra que, caso se tenha um conjunto adequado de dados para o treinamento dos métodos de aprendizagem de máquina, o sistema apresentado é capaz de aprender relações espaciais qualitativas com uma performance aceitável. O modelo proposto no presente artigo também trabalha uma maneira de vincular linguagem natural com representação espacial qualitativa, mas ao contrário do método apresentado em [3], este modelo transformou as expressões espaciais em categorias qualitativas, definindo suas interpretações por meio de dados humanos. Isso permite que o próprio modelo qualitativo represente estas expressões.

O trabalho descrito por Perico et al. [4] propôs, entre outras coisas, uma nomeação das categorias qualitativas do de uma álgebra sobre direções espaciais (OPRA) por preposições espaciais, como “frente”, “direita”, etc. Isso permite com que exista uma relação simples entre essas categorias e sua representação espacial, facilitando às pessoas entenderem essas expressões. O presente trabalho propõe um aprimoramento da abordagem descrita em [4], em que as categorias representadas por expressões espaciais são aprendidas a partir de pesquisas com humanos.

III. INTRODUÇÃO TEÓRICA

A. Raciocínio Espacial Qualitativo (REQ) é uma sub área

da Inteligência Artificial (IA) que busca desenvolver uma maneira de representar formalmente configurações espaciais de elementos de forma qualitativa. Além de simplesmente representar, REQ busca maneiras de permitir o raciocínio a partir de tais representações [11].

Grande parte do raciocínio sobre relações espaciais com o qual se tem lidado é baseado em relações binárias ou ternárias, que podem ser representadas sob a forma de restrições. A representação baseada em restrições possibilita o desenvolvimento de algoritmos muito mais eficientes do que os que utilizam dedução em lógica de primeira ordem. Um conjunto de relações binárias básicas precisa ter a propriedade de ser conjuntamente exaustivo com relações disjuntas par a par, ou seja, todas as relações possíveis estão contidas na união das relações básicas e existe somente uma relação básica que satisfaz a relação entre dois elementos espaciais [12].

B. Oriented Point Relation Algebra (OPRA) com granularidade m (OPRAm) é uma formalização de cálculo qualitativo espacial proposta em [6] em que as entidades espaciais são pontos orientados de tamanho nulo, o ambiente espacial tem duas dimensões e a orientação é relativa. O objetivo é calcular a posição relativa entre objetos onde a distância não tem importância, pois apenas a direção é modelada. Os pontos orientados (O-Points) são representados por suas coordenadas Cartesianas x e y e por suas orientações, φ, em um plano 2D. Os pontos são definidos, também, por suas granularidades m, onde m∈Ν. Essa granularidade é utilizada para definir a resolução angular, que é igual a 2π/2m. Pode-se entender que m é o número de retas que se cruzam no ponto, definindo os quadrantes [14].

Na Figura 1(a) está representado um ponto orientado de granularidade 2. O ponto orientado representado pela figura 1(a) gera 8 setores ou quadrantes à sua volta. Esses quadrantes são associados a números em ordem crescente no sentido anti-horário, começando de 0, na direção da orientação do ponto. Quanto maior a granularidade, maior é a precisão da relação, pois maior é a resolução. Na figura 1(b) está representado um ponto orientado com granularidade 4.

Um dos grandes problemas do Raciocínio Espacial Qualitativo é encontrar a granularidade ideal. Na maioria dos métodos de REQ, essa granularidade é escolhida no começo, não podendo ser alterada posteriormente. No OPRAm, a granularidade é variável, definida pelo parâmetro m, e pode ser alterada dinamicamente [15], possibilitando encontrar uma resolução onde a precisão é adequada e a geração de uma tabela de composição mínima [6].

O modelo descrito no presente artigo é bastante semelhante ao OPRA: as entidades espaciais são pontos orientados de tamanho nulo, o ambiente espacial tem duas dimensões, a orientação é relativa e o objetivo é calcular a posição relativa entre objetos. A diferença está no fato de que as categorias são expressões espaciais e suas respectivas definições (também podendo ser entendidas como quadrantes) são aprendidas a partir de dados de agentes humanos. Esse aprendizado será realizado por meio de um método de aprendizagem de máquina chamado Análise Discriminante Linear (LDA), descrito na seção a seguir. Vale ressaltar que, apesar da percepção visual humana não ser bidimensional, as expressões espaciais aqui consideradas (descritas na seção IV-A) são definidas no plano horizontal, permitindo que o modelo proposto seja igualmente definido somente em duas dimensões.

C. Análise Discriminante Linear (LDA) é um método de aprendizagem de máquina que utiliza técnicas estatísticas para encontrar a combinação linear das características dos elementos que os separem em classes [16]. A separação dos elementos em classes é realizada maximizando a separação entre classes e minimizando variação nas classes. Considere um vetor de observações (ou características) x sobre um determinado elemento de uma classe y. O conjunto desses elementos é chamado de conjunto de treinamento. O objetivo do LDA é conseguir prever

CARDOSO TRUCHLAEFF et al.: QUALITATIVE MODEL 765

que um outro elemento qualquer pertence à classe y somente através do seu vetor de características x. Isso é feito encontrando uma matriz projeção que melhor separa os elementos.

Este método será utilizado no presente trabalho para

encontrar o modelo pretendido a partir de dados de agentes humanos.

IV. DESENVOLVIMENTO

O trabalho descrito em [4] definiu as categorias do modelo

OPRA em termos de preposições espaciais utilizadas em língua portuguesa, criando assim um vínculo com a linguagem natural. Este vínculo, porém, pode não representar a realidade da interpretação comum das preposições utilizadas. Para resolver essa questão, o presente trabalho desenvolveu um modelo de representação espacial semelhante ao OPRA onde as categorias são expressões espaciais e são aprendidas a partir de dados de agentes humanos, permitindo que o vínculo entre as categorias qualitativas e as expressões seja mais real. As expressões espaciais foram escolhidas de modo a tornarem as relações mutuamente excludentes e exaustivas par a par, não descaracterizando o modelo.

Para se obter os dados necessários, foram realizadas duas pesquisas com voluntários para abordar o significado visual das seguintes expressões espaciais: “Esquerda”, “Frente-Esquerda”, “Frente”, “Frente-Direita”, “Direita”, “Atrás-Direita”, “Atrás” e “Atrás-Esquerda”.

Pesquisa 1: A primeira pesquisa foi realizada por meio de um questionário online preparado a partir da plataforma Google Forms e distribuído para diversas pessoas adultas e falantes de português sem nenhum tipo de distinção ou restrição. Foram utilizados diversos meios de distribuição, como redes sociais, e-mails, SMS, entre outros.

Nesta pesquisa, foi apresentada uma situação e algumas imagens (figuras 3, 4 e 5) cujo objetivo era fazer com que os voluntários imaginassem um determinado ambiente. A partir dele, as pessoas deveriam informar quais expressões espaciais

melhor representavam a posição de determinados objetos (ou pessoas) que estavam neste ambiente, enumerados de 1 a 15.

Figura 3. Primeira imagem mostrada na pesquisa 1.

Figura 4. Segunda imagem mostrada na pesquisa 1.

Figura 5. Terceira imagem mostrada na pesquisa 1.

O questionário tinha um único enunciado: “Indique onde estão as pessoas e os objetos (enumerados de 1 a 15) em relação à direção na qual o seu corpo está orientado utilizando as opções abaixo”. Essa questão possuía 15 itens, um para cada elemento no ambiente, com 7 alternativas de resposta: “Esquerda”, “Frente-Esquerda”, “Frente”, “Frente- Direita”, “Direita”, “Atrás-Direita” e “Atrás”.

Oitenta e uma pessoas responderam à pesquisa 1, mas somente 70 respostas foram consideradas. As demais (11 respostas) foram desconsideradas por serem inválidas: em todas elas continham elementos que foram rotulados com posição contrária, por exemplo, o objeto estava à direita e foi rotulado pela expressão “Esquerda”.

Diversas variáveis poderiam estar influenciando no resultado desta pesquisa. Algumas destas possíveis variáveis são: interferência ou limitação da interface pela qual se está fazendo a pesquisa e a organização dos objetos no ambiente. Para reduzir tais influências, uma segunda pesquisa foi realizada, na qual tanto a interface quanto a organização dos objetos no ambiente apresentado foram diferentes.

Pesquisa 2: Esta pesquisa foi realizada em laboratório. Um ambiente controlado com diversos objetos numerados espalhados uniformemente no chão foi montado (figura 6) e voluntários tiveram como objetivo definir qual expressão espacial melhor representava a posição de cada objeto referenciado em relação a eles. As expressões possíveis foram as mesmas da pesquisa 1.

766 IEEE LATIN AMERICA TRANSACTIONS, VOL. 16, NO. 3, MARCH 2018

Figura 6. Disposição dos objetos da pesquisa 2. Para responder ao questionário, os voluntários primeiro

recebiam uma explicação sobre o funcionamento da pesquisa e seus objetivos. Eles então eram posicionados em um local determinado, próximos dos objetos de pesquisa, como pode ser visto na figura 7. O objetivo desse questionário era estabelecer (do ponto de vista dos voluntários) a expressão espacial que mais se adequava à posição de cada objeto referenciado.

O questionário possuía 22 itens, um para cada elemento no ambiente, com 7 alternativas de resposta: “Esquerda”, “Frente-Esquerda”, “Frente”, “Frente-Direita”, “Direita”, “Atrás-Direita” e “Atrás”. Cinquenta pessoas responderam à pesquisa 2, das quais 1 resposta foi desconsiderada pelo fato de elementos no semi-plano direito terem sido rotulados com "Frente-Esquerda”.

Os dados obtidos em ambas as pesquisas foram utilizados como entrada para o método de aprendizagem de máquina chamado LDA, que determinou a faixa de ângulos que as expressões espaciais representam. Os resultados obtidos estão descritos a seguir.

Figura 7. Voluntário respondendo a Pesquisa 2.

V. RESULTADOS E DISCUSSÕES

Os resultados obtidos por meio do treinamento foram separados em dois grupos: o resultado 1, obtido a partir dos dados da pesquisa 1 e o resultado 2, a partir da pesquisa 2. Estes foram avaliados em suas capacidades de generalização utilizando uma técnica estatística de validação cruzada chamada Leave-One-Out [17]. A vantagem dessa técnica está na possibilidade da utilização dos mesmos dados para o treinamento e para a validação, o que é conveniente quando a quantidade de informações é pequena.

Vale ressaltar que a definição do modelo partiu da hipótese de simetria bilateral na percepção espacial humana, ou seja, a faixa de ângulos que representa expressões à “Direita” é a mesma que representa expressões à “Esquerda”.

A. Resultado 1 As relações espaciais aprendidas a partir dos dados da pesquisa

1 estão representadas na figura 8. Pode-se observar que as áreas relacionadas às expressões “Direita”, “Esquerda” e “Frente” são similares entre si, e maiores que as relacionadas às expressões “Frente-esquerda” ou “Frente-direita”.

O resultado 1 foi avaliado com a técnica Leave-One-Out [17]. Para cada expressão considerada, foi calculada a porcentagem de acertos em função do número total de amostras da respectiva expressão. Essas porcentagens, bem como a quantidade de amostras, estão representadas na tabela I. Esta tabela aponta uma taxa de acerto superior a 80% para a expressão "Frente" e em torno de 50% para “Frente-Direita” e “Direita”.

B. Resultado 2 O resultado obtido por meio da pesquisa 2 está representado na

figura 9. Ao comparar este resultado com o resultado 1, é possível observar que expressões espaciais semelhantes foram definidas por áreas semelhantes. Isto é, as áreas relacionadas às expressões “Direita”, “Frente-Direita”, “Frente”, “Frente-Esquerda” e “Esquerda” são similares entre si. É possível observar, também, que as áreas relacionadas às expressões “Esquerda”, “Frente”, “Direita” e “Atrás” são maiores que as relacionadas às expressões “Frente-Esquerda”, “Frente-Direita”, “Atrás-Esquerda” ou “Atrás-direita”.

Figura 8. Modelo 1.

Tabela I TABELA DE ACERTOS DA PESQUISA 1.

Expressão Num. Amostras % Acerto “Frente” 206 84,4%

“Frente-Direita” 490 52,04% “Direita” 242 49,59%

Total 938 58,53%

O resultado 2 foi também avaliado com a técnica Leave-One-Out [17]. Os resultados, bem como a quantidade de amostras, estão representados na tabela II. Como os resultados apresentados para o questionário online, observa-se uma taxa de acerto superior a 70% para todas as expressões, menos para “Frente-Direita”, que recebeu 47% das respostas corretas.

CARDOSO TRUCHLAEFF et al.: QUALITATIVE MODEL 767

Figura 9. Modelo 2.

Tabela II TABELA DE ACERTOS DA PESQUISA2.

Expressão Num. Amostras % Acerto “Frente” 112 92,86%

“Frente-Direita” 231 47,19% “Direita” 318 77,36%

“Atrás-Direita” 252 73,81% “Atrás” 165 89,70% Total 1078 73,56%

Apesar de os dados terem sido obtidos essencialmente para o lado direito, tanto o resultado 1 quanto o resultado 2 representam os dois hemisférios, de acordo com a hipótese de simetria na percepção espacial.

C. Discussão dos Resultados

A primeira pesquisa continha poucos elementos, apenas 3 na região traseira, em que o ângulo era maior que 90 graus. Por causa disso, a quantidade de respostas “Atrás” foi igualmente baixa, apenas 7. Por causa disso, o modelo representou de forma errada a expressão “Atrás” e, consequentemente, definiu errado a separação entre a região que representa as expressões “Atrás” e “Atrás-Direita”. Decidiu-se, então, não representar as regiões “Atrás” e “Atrás-Direita” neste resultado.

Já a pesquisa 2 apresentou uma quantidade de dados suficiente para uma boa modelagem em todo o lado direito, possibilitando uma representação confiável das expressões espaciais consideradas.

Ao comparar a representação das mesmas expressões espaciais nas pesquisas 1 e 2, foi possível perceber uma grande semelhança, ou seja, a variação angular que representa uma dada expressão na pesquisa 1 é semelhante à variação desta mesma expressão na pesquisa 2. A expressão “Frente” por exemplo, foi representada pela primeira pesquisa como sendo a região angular definida entre 330 e 30 graus; na segunda pesquisa, esta mesma expressão foi representada pela região entre 332 e 28 graus. O mesmo pode ser dito em relação às demais expressões. A similaridade nos resultados indica que as abordagens das pesquisas foram confiáveis e as influências das interfaces e da disposição dos objetos foram mínimas ou coincidentes.

A porcentagem de erro encontrada na avaliação dos resultados (tabelas I e II) foram consequência da variação nas respostas, devido aos diversos empregos das expressões espaciais (em situações distintas) entre falantes de língua Portuguesa no Brasil.

É possível fazer uma comparação com a divisão apresentada pelo modelo proposto por Perico et al. [4], em que foi

utilizada a formalização OPRA de granularidade igual a 6 e nomearam-se os quadrantes com expressões espaciais semelhantes às utilizadas no presente projeto. Perico et al. [4] utilizou dois quadrantes ímpares para representar as preposições “Frente”, “Trás”, “Direita” e “Esquerda”, e somente um quadrante ímpar para representar as preposições “Direita-Frente”, “Esquerda-Frente”, “Direita-Trás” e “Esquerda-Trás”. Esse é um fator que coincide com os modelos aprendidos no presente trabalho: as expressões que não são compostas representam um espaço angular maior do que as compostas, assim como no modelo descrito em [4].

A diferença entre esses modelos está na simetria: o modelo encontrado no presente trabalho mostra que a expressão “Atrás” representa uma faixa angular maior do que a expressão “Frente”.

D. Modelo Encontrado

A partir do Resultado 2, foi possível extrair o modelo de representação espacial pretendido. A tabela III contém as definições das categorias espaciais a partir das faixas angulares, em que φ representa um ângulo qualquer em relação a orientação da referência.

Tabela III MODELO ENCONTRADO.

Categoria Qualitativa Faixa Angular “Frente” 332◦ ≥ φ ≥ 28◦

“Frente – Direita” 28◦ > φ ≥ 59◦ “Direita” 59◦ > φ ≥ 101◦

“Atrás – Direita” 101◦ > φ ≥ 137◦ “Atrás” 137◦ > φ > 223◦

“Atrás – Esquerda” 223◦ ≥ φ > 259◦ “Esquerda” 259◦ ≥ φ > 301◦

“Frente – Esquerda” 301◦ ≥ φ > 332◦

Por meio da tabela III é possível determinar a categoria qualitativa de qualquer posição em relação à orientação de uma entidade espacial no plano.

VI. CONCLUSÃO

Este trabalho descreveu o desenvolvimento de um modelo de relações de localização espacial qualitativas aprendido de forma automática a partir de dados obtido em pesquisas com voluntários falantes da língua Portuguesa no Brasil. Este modelo descreve, por meio de categorias qualitativas, a compreensão das pessoas sobre algumas expressões espaciais. Os resultados foram consistentes, uma vez que as duas pesquisas geraram modelos semelhantes. Entretanto, o modelo aprendido não foi capaz de capturar o significado absoluto das expressões estudadas, uma vez que obtivemos menos de 90%

768 IEEE LATIN AMERICA TRANSACTIONS, VOL. 16, NO. 3, MARCH 2018

de acerto na maioria dos casos. Isso se deve provavelmente a dois motivos principais: primeiro, há uma dispersão natural no uso de expressões espaciais por falantes de uma mesma língua; uma segunda causa possível são os limiares precisos obtidos pela análise de discriminantes lineares. Para resolver essas questões, trabalhos futuros deverão se concentrar no estudo de classificadores de limiares nebulosos (fuzzy) a fim de se obter um modelo mais adequado ao uso corrente das expresses espaciais.

Foi possível constatar, também, que a expressão “Frente- Direita” apresentou baixa porcentagem de acerto nas duas pesquisas. Isso talvez se deva ao fato desta expressão não ser muito utilizada no cotidiano das pessoas, e, assim, apresenta um menor consenso quanto a sua definição.

É possível dizer que este modelo representa melhor as categorias qualitativas de localização para interações humano-robô do que modelos fixos como os utilizados em [4], uma vez que estas categorias são definidas a partir de expressões espaciais, tais quais utilizadas por falantes da língua Portuguesa no Brasil.

O próximo passo no desenvolvimento do modelo é a elaboração de uma formalização lógica para que se possa utilizá-lo em um sistema de raciocínio automático. Com isso, poderemos avaliar o quanto inferências executadas com as expressões aprendidas se aproximam das inferências executadas por humanos dadas condições semelhantes.

AGRADECIMENTOS

Este trabalho foi parcialmente financiado pelo projeto PITE

FAPESP-IBM proc. 2016/18792-9.

REFERÊNCIAS [1] S. Dobnik, S. Pulman, P. Newman, and A. Harrison,

“Teaching a robot spatial expressions,” in Proceeding of the Second Association for Computational Linguistics - Special Interest Group on Computational Semantics (ACL-SIGSEM), Colchester, UK, 2005.

[2] S. A. Tellex, T. F. Kollar, S. R. Dickerson, M. R. Walter, A. Banerjee, S. Teller, and N. Roy, “Understanding natural language commands for robotic navigation and mobile manipulation,” in Proceeding of the National Conference on Artificial Intelligence (AAAI), 2011.

[3] P. Kordjamshidi, J. Hois, M. van Otterlo, and M.-F. Moens, “Learning to interpret spatial natural language in terms of qualitative spatial rela- tions,” in Representing Space in Cognition: Interrelations of behaviour, language, and formal models. Oxford University Press, 2013.

[4] P. Danilo, S. Paulo, Bianchi, and R. Mantaras, “Collaborative multi-robot localisation with qualitative information,” in Proc. of the 29th International Workshop on Qualitative Reasoning, vol. 1, 2016, p. 1.

[5] A. G. Cohn and J. Renz, “Qualitative spatial representation and reasoning,” Foundations of Artificial Intelligence, vol. 3, pp. 551–596, 2008.

[6] R. Moratz, “Representing relative direction as a binary relation of oriented points,” in Proceeding of the 17th European Conference on Artificial Intelligence (ECAI), Italy. IOS Press, pp. 407– 411.

[7] M. Lopes and P. E. Santos, “Looking for a rational substratum constraining the cognition of spatial expressions,” journal of Methodological Studies, vol. 35, no. 2, pp. 97–110, 2015.

[8] E. Rodrigues, P. E. Santos, and M. Lopes, “Pinning down polysemy: A formalisation for a brazilian portuguese preposition,” Journal of Cognitive Systems Research, vol. 41, pp. 84–92, 2016.

[9] I. Witten and E. Frank, “Data mining: Practical machine learning tools with java implementations,” M. Kaufmann, San Francisco, 2000.

[10] A. G. Cohn, B. Bennett, J. Gooday, and N. M. Gotts, “Qualitative spatial representation and reasoning with the region connection calculus,” GeoInformatica, vol. 1, no. 3, pp. 275–316, 1997.

[11] A. G. Cohn and S. M. Hazarika, “Qualitative spatial representation and reasoning: An overview,” Fundamenta informaticae, vol. 46, no. 1-2, pp. 1–29, 2001.

[12] J. Renz and B. Nebel, “Qualitative spatial reasoning using constraint calculi,” in Handbook of spatial logics. Springer, 2007, pp. 161–215.

[13] T. Mossakowski and R. Moratz, “Qualitative reasoning about relative direction of oriented points,” Artificial Intelligence, vol. 180, pp. 34–45, 2012.

[14] R. Moratz, J. Renz, and D. Wolter, “Qualitative spatial reasoning about line segments,” in Proceeding of ECAI, 2000, pp. 234–238.

[15] R. Moratz, F. Dylla, and L. Frommberger, “A relative orientation algebra with adjustable granularity,” in Proceedings of the Workshop on Agents in Real-Time and Dynamic Environments (IJCAI), 2005, pp. 61–70.

[16] G. McLachlan, Discriminant analysis and statistical pattern recognition. John Wiley & Sons, 2004, vol. 544.

[17] R. Kohavi, “A study of cross-validation and bootstrap for accuracy estimation and model selection,” in International Joint Conference on Artificial Intelligence (IJCAI), vol. 14, 1995, pp. 1137–1145.

Tiago C. Truchlaeff is an automation and control engineer graduate from the Centro Universitario da FEI (2014). Has experience in electronic engineering and low level language programming.

Paulo E. Santos is a physics graduate from the Universidade de São Paulo (1995), M.Sc. in Electrical Engineering from Universidade de São Paulo (1997), has a Master Of Logic (MoL) from the Institute For Logic Language And

Computation, ILLC-UvA (1998) and a Ph.D. in Artificial Intelligence from Imperial College, London (2003). Has experience in Computer Science and Robotics.

Marcos Lopes is a Psychology graduate from University of São Paulo (1994), M. Sc. in Psychology (Federal Un. of Rio de Janeiro) and Ph.D. in Linguistics from University of Paris (Nanterre / La Défense), 2002. His interests focus on computational linguistics, natural language formalisation, and cognitive science

CARDOSO TRUCHLAEFF et al.: QUALITATIVE MODEL 769