Denise Casatti / Assessoria de Comunicação do ICMC
Quem já utilizou um smartphone para realizar uma busca na internet, empregando um mecanismo de reconhecimento de voz, e conseguiu alcançar um bom resultado, costuma pensar que os desafios científicos relacionados a esse campo do conhecimento foram resolvidos. Mas durante a Conferência Internacional de Processamento Computacional da Língua Portuguesa, PROPOR 2014, o pesquisador sênior do Google, Michael Riley, explicou que ainda há muitas questões a serem respondidas nessa área, uma das frentes de estudo em processamento computacional da língua.
“Vou dar três exemplos de situações em que esses mecanismos de reconhecimento de voz não funcionam muito bem: quando você está em seu carro e há muito barulho; quando você fala naturalmente, usando a linguagem que emprega no dia a dia; e quando você tem sotaque estrangeiro”, afirmou. Com o objetivo de discutir como resolver esses e outros desafios, pesquisadores do Brasil e do exterior se reuniram em São Carlos durante a segunda semana de outubro. Reconhecido como o principal evento brasileiro da área de processamento computacional da língua portuguesa, o PROPOR também contou com a presença do pesquisador Andreas Stolcke, da Microsoft Research.
“Esse é um assunto internacional, pois é necessário realizar esse processamento em todas as línguas. Muitos problemas interessantes de pesquisa só vêm à superfície quando consideramos as estruturas de diferentes línguas”, revelou Stolcke. Na opinião dele, o maior desafio nesse campo do conhecimento é lidar com a variedade linguística. “As pessoas têm níveis de educação diferentes e isso influencia na sua maneira de falar. Então, os modelos computacionais que criamos precisam ser capazes de abarcar toda essa variedade”, completou.
Segundo um dos coordenadores do PROPOR, Thiago Pardo, professor do Instituto de Ciências Matemáticas e de Computação (ICMC) da USP, em São Carlos, a área está em expansão no Brasil e, com o crescimento da tecnologia da informação e a evolução da computação, tem aumentado a demanda por produtos dessa linha de pesquisa, como tradutores automáticos, sumarizadores de texto, sistemas de processamento de fala e ferramentas computacionais de auxílio à escrita e à leitura, como o revisor gramatical do Word, que surgiu a partir de pesquisas desenvolvidas no ICMC.
“Os pesquisadores dessa área lidam tanto com o texto escrito quanto com o texto falado e, por isso, esse evento reuniu pessoas formadas em computação, em linguística, em engenharia elétrica e em muitas outras esferas do saber. Foi um fórum multidisciplinar rico, com muito assunto para discutir”, contou Pardo.
Já a professora Sara Candeias, da Universidade de Coimbra, Portugal, explicou que o evento é também uma oportunidade de aproximar o ambiente acadêmico das empresas. Ela ressaltou a importância da parceria que existe com o ICMC, em especial com a professora Sandra Aluísio, a qual possibilita realizar um trabalho de co-orientação junto a alunos de doutorado. Sara também é gestora de ciência e tecnologia no Centro de Desenvolvimento da Linguagem da Microsoft, sediado na Universidade do Porto.
“Queremos formar um grupo de linguistas, engenheiros e pessoas com conhecimento em processamento da língua para trazer ao Brasil os estudos que temos desenvolvido em Portugal”, disse a professora. Ela convidou os profissionais interessados em fazer parte desse grupo a entrarem em contato pelo email [email protected].
Durante o PROPOR, foi entregue o prêmio de melhor trabalho de mestrado a Fernando Nóbrega, atualmente aluno de doutorado do ICMC. Em sua dissertação Desambiguação lexical de sentidos para o português por meio de uma abordagem multilíngue mono e multidocumento, Nóbrega foi orientado por Thiago Pardo.
Mais informações: site http://nilc.icmc.usp.br/propor2014/
Tags: Andreas Stolcke, Comunidade USP, Conferência Internacional de Processamento Computacional da Língua Portuguesa, Desambiguação lexical de sentidos para o português por meio de uma abordagem multilíngue mono e multidocumento, Fernando Nóbrega, ICMC, Imprensa, Instituto de Ciências Matemáticas e de Computação, Linguística, Michael Riley, Portugal, PROPOR 2014, Reconhecimento de voz, Sandra Aluísio, São Carlos, Sara Candeias, Texto, Thiago Pardo