Corpus TecEM: o processo de construção de um corpus de produções textuais em Língua Portuguesa elaboradas por alunos de Ensino Médio Integrado a cursos técnicos

  • Maitê Moraes Gil Instituto Federal de Educação, Ciência e Tecnologia do Rio Grande do Sul e Universidade Católica Portuguesa
  • Julia Ferri Pinto Instituto Federal de Educação, Ciência e Tecnologia do Rio Grande do Sul
  • Vitor Gouvêa Instituto Federal de Educação, Ciência e Tecnologia do Rio Grande do Sul
  • Bruno Corrêa de Almeida Universidade Federal do Rio Grande do Sul
  • Pedro de Andrade Santos Universidade Federal de Santa Maria
  • Augusto Weiand Instituto Federal de Educação, Ciência e Tecnologia do Rio Grande do Sul
Palavras-chave: corpus de Língua Portuguesa, Ensino de língua portuguesa, Formação tecnológica

Resumo

O presente artigo visa a apresentar o processo de construção do Corpus TecEM, uma ferramenta que disponibiliza textos escritos por alunos de cursos técnicos integrados ao Ensino Médio em suas aulas de Língua Portuguesa. Para a obtenção deste objetivo geral, teve-se como objetivos específicos: (i) estabelecer os critérios para a organização dos dados linguísticos; (ii) organizar e rotular os textos do corpus de acordo com os critérios estabelecidos; e (iii) disponibilizar o corpus elaborado. A construção de um corpus com essas características se apresenta fundamental devido às potencialidades acadêmicas e ao desenvolvimento de práticas docentes que sua exploração pode embasar. Como base teórica, parte-se da compreensão da Linguística de Corpus como uma abordagem baseada em corpus, uma perspectiva para o estudo da linguagem.  Para tanto, foi necessário: (a) levantamento bibliográfico; (b) contato com professores de Língua Portuguesa de Institutos Federais e convite aos interessados em contribuir na coleta de textos; (c) coleta de textos escritos por alunos de cursos técnicos integrados ao Ensino Médio durante suas aulas de Língua Portuguesa; (d) compilação dos textos a partir dos critérios estabelecidos; (e) armazenamento do corpus TecEM em um banco de dados online, definindo sua estrutura de maneira alinhada aos critérios de compilação; (f) desenvolvimento e disponibilização da ferramenta. Em março de 2019, o Corpus TecEM possuía 327 textos (118,009 palavras) escritos por alunos dos IFs localizados no RS e mais textos já foram coletados a partir de abril do mesmo ano. Com a construção deste corpus, entende-se que foi disponibilizada à comunidade acadêmica uma base de dados rica e criteriosa para futuras pesquisas, contribuindo tanto para o desenvolvimento teórico quanto para a proposição de novas práticas de ensino de Língua Portuguesa, de modo geral, e em contextos de formação tecnológica, em particular.

Referências

ALUÍSIO, S; ALMEIDA, G. O que é e como se constrói um corpus? Lições aprendidas na compilação de vários corpora para pesquisa linguística. Calidoscópio, São Leopoldo, vol. 4, n. 3, p. 156-178, set/dez 2006.

BAKHTIN, M. Estética da criação verbal. São Paulo: Martins Fontes: 2006[1929].

BERBER SARDINHA. T. Linguística de Corpus: histórico e problemática. D.E.L.T.A., São Paulo, v. 16, n.2, p. 323-367, 2000.

______. Linguística de Corpus. São Paulo: Manole, 2004.

BIBER, Douglas. Representativeness in Corpus Design. Literary and Linguistic Computing, Oxford, v.8, n.4, p. 243-257, 1993.

BOWKER, L; PEARSON, J. Working with Specialized Language: a practical guide to using corpora. Londres: Routledge, 2002.

FARACO, C. A. Linguagem e Diálogo: ideias linguísticas do círculo de Bakhtin. São Paulo: Parábola, 2009.

FUNDAÇÃO DE ECONOMIA E ESTATÍSTICA DO RS. Coredes. Disponível em: <https://www.fee.rs.gov.br/perfil-socioeconomico/coredes/>. Acesso em 17 de abril de 2019.

GERALDI, J.W. Portos de Passagem. 4ª ed. São Paulo: Martins Fontes, 1997.Kennedy (1998),

MARCHIORO, M. Z. A análise linguística e o texto dissertativo-argumentativo: um olhar sobre o ensino de língua portuguesa. Uniletras. Ponta Grossa, v. 32, n. 1, p.9-30, jan./jun. 2010.

MOTTIN, L. Análise da produção metafórica no Brazilian English Learner Corpus. Dissertação (mestrado em Letras). Pontifícia Universidade Católica do Rio Grande do Sul, Porto Alegre, 2012.

PACHECO, A. A aquisição de morfemas em inglês como L2: uma análise dos padrões evolutivos através do BELC (Brazilian English Learner Corpus). Tese (doutorado em Teoria e Análise Linguística). Universidade Federal do Rio Grande do Sul, Porto Alegre, 2010.

RAMBO, A. G. ; VIANNA, G. M. . Mecanismos de governança e escalas do desenvolvimento: considerações sobre o Colegiado Territorial e o Conselho Regional de Desenvolvimento no Litoral Norte Gaúcho. In: IV Seminário de desenvolvimento regional, estado e sociedade: democracia e desigualdades regionais, 2018, Palmas. Anais do IV Seminário de desenvolvimento regional, estado e sociedade: democracia e desigualdades regionais, 2018. p. 422-436.

RIO GRANDE DO SUL. Constituição estadual de 1989. Disponível em: <http://www2.al.rs.gov.br/dal/LinkClick.aspx?fileticket=9p-X_3esaNg%3D&tabid=3683&mid=5358> Acesso em 17 de abril de 2019,

_____. Regiões Funcionais. Disponível em: <https://planejamento.rs.gov.br/28-regioes>. Acesso em 17 de abril de 2019.

SARMENTO, S. Linguística de Corpus: histórico, metodologia, campos de aplicação. Revista Trama. Vol. 6, n. 12, p. 87-107, 2010.

TAGNIN, S. A multilingual learner corpus in Brazil. In: WILSON. A; ARCHER, D; RAYSON, P. (Org.). Corpus linguistics around the world. Amsterdam - New York: Rodopi, p.195-202, 2006.

______; FROMM, G. CoMaprend – a experiência da construção de um corpus de aprendizes para estudo. Domínios de Lingu@gem, Uberlândia, v.2, n.2, 2008. Não paginado.

Publicado
2019-06-21
Seção
Artigos Acadêmicos