A enorme quantidade de dados disponíveis às organizações públicas e privadas, somadas aos constantes avanços da capacidade computacional disponível, permitiu que os algoritmos de aprendizado de máquina se tornassem uma ferramenta essencial nos negócios e nas pesquisas.

Nesse tipo de algoritmo, dados são usados como a fonte principal de informação para chegar a conclusões significativas, isto é, conhecimento.

As formas principais de aprendizado de máquina são:

  • Aprendizado supervisionado, onde os dados disponíveis possuem tanto características que podem ser analisadas quanto valores que desejamos prever. Nesse caso, são usados como exemplos para gerar modelos, normalmente de regressão ou de classificação.
  • Aprendizado não-supervisionado, onde os dados disponíveis apresentam apenas as características a serem analisadas, mas o resultado é gerado automaticamente, normalmente na forma de agrupamentos que realçam alguma propriedade.
  • Aprendizado semi-supervisionado, onde o problema tem uma forma híbrida das duas anteriores.
  • Aprendizado por reenforço, normalmente feito on-line e onde cada modelo é testado dinamicamente contra um ambiente real ou simulado, e é alterado de acordo com seu sucesso ou fracasso.

Os algoritmos de maior sucesso hoje em dia no aprendizado de máquina são as Redes Neurais Profundas, e ainda outras formas de redes neurais, como as Redes Neurais Adversáriais. No caso de texto, por exemplo, as redes LSTM ou as baseadas em atenção, como a BERT, definem os melhores resultados encontrados.

Outros problemas podem se mostrar tratáveis com algoritmos tradicionais, como SVM, ou até mesmo algoritmos bastante simples como Knn ou K-vizinhos mais próximos.

Muitas dissertações e teses foram defendidas nessa área, uma das mais fortes da linha, por exemplo:

  • Seleção Genética e Agrupamento por Dissimilaridade de Atributos Binários
  • Considerando o Ruído no Aprendizado de Modelos Preditivos Robustos para a Filtragem Colaborativa
  • Relationship Between Detected Events in Online Media
  • Agrupamentos Múltiplos Não-Redundantes em Grafos com Atributos
  • Predição do Desempenho Acadêmico de Graduandos Utilizando Mineração de Dados Educacionais
  • Captura de Dados de Proveniência para Apoiar a Análise de Hiperparâmetros em Redes de Aprendizado Profundo
  • Uma Estrutura para Execução de Redes Neurais Evolutivas na GPU
  • Encaminhamento de Tickets que Exigem Formação de Grupos por Classificação de Texto
  • Aplicação de Rede Neural Sem Peso e Locality-Sensitive Hashing para o Problema de Cold-Start Item em Filtragem Colaborativa

Além disso, a linha atualmente trabalha com a classificação e interpretação de textos jurídicos em Português, usando algoritmos no estado da arte, como o BERT.