Apresentar grandes modelos de
linguagem (LLM, do inglês Large Language Models) descrever a
probabilidade de ocorrência de sentenças de
linguagens naturais. O emprego de tais modelos levou o desempenho de
sistemas de processamento de linguagem natural
(NLP, do inglês Natural Languagem Processing), em particular de agentes
conversacionais, a níveis compatíveis com aplicações reais.
Isto atraiu grande interesse tanto acadêmico quanto do mercado, que já
oferece um vasto número de aplicações, sistemas e serviços
de e baseados em LLM. Este curso tem por objetivo introduzir os
principais atuais sistemas de LLM e apresentar suas principais
aplicações em NLP.
Serão cobertos tanto modelos proprietários (por exemplo, GPT4 da OpenAI e
Claude da Anthropic) quanto modelos abertos (p.ex.,
Phi3 da Microsoft e LLama3 Meta). O curso será focado em questões
práticas do uso de LLMs, com foco em: Prompt Engineering,
Retrieval-Augmented Generation e Finetuning. Espera-se que os
concluintes sejam capazes de compreender os principais conceitos
teóricos e desenvolver aplicações eficazes.
- Docente: Denis Deratani Mauá
- Docente: Guilherme Yambanis Thomaz
Curso Oficial PRCEU: Não