1. Executive Summary (TL;DR)


2. Deep Dive: A "Engine" de Personalização (Birdbrain & Beyond)

Birdbrain: Knowledge Tracing + IRT/ELO

O Birdbrain é o modelo central de personalização do Duolingo. Ele utiliza Knowledge Tracing (rastreamento de conhecimento), que estima a probabilidade do usuário acertar um exercício com base em seu histórico, e integra princípios de Item Response Theory (IRT), modelando a dificuldade dos exercícios e a proficiência do usuário em uma escala contínua (ELO-like). O objetivo é apresentar exercícios que maximizam o aprendizado, evitando tanto a frustração quanto o tédio[1][9].

Half-Life Regression (HLR): Repetição Espaçada

O algoritmo de Half-Life Regression, detalhado em artigo técnico da ACL, estima o “meio-vida” de cada palavra/conceito na memória do usuário. A cada interação, o modelo ajusta o tempo ótimo para revisão, prevendo quando o usuário está prestes a esquecer e agendando a reapresentação do item. O HLR combina variáveis como dificuldade do item, proficiência, tempo desde a última exposição e acurácia histórica, reduzindo o erro de predição de recall em mais de 45% sobre baselines clássicos e aumentando o engajamento diário em até 12%[2].

GenAI (LLMs): GPT-4 no Duolingo Max

Com o Duolingo Max (2023), o GPT-4 foi integrado em duas features principais:

Essas features diferem da IA determinística anterior por permitirem respostas abertas, feedback mais natural e adaptativo, mas também introduzem riscos de alucinação, viés e latência de inferência. A curadoria humana e o monitoramento ativo são necessários para mitigar esses riscos[10].


3. Engenharia de Engajamento & Métricas (Growth AI)

Bandit Algorithms para Notificações Push