Glossário Tekne de termos de Machine Learning
Glossário Tekne de termos de Machine Learning
Este glossário de termos de Machine Learning foi criado para ajudar quem está começando a entender os principais termos técnicos da área. O universo do Machine Learning pode ser fascinante — mas, para quem está começando, o vocabulário técnico costuma ser uma das primeiras barreiras. Expressões como overfitting, feature engineering, validação cruzada ou função de perda surgem com frequência em artigos, cursos e entrevistas, muitas vezes sem explicação clara.
Pensando nisso, criamos este glossário Tekne, com os principais termos que você encontrará ao longo do seu aprendizado e nas trilhas formativas da escola. A ideia aqui não é apenas definir, mas contextualizar: mostrar como esses conceitos se aplicam na prática, por que são importantes e onde você vai encontrá-los.
Se você está começando agora sua jornada em ML — ou quer revisar os fundamentos com mais profundidade — este conteúdo foi feito para você.
A – C
Algoritmo
Conjunto finito de regras ou instruções que definem como transformar dados de entrada em saída. Em ML, podemos usar algoritmos como redes neurais, Random Forest e SVM para encontrar padrões e fazer previsões .
Aprendizado supervisionado
Método em que o modelo aprende com dados rotulados (com respostas conhecidas). Ele ajusta parâmetros para minimizar o erro entre previsões e valores reais, usando técnicas como regressão e classificação .
Aprendizado não supervisionado
Modelo identifica padrões em dados sem rótulos. Exemplos: clustering (agrupamento), redução de dimensionalidade (PCA). Muito usado em detecção de segmentos de clientes – tekne.school.
Acurácia (Accuracy)
Percentual de previsões corretas sobre o total. Boa métrica em datasets equilibrados, mas pode falhar com classes desbalanceadas, onde precisão e recall fazem mais sentido – medium.com.
Bias (Viés)
Erro sistemático nas previsões do modelo. Pode vir de dados ou escolhas do algoritmo. Viés elevado reduz capacidade de generalização.
D – H
Dados de treino / validação / teste
Dados de treino ajustam o modelo; validação serve para hiperparâmetro; teste avalia desempenho final com dados novos – wikipedia
Deep Learning
Subconjunto de ML utilizando redes neurais profundas (várias camadas), ideal para visão computacional e processamento de linguagem .
Feature (Atributo)
Variável usada como entrada do modelo. Pode ser diretamente coletada ou criada via feature engineering — como datas convertidas ou combinações de variáveis .
Feature Engineering
Arte de criar variáveis derivadas que facilitam o aprendizado do modelo — por exemplo, extração de dia da semana ou agregações temporais .
I – M
Hyperparameter
Parâmetros definidos antes do treinamento (por exemplo número de árvores em Random Forest). Exigem tuning via grid search ou otimização Bayesiana tekne.school+1medium.com+1.
Inferência
Fase em que o modelo treinado gera previsões com novos dados — em lote ou tempo real .
Loss Function (Função de perda)
Métrica que quantifica o erro do modelo (MSE, cross-entropy). O objetivo do treinamento é minimizar essa função.
Modelo
Instância final após treinamento dos dados. Pode ser serializado (pickle, ONNX) e utilizado em produção.
N – Z
Neural Network (Rede Neural)
Sistema com camadas de neurônios artificiais conectados. Capacitado a aprender relações complexas entre dados .
Overfitting
Modelo ajustado demais aos dados de treino, aprendendo ruídos. Performa mal em dados novos.
Pipeline de ML
Sequência estruturada: coleta de dados → pré-processamento → treinamento → avaliação → deploy.
Random Forest
Ensemble de árvores de decisão. Combina diversas árvores para melhorar precisão e reduzir overfitting.
Regressão
Predictivo contínuo: estima valores numéricos (ex: preço, temperatura).
Tokenização
Técnica de NLP que divide texto em “tokens” (palavras ou sílabas) para processamento .
Validação cruzada
Método robusto que divide dados em múltiplos folds para evitar overfitting e avaliar desempenho geral.
Underfitting
Modelo muito simples que não aprende padrões relevantes — o oposto de overfitting.
Como reforçar seu aprendizado
Confira o glossário oficial do Google para profundidade adicional:
🔗 https://developers.google.com/machine-learning/glossary ml-cheatsheet.readthedocs.io+3developers.google.com+3developers.google.com+3
E se quiser aprender a aplicar esses conceitos de forma prática, o Bootcamp de Machine Learning & IA da Tekne oferece um percurso completo — da teoria à produção de modelos — com projetos reais e suporte especializado.
Conclusão
Dominar o vocabulário é essencial para seguir com confiança no universo de ML. Com este glossário, você ganha clareza técnica e inicia sua formação com base sólida. Mas a verdadeira profundidade está na aplicação — e é isso que a Tekne oferece com metodologia robusta, foco em projeto e mentoria contínua.
Quer continuar sua jornada de aprendizado?
🔗 Inscreva-se no Bootcamp de Machine Learning & IA da Tekne!