Glossário Tekne de termos de Machine Learning

Glossário Tekne de termos de Machine Learning

Este glossário de termos de Machine Learning foi criado para ajudar quem está começando a entender os principais termos técnicos da área. O universo do Machine Learning pode ser fascinante — mas, para quem está começando, o vocabulário técnico costuma ser uma das primeiras barreiras. Expressões como overfitting, feature engineering, validação cruzada ou função de perda surgem com frequência em artigos, cursos e entrevistas, muitas vezes sem explicação clara.

Pensando nisso, criamos este glossário Tekne, com os principais termos que você encontrará ao longo do seu aprendizado e nas trilhas formativas da escola. A ideia aqui não é apenas definir, mas contextualizar: mostrar como esses conceitos se aplicam na prática, por que são importantes e onde você vai encontrá-los.

Se você está começando agora sua jornada em ML — ou quer revisar os fundamentos com mais profundidade — este conteúdo foi feito para você.

A – C

Algoritmo
Conjunto finito de regras ou instruções que definem como transformar dados de entrada em saída. Em ML, podemos usar algoritmos como redes neurais, Random Forest e SVM para encontrar padrões e fazer previsões .

Aprendizado supervisionado
Método em que o modelo aprende com dados rotulados (com respostas conhecidas). Ele ajusta parâmetros para minimizar o erro entre previsões e valores reais, usando técnicas como regressão e classificação .

Aprendizado não supervisionado
Modelo identifica padrões em dados sem rótulos. Exemplos: clustering (agrupamento), redução de dimensionalidade (PCA). Muito usado em detecção de segmentos de clientes –  tekne.school.

Acurácia (Accuracy)
Percentual de previsões corretas sobre o total. Boa métrica em datasets equilibrados, mas pode falhar com classes desbalanceadas, onde precisão e recall fazem mais sentido –  medium.com.

Bias (Viés)
Erro sistemático nas previsões do modelo. Pode vir de dados ou escolhas do algoritmo. Viés elevado reduz capacidade de generalização.

D – H

Dados de treino / validação / teste
Dados de treino ajustam o modelo; validação serve para hiperparâmetro; teste avalia desempenho final com dados novos  – wikipedia

Deep Learning
Subconjunto de ML utilizando redes neurais profundas (várias camadas), ideal para visão computacional e processamento de linguagem .

Feature (Atributo)
Variável usada como entrada do modelo. Pode ser diretamente coletada ou criada via feature engineering — como datas convertidas ou combinações de variáveis .

Feature Engineering
Arte de criar variáveis derivadas que facilitam o aprendizado do modelo — por exemplo, extração de dia da semana ou agregações temporais .

I – M

Hyperparameter
Parâmetros definidos antes do treinamento (por exemplo número de árvores em Random Forest). Exigem tuning via grid search ou otimização Bayesiana tekne.school+1medium.com+1.

Inferência
Fase em que o modelo treinado gera previsões com novos dados — em lote ou tempo real .

Loss Function (Função de perda)
Métrica que quantifica o erro do modelo (MSE, cross-entropy). O objetivo do treinamento é minimizar essa função.

Modelo
Instância final após treinamento dos dados. Pode ser serializado (pickle, ONNX) e utilizado em produção.

N – Z

Neural Network (Rede Neural)
Sistema com camadas de neurônios artificiais conectados. Capacitado a aprender relações complexas entre dados .

Overfitting
Modelo ajustado demais aos dados de treino, aprendendo ruídos. Performa mal em dados novos.

Pipeline de ML
Sequência estruturada: coleta de dados → pré-processamento → treinamento → avaliação → deploy.

Random Forest
Ensemble de árvores de decisão. Combina diversas árvores para melhorar precisão e reduzir overfitting.

Regressão
Predictivo contínuo: estima valores numéricos (ex: preço, temperatura).

Tokenização
Técnica de NLP que divide texto em “tokens” (palavras ou sílabas) para processamento .

Validação cruzada
Método robusto que divide dados em múltiplos folds para evitar overfitting e avaliar desempenho geral.

Underfitting
Modelo muito simples que não aprende padrões relevantes — o oposto de overfitting.

Como reforçar seu aprendizado

Confira o glossário oficial do Google para profundidade adicional:
🔗 https://developers.google.com/machine-learning/glossary ml-cheatsheet.readthedocs.io+3developers.google.com+3developers.google.com+3

E se quiser aprender a aplicar esses conceitos de forma prática, o Bootcamp de Machine Learning & IA da Tekne oferece um percurso completo — da teoria à produção de modelos — com projetos reais e suporte especializado.

Conclusão

Dominar o vocabulário é essencial para seguir com confiança no universo de ML. Com este glossário, você ganha clareza técnica e inicia sua formação com base sólida. Mas a verdadeira profundidade está na aplicação — e é isso que a Tekne oferece com metodologia robusta, foco em projeto e mentoria contínua.

Quer continuar sua jornada de aprendizado?

🔗 Inscreva-se no Bootcamp de Machine Learning & IA da Tekne!

Pesquisar

Posts Recentes

Categorias