Como medimos
O theRef não cria opiniões. Quantifica o consenso de especialistas e compara-o com as decisões reais do árbitro. Todas as métricas derivam desses dois elementos.
1. Os casos
Cada caso é um lance relevante de um jogo de alta visibilidade — um penalty, um cartão vermelho, uma falta não assinalada — que foi analisado por especialistas.
Os especialistas (analistas, jornalistas, ex-árbitros) avaliam cada caso com um de três veredictos:
Correcto
decisão acertada
Aceitável
pode-se defender
Erro
decisão errada
O conjunto dessas avaliações forma o consenso — sem depender da opinião de nenhum especialista em particular.
2. As métricas
Probabilidade de que a decisão devesse ter sido tomada, segundo os especialistas.
Calculada a partir dos veredictos: Correcto vale 1,0 · Aceitável vale 0,5 · Erro vale 0. O xD é a média ponderada.
Exemplo: 2 Correctos + 1 Erro = (1 + 1 + 0) / 3 = xD = 0,67
Distância entre o que o árbitro fez e o que era esperado. Quanto mais próximo de 0, mais alinhado com o consenso.
A decisão real é binária: o árbitro actuou (1) ou não actuou (0).
RDD = |decisão real − xD| · Por árbitro: média de todos os casos
Taxa de acerto nas grandes decisões com consenso claro — penalties e cartões vermelhos onde os especialistas concordam (xD ≥ 0,7 ou xD ≤ 0,3).
Considera correcto quando:
- xD ≥ 0,7 e árbitro decidiu — esperava-se a decisão, foi dada
- xD ≤ 0,3 e árbitro não decidiu — não se esperava decisão, não foi dada
BCA = decisões correctas / total de lances filtrados
Revela a direcção do desvio: o árbitro tende a decidir mais ou menos do que o consenso espera?
- DBI positivo — apita mais do que o esperado (mais rigoroso que o consenso)
- DBI negativo — apita menos do que o esperado (mais permissivo que o consenso)
- DBI ≈ 0 — calibrado face ao consenso
O RDD re-calculado dando mais peso aos lances de maior impacto no jogo. Um erro num penalty a decidir o campeonato conta mais do que um erro numa falta sem consequências.
Comparando wRDD com RDD simples: wRDD > RDD significa que o árbitro piora precisamente nos momentos mais importantes.
3. Os labels
Cada árbitro recebe um único label, atribuído automaticamente por prioridade. Requer um mínimo de 5 casos analisados — sem dados suficientes, o label é Sem Registo.
RDD médio > 0,4
As decisões desviam-se significativamente do consenso de forma consistente.
BCA ≥ 90%
Acerta em 9 de cada 10 grandes decisões com consenso claro.
BCA ≥ 75%
Bom nível de precisão nas decisões mais importantes.
Nenhuma das anteriores
Sem padrão claro — tanto pode acertar como errar nos lances decisivos.
Menos de 5 casos
Ainda não esteve em momentos com análise suficiente para uma conclusão.
Todas as métricas são calculadas a partir de avaliações de especialistas reais e publicadas. O theRef não forma opiniões sobre árbitros — traduz o que os especialistas disseram em números comparáveis.