Como medimos

O theRef não cria opiniões. Quantifica o consenso de especialistas e compara-o com as decisões reais do árbitro. Todas as métricas derivam desses dois elementos.

1. Os casos

Cada caso é um lance relevante de um jogo de alta visibilidade — um penalty, um cartão vermelho, uma falta não assinalada — que foi analisado por especialistas.

Os especialistas (analistas, jornalistas, ex-árbitros) avaliam cada caso com um de três veredictos:

Correcto

decisão acertada

Aceitável

pode-se defender

Erro

decisão errada

O conjunto dessas avaliações forma o consenso — sem depender da opinião de nenhum especialista em particular.

2. As métricas

xDExpected Decision — Decisão Esperada

Probabilidade de que a decisão devesse ter sido tomada, segundo os especialistas.

Calculada a partir dos veredictos: Correcto vale 1,0 · Aceitável vale 0,5 · Erro vale 0. O xD é a média ponderada.

Exemplo: 2 Correctos + 1 Erro = (1 + 1 + 0) / 3 = xD = 0,67

RDDReferee Decision Delta — Desvio Decisório

Distância entre o que o árbitro fez e o que era esperado. Quanto mais próximo de 0, mais alinhado com o consenso.

A decisão real é binária: o árbitro actuou (1) ou não actuou (0).

RDD = |decisão real − xD| · Por árbitro: média de todos os casos

BCABig Call Accuracy — Precisão nos Lances-Chave

Taxa de acerto nas grandes decisões com consenso claro — penalties e cartões vermelhos onde os especialistas concordam (xD ≥ 0,7 ou xD ≤ 0,3).

Considera correcto quando:

xD ≥ 0,7 e árbitro decidiu — esperava-se a decisão, foi dada
xD ≤ 0,3 e árbitro não decidiu — não se esperava decisão, não foi dada

BCA = decisões correctas / total de lances filtrados

DBIDecision Bias Index — Tendência Decisória

Revela a direcção do desvio: o árbitro tende a decidir mais ou menos do que o consenso espera?

DBI positivo — apita mais do que o esperado (mais rigoroso que o consenso)
DBI negativo — apita menos do que o esperado (mais permissivo que o consenso)
DBI ≈ 0 — calibrado face ao consenso

wRDDWeighted RDD — Desvio Ponderado por Impacto

O RDD re-calculado dando mais peso aos lances de maior impacto no jogo. Um erro num penalty a decidir o campeonato conta mais do que um erro numa falta sem consequências.

Comparando wRDD com RDD simples: wRDD > RDD significa que o árbitro piora precisamente nos momentos mais importantes.

3. Os labels

Cada árbitro recebe um único label, atribuído automaticamente por prioridade. Requer um mínimo de 5 casos analisados — sem dados suficientes, o label é Sem Registo.

High Risk

RDD médio > 0,4

As decisões desviam-se significativamente do consenso de forma consistente.

Sólido

BCA ≥ 90%

Acerta em 9 de cada 10 grandes decisões com consenso claro.

Consistente

BCA ≥ 75%

Bom nível de precisão nas decisões mais importantes.

Imprevisível

Nenhuma das anteriores

Sem padrão claro — tanto pode acertar como errar nos lances decisivos.

Sem Registo

Menos de 5 casos

Ainda não esteve em momentos com análise suficiente para uma conclusão.

Todas as métricas são calculadas a partir de avaliações de especialistas reais e publicadas. O theRef não forma opiniões sobre árbitros — traduz o que os especialistas disseram em números comparáveis.