Baseado no manual do GSI (Gridpoint Statistical Interpolation), os principais métodos de controle de qualidade (QC) aplicados aos dados observacionais no processo de assimilação incluem:
- Os erros associados às observações são continuamente ajustados e calibrados.
- Inicialmente tratados como não correlacionados, mas avanços recentes no GSI incluem erros espectralmente correlacionados, usando estimativas baseadas em métodos de Desroziers et al. (2005).
- Implementado para dados in situ.
- Utiliza distribuições robustas como a Huber norm.
- O VarQC não rejeita observações: repondera aquelas com grandes inovações (obs – background), reduzindo seu peso na análise.
- Isso permite flexibilizar ou substituir o gross check, aproveitando mais dados sem comprometer a robustez.
Aplicadas em paralelo ao VarQC:
- Gross Check (checagem grosseira): remove observações com desvios muito grandes em relação ao background.
- Buddy Check: compara observações vizinhas (espacial/temporal) para detecção de outliers.
- Thinning / Superobbing: redução ou agregação de dados redundantes (especialmente satélite e radar).
- Fundamental para radiâncias de satélite.
- Inclui correção de viés variacional (VarBC) combinada com QC.
- Evita erros sistemáticos ao usar sensores orbitais.
Exemplos:
- Radiossondas de alta resolução (BUFR): ajustes específicos antes do uso operacional.
- GNSS-RO: QC modernizado para lidar com fortes gradientes na PBL.
- Radar e AMVs: filtros próprios, incluindo correções de erro correlacionado.
O GSI combina métodos clássicos (gross/buddy checks, filtros específicos), atribuição adaptativa de erros, correção de vieses e, mais recentemente, o VarQC, que permite aproveitar um conjunto maior de observações, mas com ponderação diferenciada segundo sua confiabilidade.
| Método de QC | Descrição | Vantagens | Limitações |
|---|---|---|---|
| VarQC (Quality Control Variacional) | Usa funções robustas (ex.: Huber norm) para reponderar observações com grandes inovações (obs – background). Não rejeita dados, apenas reduz o peso na análise. | Aproveita mais observações; robustez contra outliers; substitui em parte o gross check. | Pode incluir dados de baixa qualidade, ainda que com peso reduzido. |
| Gross Check | Elimina observações com desvios muito grandes em relação ao campo de background. | Simples e eficiente para remover outliers extremos. | Pode descartar observações válidas em regiões de forte gradiente (frentes, convecção). |
| Buddy Check | Compara observações vizinhas (espacial/temporal) para detectar inconsistências. | Aumenta a confiabilidade ao rejeitar dados isolados incoerentes. | Requer densidade suficiente de observações; pode falhar em regiões de baixa cobertura. |
| Thinning / Superobbing | Reduz ou agrega observações redundantes, especialmente de satélite e radar. | Diminui correlação entre erros; reduz custo computacional. | Perda de parte da informação de alta resolução. |
| Atribuição de Erros de Observação | Define e ajusta erros observacionais, incluindo métodos para erros correlacionados (Desroziers et al. 2005). | Melhor representação estatística; aumenta consistência da análise. | Estimativas dependem de amostras representativas; erros podem ser mal caracterizados. |
| Bias Correction (Correção de Viés) | Ajusta sistematicamente observações (especialmente radiâncias) antes da assimilação. Pode ser variacional (VarBC). | Essencial para uso de satélites; reduz erros sistemáticos. | Requer monitoramento constante; risco de “aprender” erros do modelo. |
| Filtros Específicos por Tipo de Dado | Aplicações particulares: radiossondas (BUFR), GNSS-RO, AMVs, radar, etc., cada um com rotinas próprias de QC. | Ajusta o QC às características de cada sensor; aumenta a utilidade dos dados. | Complexidade maior; depende de conhecimento especializado de cada observação. |
Abaixo está um “deep-dive” dos métodos de controle de qualidade (QC) mais usados no GSI, com ênfase na formulação variacional, onde a função-custo de DA é tipicamente
onde
No GSI, muitos tipos de dados usam convinfo, satinfo) e ajustes automáticos por qualidade, altitude, etc. Parâmetros de erro e gross check por tipo/subtipo são configuráveis em convinfo (p.ex., cgross, cermax, cermin). (dtcenter.org)
Para satélites hiperespectrais (IASI, CrIS), há inter-correlações entre canais. Uma forma é escrever
Uma ferramenta prática para aferir
Status no ecossistema NOAA/NCEP: diretrizes recentes enfatizam expandir o uso de VarQC (com Huber) e enfrentar erros correlacionados — sobretudo em condições all-sky. (repository.library.noaa.gov)
O VarQC clássico modela o erro de observação como mistura: com probabilidade
onde
Na prática operacional europeia e mais recentemente no ecossistema NOAA, usa-se a Huber norm:
que é quadrática na região central (gaussiana) e linear nas caudas (robusta). Impactos positivos para dados in situ foram documentados no ECMWF; a NOAA/NCEP tem avançado com VQC baseado em Huber (NCEP-VQC). (ECMWF)
No GSI, VarQC com Huber foi incorporado para in situ (e segue em expansão), mantendo o espírito de reponderação (em vez de rejeição “dura”). (repository.library.noaa.gov)
Objetivo: rejeitar valores com
em que convinfo (campos cgross, cermax, cermin). Para Ensemble (EnSRF/EnKF), há parâmetros equivalentes (p.ex., sprd_tol, varqc, huber). (dtcenter.org)
Verifica a consistência local comparando uma observação
A formulação moderna é frequentemente Bayesiana/multivariada (Ingleby & Lorenc), combinando informação de vários vizinhos para inferir a probabilidade de “erro grosso”. (RMETS)
Thinning reduz correlação de erro e custo computacional impondo malha mínima (e.g., ithin_conv, rmesh_conv em convinfo). Superobbing agrega
se
A correção de viés é crítica para radiâncias. No VarBC, o viés é modelado como
Isso permite ajuste adaptativo e “ancoragem” por observações estáveis (superfície, radiossondas) para evitar que a correção aprenda viés do modelo. (leg.ufpr.br)
Checagens de consistência vertical (p.ex., razão de variação térmica), limites físicos (UR, vento), janelas temporais e de tracking da estação; no GSI, a aceitação e as janelas de tempo/altura são tratadas nos leitores/rotinas de pré-QC e no próprio gross check. (dtcenter.org)
QC fortemente dependente da altitude (camada limite) e de indicadores de qualidade de retrieval (p.ex., LSW – logarithm of spectral width). Esquemas LSW-dependentes rejeitam perfis com viés sistêmico na baixa troposfera. A assimilação direta de bending angle com checagens à la
Uso de Quality Indicator (QI)/Expected Error (EE) e filtros de altura/consistência dinâmica (coerência do campo, speed bias). Limiarizações de QI (p.ex., QI ≥ 60) e thinning são práticas correntes. (journals.ametsoc.org)
Checagens de dealiasing, eco de solo/ruído, filtros por intensidade/altura e superobbing polar para reduzir correlações. A especificação de
-
Parâmetros em
convinfo:cgross(limiar gross),cermax/cermin(faixas de erro),cvar_b/cvar_pg(VarQC),ithin_conv,rmesh_conv(thinning). (nco.ncep.noaa.gov) -
Listas de uso/rejeição:
uselist/rejection listcontrolam habilitação por estação/sensor além dos QC internos. (dtcenter.org) -
Diagnósticos para ajuste de
$\mathbf{R}$ : use estatísticas$(O!-!B)$ e$(O!-!A)$ (método de Desroziers) para checar consistência entre pesos/erros. (meteo.physik.lmu.de)
Aqui está um cheat-sheet em Markdown consolidando os métodos de QC do GSI (baseado no manual e no documento NOAA/NCEP/EMC Strategy), com exemplos de parâmetros típicos em convinfo e blocos de namelist relevantes para VarQC/Huber, listas de rejeição e thinning.
- VarQC/Huber norm: repondera inovações extremas sem rejeição dura.
- Gross check: rejeição com limiar de desvio normalizado.
- Buddy check: consistência espaço-temporal entre vizinhos.
- Thinning / Superobbing: redução de dados redundantes.
- Bias correction (VarBC): correção de viés em radiâncias.
- Filtros específicos: AMVs (QI), GNSS-RO (LSW), radiossondas BUFR, radar.
! varname type kx error gross cvar_b cvar_pg ithin_conv rmesh_conv
ps 120 120 1.50 10.0 1.0 1.0 1 145.0
t 120 120 1.00 7.0 1.0 1.0 1 145.0
uv 220 220 1.50 8.0 1.0 1.0 1 145.0
- error: σ da observação.
- gross: limiar do gross check (|O-B|/σ).
- cvar_b / cvar_pg: parâmetros VarQC.
- ithin_conv / rmesh_conv: opções de thinning (ativação e distância em km).
Arquivos externos listam estações/sensores a usar ou rejeitar:
! uselist.txt
72451
72452
! rejection_list.txt
72295
72297
- uselist → força inclusão (se passar QC).
- rejection → rejeita independentemente do QC.
&qc_var_settings
varqc = .true. ! ativa VarQC
huber = .true. ! usa norma de Huber
huber_k = 2.0 ! parâmetro de corte (|O-B|/σ)
gross_fac = 10.0 ! fator do gross check
sprd_tol = 5.0 ! tolerância para ensemble spread
/- huber_k controla a transição entre quadrático e linear.
- Valores típicos: 1.5 – 2.5 (ajustar por tipo de dado).
&thinning_settings
ithin_conv = 1 ! ativa thinning conv.
rmesh_conv = 145.0 ! malha mínima (km)
ithin_rad = 1 ! thinning em radiâncias
rmesh_rad = 75.0
superob = .true. ! ativa superobbing
/- Distâncias típicas: 145 km (convencional), 75 km (radiância).
- Superobbing recomendado para radar e satélite de alta resolução.
- Ajuste σ e gross em
convinfo. - Ative VarQC/Huber no
namelist. - Defina listas
uselist/rejectionconforme monitoramento. - Ajuste thinning por tipo de dado (convencional, satélite, radar).
- Monitore estatísticas (O-B, O-A) e use diagnósticos de Desroziers para validar erros.
- VarQC e Huber: Andersson & Järvinen (1999); Tavolato & Isaksen (2014/2015). (RMETS)
- Diagnóstico de erros (R, B): Desroziers et al. (2005). (Sistema de Dados de Astrofísica)
- Erros correlacionados em radiâncias: Stewart et al. (2014); Bormann et al. (2015). (RMETS)
- GSI – Guias do Usuário (v3.5/v3.6) e Advanced Guide: DTCenter (2016–2017). (dtcenter.org)
- Diretrizes NOAA/NCEP recentes: Data Assimilation Strategy for NOAA/NWS/NCEP/EMC (2024). (repository.library.noaa.gov)
- Buddy/Bayesian QC: Ingleby & Lorenc (1993). (RMETS)
- GNSS-RO QC (LSW, bending angle): Healy & Thépaut (2006); Liu et al. (2018). (RMETS)
- AMVs (QI/EE): Bedka et al. (2005); Wanzong et al. (2012). (journals.ametsoc.org)
-
Comece simples: gross check e erros
$\sigma$ coerentes com as estatísticas$(O!-!B)$ . Valide com Desroziers. (meteo.physik.lmu.de) -
Habilite VarQC (Huber) para in situ quando houver caudas pesadas; ajuste
$\kappa$ (tuning conservador). (ECMWF) -
Radiâncias: cuide primeiro de VarBC; só então explore
$\mathbf{R}$ correlacionado (comece por submatrizes/channels-clusters para evitar condicionamento ruim). (leg.ufpr.br) -
Dados densos (AMV, radar): thinning/superobbing com célula e erro ajustados à correlação esperada (
$\rho$ ). (Tellus A)