CrUX no BigQuery

Saiba como os dados da CrUX são estruturados no BigQuery.

Introdução

Os dados brutos do Relatório de experiência do usuário do Chrome (CrUX) estão disponíveis no BigQuery, um banco de dados hospedado no Google Cloud.

Com a CrUX no BigQuery, os usuários podem consultar diretamente o conjunto de dados completo desde 2017, por exemplo, para analisar tendências, comparar tecnologias da Web e fazer comparativos de domínios.

Os dados são estruturados por lançamento mensal, além de várias tabelas de resumo para facilitar o acesso e a consulta.

Os dados do BigQuery são a base do painel da CrUX, que permite visualizar esses dados sem escrever consultas SQL.

Acessar o conjunto de dados

Para usar o BigQuery, é preciso ter uma conta do Google Cloud e conhecimento básico de SQL. O conjunto de dados da CrUX no BigQuery é sem custo financeiro para acesso e exploração até os limites do nível sem custo financeiro, que é renovado mensalmente e fornecido pelo BigQuery. Além disso, novos usuários do Google Cloud podem se qualificar para um crédito de inscrição para cobrir despesas além do nível sem custo financeiro. É necessário informar um cartão de crédito para o projeto do Google Cloud. Consulte Por que preciso informar um cartão de crédito?.

Se esta for sua primeira vez usando o BigQuery, siga estas etapas para configurar um projeto:

  1. Acesse Criar um projeto no console do Google Cloud.
  2. Dê um nome ao novo projeto, como "Meu relatório de experiência do usuário do Chrome", e clique em "Criar".
  3. Forneça suas informações de faturamento se for necessário.
  4. Navegue até o conjunto de dados da CrUX no BigQuery.

Agora você pode começar a consultar o conjunto de dados.

Organização do projeto

Os dados da CrUX no BigQuery são lançados na segunda terça-feira do mês seguinte. Cada mês é lançado como uma nova tabela em chrome-ux-report.all. Há também várias tabelas materializadas que fornecem estatísticas resumidas para cada mês.

Esquema detalhado da tabela

As tabelas brutas de cada país e o conjunto de dados all são fornecidos por ano e mês.

Tabelas brutas

As tabelas brutas têm o seguinte esquema:

  • origin
  • effective_connection_type
  • form_factor
  • first_paint
  • first_contentful_paint
  • largest_contentful_paint
  • dom_content_loaded
  • onload
  • layout_instability
    • cumulative_layout_shift
  • interaction_to_next_paint
  • round_trip_time
  • navigation_types
    • navigate
    • navigate_cache
    • reload
    • restore
    • back_forward
    • back_forward_cache
    • prerender
  • experimental
    • permission
      • notifications
    • time_to_first_byte
    • popularity

Esquema de tabela materializada

As tabelas materializadas são fornecidas para facilitar o acesso aos dados de resumo por várias dimensões principais. Nenhum histograma é fornecido. Em vez disso, os dados de performance são agregados em frações por avaliação de performance e o valor do 75º percentil. Um conjunto de linhas de exemplo da tabela metrics_summary é mostrado neste exemplo:

yyyymm origem fast_lcp avg_lcp slow_lcp p75_lcp
202204 https://example.com 0,9056 0,0635 0,0301 1600
202203 https://example.com 0,9209 0,052 0,0274 1400
202202 https://example.com 0,9169 0,0545 0,0284 1500
202201 https://example.com 0,9072 0,0626 0,0298 1500

Isso mostra que, no conjunto de dados de 202204, 90,56% das experiências de usuários reais em https://example.com atenderam aos critérios de LCP boa, e que o valor aproximado do 75º percentil da LCP foi de 1.600 ms. Isso é um pouco mais lento do que nos meses anteriores.

Quatro tabelas materializadas são fornecidas:

metrics_summary
principais métricas por mês e origem
device_summary
principais métricas por mês, origem e tipo de dispositivo
country_summary
principais métricas por mês, origem, tipo de dispositivo e país
origin_summary
uma lista de todas as origens incluídas no conjunto de dados

metrics_summary

A tabela metrics_summary contém estatísticas resumidas para cada origem e conjunto de dados mensal:

yyyymm
Mês do período de coleta de dados
origin
URL da origem do site
rank
Ranking de popularidade aproximado (em março de 2021)
[small|medium|large]_cls
fração do tráfego por limites de CLS
[fast|avg|slow]_<metric>
fração do tráfego por limites de performance
[low|medium|high]_rtt
fração do tráfego por limites de RTT
p75_<metric>
Valor do 75º percentil das métricas de performance (milissegundos)
notification_permission_[accept|deny|ignore|dismiss]
Fração de comportamentos de permissão de notificação
[desktop|phone|tablet]Density
fração do tráfego por formato
[_4G|_3G|_2G|slow2G|offline]Density
fração do tráfego por tipo de conexão efetiva (calculada com base nos histogramas rtt de fevereiro de 2025, sem dados off-line)
navigation_type_[navigate|navigate_cache|reload|restore|back_forward|back_forward_cache|prerender]
fração de tipos de navegação

device_summary

A tabela device_summary contém estatísticas agregadas por mês, origem, país e dispositivo. Além das colunas metrics_summary, há:

device
Formato
do dispositivo

country_summary

A tabela country_summary contém estatísticas agregadas por mês, origem, país e dispositivo. Além das colunas metrics_summary, há:

country_code
Código do país com duas letras
device
Formato
do dispositivo

origin_summary

A tabela origin_summary contém uma lista de todas as origens no conjunto de dados da CrUX. Ela é atualizada mensalmente com a lista mais recente de origens no conjunto de dados e tem uma única coluna: origin.

Conjunto de dados experimental

As tabelas no conjunto de dados experimental são cópias exatas das tabelas padrão do YYYYMM, mas usam recursos mais novos e avançados do BigQuery, como particionamento e clustering, que permitem escrever consultas mais rápidas, simples e baratas.

country

O conjunto de dados experimental.country contém dados agregados dos conjuntos country_CC com uma coluna yyyymm adicional para a data do conjunto de dados. O esquema é idêntico às tabelas brutas, com a adição das colunas de data e country_code, permitindo que comparações no nível do país em consultas de período sejam executadas sem mesclar as tabelas mensais.

global

O conjunto de dados experimental.global contém dados agregados do conjunto all com uma coluna yyyymm adicional para a data do conjunto de dados. O esquema é idêntico às tabelas brutas, com a adição da data, permitindo que consultas de comparação ao longo do tempo sejam executadas sem unir as tabelas mensais.