数据开发-字段加工 202503

机型

SELECT terrace_id,keyword

  keyword,
  -- 设备型号(保留原始格式)
  TRIM(SUBSTRING_INDEX(keyword, ' - ', 1)) AS device_model,
  
  -- 操作系统名称(统一小写)
  LOWER(TRIM(SUBSTRING_INDEX(SUBSTRING_INDEX(keyword, ' - ', -1), ' ', 1))) AS os_name,
  
  -- 版本号(兼容纯数字和多级版本)
  TRIM(
    REGEXP_REPLACE(
      SUBSTRING_INDEX(SUBSTRING_INDEX(keyword, ' - ', -1), ' ', -1), 
      '[^0-9.]', 
      ''
    )
  ) AS os_version
FROM ad_entry
where entry_date >= '2024-01-01' and entry_date <'2025-03-01'
			and keyword REGEXP 'ios' -- 'ios|and'

在这里插入图片描述

年龄、城市、性别

# 用户人群属性分布:-----------------------------------------------------------------

WITH t as (

# 清洗city
SELECT terrace_id
			,age,sex,

TRIM(                                    -- 清除首尾空格
        REPLACE(                             -- 替换处理
            REPLACE(city, '|', ''),          -- 先删除所有 |
            '市', ''                         -- 再删除所有 市(可能误删中间字符)
        )
				
				) city
FROM ad_entry
where entry_date >= '2024-01-01' and entry_date <'2025-03-01'
)
SELECT terrace_id
			,age
      ,CASE
					WHEN age < 18 THEN '18岁以下'
					WHEN age BETWEEN 19 AND 24 THEN '19~24岁'
					WHEN age BETWEEN 25 AND 30 THEN '25~30岁'
					WHEN age BETWEEN 31 AND 35 THEN '31~35岁'
					WHEN age BETWEEN 36 AND 40 THEN '36~40岁'
					WHEN age BETWEEN 41 AND 45 THEN '41~45岁'
          ELSE '46岁以上'
			END AS age_group
		 ,sex
		 ,city
		 ,CASE 
					WHEN city IS null or city = '' THEN '无法识别'
					-- 一线城市(4个)
					WHEN city IN ('北京','上海','广州','深圳') THEN '一线'

					-- 新一线城市(15个)
					WHEN city IN ('成都','杭州','重庆','苏州','武汉','西安','南京','长沙','天津','郑州','东莞','无锡','宁波','青岛','合肥') THEN '新一线'

					-- 二线城市(30个)
					WHEN city IN ('佛山','济南','昆明','厦门','福州','沈阳','大连','长春','哈尔滨','南昌','南宁','石家庄','太原','贵阳','乌鲁木齐','温州','常州','南通','珠海','中山','惠州','嘉兴','绍兴','烟台','潍坊','临沂','洛阳','徐州','海口','兰州') THEN '二线'

					-- 三线城市(70个)
					WHEN city IN ('淄博','泉州','扬州','镇江','泰州','台州','芜湖','盐城','邯郸','保定','襄阳','宜昌','赣州','九江','柳州','桂林','遵义','绵阳','大理','三亚','西宁','银川','拉萨','包头','鄂尔多斯','鞍山','锦州','吉林','营口','沧州','衡阳','株洲','岳阳','常德','漳州','莆田','三明','宁德','东营','威海','日照','连云港','淮安','宿迁','衢州','丽水','湖州','金华','江门','清远','肇庆','揭阳','湛江','韶关','潮州','梅州','汕尾','阳江','茂名','云浮','北海','玉林','钦州','防城港','百色','贵港','河池','湘潭','汕头') THEN '三线'

					-- 四线城市(90个)
					WHEN city IN ('邢台','衡水','承德','张家口','晋中','运城','临汾','吕梁','赤峰','通辽','呼伦贝尔','盘锦','铁岭','朝阳','阜新','辽阳','葫芦岛','四平','通化','白山','松原','白城','佳木斯','牡丹江','鸡西','双鸭山','鹤岗','伊春','七台河','黑河','绥化','铜陵','安庆','黄山','滁州','阜阳','宿州','六安','亳州','池州','宣城','抚州','景德镇','萍乡','新余','鹰潭','吉安','宜春','上饶','信阳','周口','驻马店','南阳','商丘','三门峡','安阳','濮阳','许昌','漯河','平顶山','开封','黄石','十堰','荆门','孝感','荆州','黄冈','咸宁','随州','恩施','仙桃','潜江','天门','湘西','益阳','邵阳','郴州','永州','怀化','娄底','张家界','铜仁','黔东南','黔南','六盘水','安顺','毕节','曲靖','玉溪','保山','昭通','丽江','普洱','临沧','楚雄','红河','文山','西双版纳','德宏','怒江','迪庆','渭南') THEN '四线'
					
					
					-- 特殊处理
					WHEN city IN ('北苏门答腊','纽约','香港','澳门','伦敦','费城','奥克兰','曼谷','圣何塞','洛杉矶','河内','迪拜','伊斯坦布尔','温哥华','新竹','瓜达拉哈拉','哈尔科夫','约翰内斯堡','西雅图') THEN '海外'
					ELSE '四线及以下'
      END AS city_tier
FROM t;

在这里插入图片描述

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值