Blame - libavcodec/rv60dec.c - chromium/third_party/ffmpeg

blob: 8ec95e896f048b945adb663713ddcbc72df7aec2 [file] [log] [blame]

Peter Ross	33802e7	2024-11-02 23:53:15	[diff] [blame]	1	/*
				2	* RV60 decoder
				3	* Copyright (c) 2007 Mike Melanson, Konstantin Shishkov
				4	* Copyright (C) 2023 Peter Ross
				5	*
				6	* This file is part of FFmpeg.
				7	*
				8	* FFmpeg is free software; you can redistribute it and/or
				9	* modify it under the terms of the GNU Lesser General Public
				10	* License as published by the Free Software Foundation; either
				11	* version 2.1 of the License, or (at your option) any later version.
				12	*
				13	* FFmpeg is distributed in the hope that it will be useful,
				14	* but WITHOUT ANY WARRANTY; without even the implied warranty of
				15	* MERCHANTABILITY or FITNESS FOR A PARTICULAR PURPOSE. See the GNU
				16	* Lesser General Public License for more details.
				17	*
				18	* You should have received a copy of the GNU Lesser General Public
				19	* License along with FFmpeg; if not, write to the Free Software
				20	* Foundation, Inc., 51 Franklin Street, Fifth Floor, Boston, MA 02110-1301 USA
				21	*/
				22
				23	#include "avcodec.h"
				24	#include "codec_internal.h"
				25	#include "decode.h"
				26	#include "get_bits.h"
				27	#include "golomb.h"
				28	#include "libavutil/mem.h"
				29	#include "rv60data.h"
				30	#include "rv60dsp.h"
				31	#include "rv60vlcs.h"
				32	#include "threadprogress.h"
				33	#include "unary.h"
				34	#include "videodsp.h"
				35
				36	static const int8_t frame_types[4] = {AV_PICTURE_TYPE_I, AV_PICTURE_TYPE_P, AV_PICTURE_TYPE_B, AV_PICTURE_TYPE_NONE};
				37
				38	enum CUType {
				39	CU_INTRA = 0,
				40	CU_INTER_MV,
				41	CU_SKIP,
				42	CU_INTER
				43	};
				44
				45	enum PUType {
				46	PU_FULL = 0,
				47	PU_N2HOR,
				48	PU_N2VER,
				49	PU_QUARTERS,
				50	PU_N4HOR,
				51	PU_N34HOR,
				52	PU_N4VER,
				53	PU_N34VER
				54	};
				55
				56	enum IntraMode {
				57	INTRAMODE_INDEX = 0,
				58	INTRAMODE_DC64,
				59	INTRAMODE_PLANE64,
				60	INTRAMODE_MODE
				61	};
				62
				63	enum MVRefEnum {
				64	MVREF_NONE,
				65	MVREF_REF0,
				66	MVREF_REF1,
				67	MVREF_BREF,
				68	MVREF_REF0ANDBREF,
				69	MVREF_SKIP0,
				70	MVREF_SKIP1,
				71	MVREF_SKIP2,
				72	MVREF_SKIP3
				73	};
				74
				75	static const uint8_t skip_mv_ref[4] = {MVREF_SKIP0, MVREF_SKIP1, MVREF_SKIP2, MVREF_SKIP3};
				76
				77	enum {
				78	TRANSFORM_NONE = 0,
				79	TRANSFORM_16X16,
				80	TRANSFORM_8X8,
				81	TRANSFORM_4X4
				82	};
				83
				84	static const VLCElem * cbp8_vlc[7][4];
				85	static const VLCElem * cbp16_vlc[7][3][4];
				86
				87	typedef struct {
				88	const VLCElem * l0[2];
				89	const VLCElem * l12[2];
				90	const VLCElem * l3[2];
				91	const VLCElem * esc;
				92	} CoeffVLCs;
				93
				94	static CoeffVLCs intra_coeff_vlc[5];
				95	static CoeffVLCs inter_coeff_vlc[7];
				96
				97	#define MAX_VLC_SIZE 864
				98	static VLCElem table_data[129148];
				99
				100	/* 32-bit version of rv34_gen_vlc */
				101	static const VLCElem * gen_vlc(const uint8_t * bits, int size, VLCInitState * state)
				102	{
				103	int counts[17] = {0};
				104	uint32_t codes[18];
				105	uint32_t cw[MAX_VLC_SIZE];
				106
				107	for (int i = 0; i < size; i++)
				108	counts[bits[i]]++;
				109
				110	codes[0] = counts[0] = 0;
				111	for (int i = 0; i < 17; i++)
				112	codes[i+1] = (codes[i] + counts[i]) << 1;
				113
				114	for (int i = 0; i < size; i++)
				115	cw[i] = codes[bits[i]]++;
				116
				117	return ff_vlc_init_tables(state, 9, size,
				118	bits, 1, 1,
				119	cw, 4, 4, 0);
				120	}
				121
				122	static void build_coeff_vlc(const CoeffLens * lens, CoeffVLCs * vlc, int count, VLCInitState * state)
				123	{
				124	for (int i = 0; i < count; i++) {
				125	for (int j = 0; j < 2; j++) {
				126	vlc[i].l0[j] = gen_vlc(lens[i].l0[j], 864, state);
				127	vlc[i].l12[j] = gen_vlc(lens[i].l12[j], 108, state);
				128	vlc[i].l3[j] = gen_vlc(lens[i].l3[j], 108, state);
				129	}
				130	vlc[i].esc = gen_vlc(lens[i].esc, 32, state);
				131	}
				132	}
				133
				134	static av_cold void rv60_init_static_data(void)
				135	{
				136	VLCInitState state = VLC_INIT_STATE(table_data);
				137
				138	for (int i = 0; i < 7; i++)
				139	for (int j = 0; j < 4; j++)
				140	cbp8_vlc[i][j] = gen_vlc(rv60_cbp8_lens[i][j], 64, &state);
				141
				142	for (int i = 0; i < 7; i++)
				143	for (int j = 0; j < 3; j++)
				144	for (int k = 0; k < 4; k++)
				145	cbp16_vlc[i][j][k] = gen_vlc(rv60_cbp16_lens[i][j][k], 64, &state);
				146
				147	build_coeff_vlc(rv60_intra_lens, intra_coeff_vlc, 5, &state);
				148	build_coeff_vlc(rv60_inter_lens, inter_coeff_vlc, 7, &state);
				149	}
				150
				151	typedef struct {
				152	int sign;
				153	int size;
				154	const uint8_t * data;
				155	int data_size;
				156	} Slice;
				157
				158	typedef struct {
				159	int cu_split_pos;
				160	uint8_t cu_split[1+4+16+64];
				161
				162	uint8_t coded_blk[64];
				163
				164	uint8_t avg_buffer[6464 + 3232*2];
				165	uint8_t * avg_data[3];
				166	int avg_linesize[3];
				167	} ThreadContext;
				168
				169	typedef struct {
				170	int16_t x;
				171	int16_t y;
				172	} MV;
				173
				174	typedef struct {
				175	enum MVRefEnum mvref;
				176	MV f_mv;
				177	MV b_mv;
				178	} MVInfo;
				179
				180	typedef struct {
				181	enum IntraMode imode;
				182	MVInfo mv;
				183	} BlockInfo;
				184
				185	typedef struct {
				186	enum CUType cu_type;
				187	enum PUType pu_type;
				188	} PUInfo;
				189
				190	typedef struct RV60Context {
				191	AVCodecContext * avctx;
				192	VideoDSPContext vdsp;
				193
				194	#define CUR_PIC 0
				195	#define LAST_PIC 1
				196	#define NEXT_PIC 2
				197	AVFrame *last_frame[3];
				198
				199	int pict_type;
				200	int qp;
				201	int osvquant;
				202	int ts;
				203	int two_f_refs;
				204	int qp_off_type;
				205	int deblock;
				206	int deblock_chroma;
				207	int awidth;
				208	int aheight;
				209	int cu_width;
				210	int cu_height;
				211
				212	Slice * slice;
				213
				214	int pu_stride;
				215	PUInfo * pu_info;
				216
				217	int blk_stride;
				218	BlockInfo * blk_info;
				219
				220	int dblk_stride;
				221	uint8_t * left_str;
				222	uint8_t * top_str;
				223
				224	uint64_t ref_pts[2], ts_scale;
				225	uint32_t ref_ts[2];
				226
				227	struct ThreadProgress *progress;
				228	unsigned nb_progress;
				229	} RV60Context;
				230
				231	static int progress_init(RV60Context *s, unsigned count)
				232	{
				233	if (s->nb_progress < count) {
				234	void tmp = av_realloc_array(s->progress, count, sizeof(s->progress));
				235	if (!tmp)
				236	return AVERROR(ENOMEM);
				237	s->progress = tmp;
				238	memset(s->progress + s->nb_progress, 0, (count - s->nb_progress) * sizeof(*s->progress));
				239	for (int i = s->nb_progress; i < count; i++) {
				240	int ret = ff_thread_progress_init(&s->progress[i], 1);
				241	if (ret < 0)
				242	return ret;
				243	s->nb_progress = i + 1;
				244	}
				245	}
				246
				247	for (int i = 0; i < count; i++)
				248	ff_thread_progress_reset(&s->progress[i]);
				249
				250	return 0;
				251	}
				252
				253	static av_cold int rv60_decode_init(AVCodecContext * avctx)
				254	{
				255	static AVOnce init_static_once = AV_ONCE_INIT;
				256	RV60Context *s = avctx->priv_data;
				257
				258	s->avctx = avctx;
				259
				260	ff_videodsp_init(&s->vdsp, 8);
				261
				262	avctx->pix_fmt = AV_PIX_FMT_YUV420P;
				263
				264	for (int i = 0; i < 3; i++) {
				265	s->last_frame[i] = av_frame_alloc();
				266	if (!s->last_frame[i])
				267	return AVERROR(ENOMEM);
				268	}
				269
				270	ff_thread_once(&init_static_once, rv60_init_static_data);
				271
				272	return 0;
				273	}
				274
				275	static int update_dimensions_clear_info(RV60Context *s, int width, int height)
				276	{
				277	int ret;
				278
				279	if (width != s->avctx->width \|\| height != s->avctx->height) {
				280
				281	av_log(s->avctx, AV_LOG_INFO, "changing dimensions to %dx%d\n", width, height);
				282
				283	for (int i = 0; i < 3; i++)
				284	av_frame_unref(s->last_frame[i]);
				285
				286	if ((ret = ff_set_dimensions(s->avctx, width, height)) < 0)
				287	return ret;
				288
				289	if (s->avctx->width <= 64 \|\| s->avctx->height <= 64)
				290	av_log(s->avctx, AV_LOG_WARNING, "unable to faithfully reproduce emulated edges; expect visual artefacts\n");
				291	}
				292
				293	s->awidth = FFALIGN(width, 16);
				294	s->aheight = FFALIGN(height, 16);
				295
				296	s->cu_width = (width + 63) >> 6;
				297	s->cu_height = (height + 63) >> 6;
				298
				299	s->pu_stride = s->cu_width << 3;
				300	s->blk_stride = s->cu_width << 4;
				301
				302	if ((ret = av_reallocp_array(&s->slice, s->cu_height, sizeof(s->slice[0]))) < 0)
				303	return ret;
				304
				305	if ((ret = av_reallocp_array(&s->pu_info, s->pu_stride * (s->cu_height << 3), sizeof(s->pu_info[0]))) < 0)
				306	return ret;
				307
				308	if ((ret = av_reallocp_array(&s->blk_info, s->blk_stride * (s->cu_height << 4), sizeof(s->blk_info[0]))) < 0)
				309	return ret;
				310
				311	for (int j = 0; j < s->cu_height << 4; j++)
				312	for (int i = 0; i < s->cu_width << 4; i++)
				313	s->blk_info[j*s->blk_stride + i].mv.mvref = MVREF_NONE;
				314
				315	if (s->deblock) {
				316	int size;
				317
				318	s->dblk_stride = s->awidth >> 2;
				319
				320	size = s->dblk_stride * (s->aheight >> 2);
				321
				322	if ((ret = av_reallocp_array(&s->top_str, size, sizeof(s->top_str[0]))) < 0)
				323	return ret;
				324
				325	if ((ret = av_reallocp_array(&s->left_str, size, sizeof(s->left_str[0]))) < 0)
				326	return ret;
				327
				328	memset(s->top_str, 0, size);
				329	memset(s->left_str, 0, size);
				330	}
				331
				332	return 0;
				333	}
				334
				335	static int read_code012(GetBitContext * gb)
				336	{
				337	if (!get_bits1(gb))
				338	return 0;
				339	return get_bits1(gb) + 1;
				340	}
				341
				342	static int read_frame_header(RV60Context s, GetBitContext gb, int * width, int * height)
				343	{
				344	if (get_bits(gb, 2) != 3)
				345	return AVERROR_INVALIDDATA;
				346
				347	skip_bits(gb, 2);
				348	skip_bits(gb, 4);
				349
				350	s->pict_type = frame_types[get_bits(gb, 2)];
				351	if (s->pict_type == AV_PICTURE_TYPE_NONE)
				352	return AVERROR_INVALIDDATA;
				353
				354	s->qp = get_bits(gb, 6);
				355	skip_bits1(gb);
				356	skip_bits(gb, 2);
				357	s->osvquant = get_bits(gb, 2);
				358	skip_bits1(gb);
				359	skip_bits(gb, 2);
				360	s->ts = get_bits(gb, 24);
				361	width = (get_bits(gb, 11) + 1) 4;
				362	height = get_bits(gb, 11) 4;
				363	skip_bits1(gb);
				364	if (s->pict_type == AV_PICTURE_TYPE_I) {
				365	s->two_f_refs = 0;
				366	} else {
				367	if (get_bits1(gb))
				368	skip_bits(gb, 3);
				369	s->two_f_refs = get_bits1(gb);
				370	}
				371	read_code012(gb);
				372	read_code012(gb);
				373	s->qp_off_type = read_code012(gb);
				374	s->deblock = get_bits1(gb);
				375	s->deblock_chroma = s->deblock && !get_bits1(gb);
				376
				377	if (get_bits1(gb)) {
				378	int count = get_bits(gb, 2);
				379	if (count) {
				380	skip_bits(gb, 2);
				381	for (int i = 0; i < count; i++)
				382	for (int j = 0; j < 2 << i; j++)
				383	skip_bits(gb, 8);
				384	}
				385	}
				386
				387	return 0;
				388	}
				389
				390	static int read_slice_sizes(RV60Context s, GetBitContext gb)
				391	{
				392	int nbits = get_bits(gb, 5) + 1;
				393	int last_size, sum = 0;
				394
				395	for (int i = 0; i < s->cu_height; i++)
				396	s->slice[i].sign = get_bits1(gb);
				397
				398	s->slice[0].size = last_size = sum = get_bits(gb, nbits);
				399
				400	for (int i = 1; i < s->cu_height; i++) {
				401	int diff = get_bits(gb, nbits);
				402	if (s->slice[i].sign)
				403	last_size += diff;
				404	else
				405	last_size -= diff;
				406	if (last_size <= 0)
				407	return AVERROR_INVALIDDATA;
				408	s->slice[i].size = last_size;
				409	sum += s->slice[i].size;
				410	}
				411
				412	align_get_bits(gb);
				413	return 0;
				414	}
				415
				416	static int read_intra_mode(GetBitContext * gb, int * param)
				417	{
				418	if (get_bits1(gb)) {
				419	*param = read_code012(gb);
				420	return INTRAMODE_INDEX;
				421	} else {
				422	*param = get_bits(gb, 5);
				423	return INTRAMODE_MODE;
				424	}
				425	}
				426
				427	static int has_top_block(const RV60Context * s, int xpos, int ypos, int dx, int dy, int size)
				428	{
				429	return ypos + dy && xpos + dx + size <= s->awidth;
				430	}
				431
				432	static int has_left_block(const RV60Context * s, int xpos, int ypos, int dx, int dy, int size)
				433	{
				434	return xpos + dx && ypos + dy + size <= s->aheight;
				435	}
				436
				437	static int has_top_right_block(const RV60Context * s, int xpos, int ypos, int dx, int dy, int size)
				438	{
				439	if (has_top_block(s, xpos, ypos, dx, dy, size * 2)) {
				440	int cxpos = ((xpos + dx) & 63) >> ff_log2(size);
				441	int cypos = ((ypos + dy) & 63) >> ff_log2(size);
				442	return !(rv60_avail_mask[cxpos] & cypos);
				443	}
				444	return 0;
				445	}
				446
				447	static int has_left_down_block(const RV60Context * s, int xpos, int ypos, int dx, int dy, int size)
				448	{
				449	if (has_left_block(s, xpos, ypos, dx, dy, size * 2)) {
				450	int cxpos = (~(xpos + dx) & 63) >> ff_log2(size);
				451	int cypos = (~(ypos + dy) & 63) >> ff_log2(size);
				452	return rv60_avail_mask[cxpos] & cypos;
				453	}
				454	return 0;
				455	}
				456
				457	typedef struct {
				458	uint8_t t[129];
				459	uint8_t l[129];
				460	int has_t;
				461	int has_tr;
				462	int has_l;
				463	int has_ld;
				464	} IntraPredContext;
				465
				466	typedef struct {
				467	int xpos;
				468	int ypos;
				469	int pu_pos;
				470	int blk_pos;
				471
				472	enum CUType cu_type;
				473	enum PUType pu_type;
				474	enum IntraMode imode[4];
				475	int imode_param[4];
				476	MVInfo mv[4];
				477
				478	IntraPredContext ipred;
				479	} CUContext;
				480
				481	static void ipred_init(IntraPredContext * i)
				482	{
				483	memset(i->t, 0x80, sizeof(i->t));
				484	memset(i->l, 0x80, sizeof(i->l));
				485	i->has_t = i->has_tr = i->has_l = i->has_ld = 0;
				486	}
				487
				488	static void populate_ipred(const RV60Context * s, CUContext * cu, uint8_t * src, int stride, int xoff, int yoff, int size, int is_luma)
				489	{
				490	if (is_luma)
				491	src += (cu->ypos + yoff) * stride + cu->xpos + xoff;
				492	else
				493	src += (cu->ypos >> 1) * stride + (cu->xpos >> 1);
				494
				495	ipred_init(&cu->ipred);
				496
				497	if (cu->ypos + yoff > 0) {
				498	cu->ipred.has_t = 1;
				499
				500	memcpy(cu->ipred.t + 1, src - stride, size);
				501
				502	if ((is_luma && has_top_right_block(s, cu->xpos, cu->ypos, xoff, yoff, size)) \|\|
				503	(!is_luma && has_top_right_block(s, cu->xpos, cu->ypos, 0, 0, size << 1))) {
				504	cu->ipred.has_tr = 1;
				505	memcpy(cu->ipred.t + size + 1, src - stride + size, size);
				506	} else
				507	memset(cu->ipred.t + size + 1, cu->ipred.t[size], size);
				508
				509	if (cu->xpos + xoff > 0)
				510	cu->ipred.t[0] = src[-stride - 1];
				511	}
				512
				513	if (cu->xpos + xoff > 0) {
				514	cu->ipred.has_l = 1;
				515
				516	for (int y = 0; y < size; y++)
				517	cu->ipred.l[y + 1] = src[y*stride - 1];
				518
				519	if ((is_luma && has_left_down_block(s, cu->xpos, cu->ypos, xoff, yoff, size)) \|\|
				520	(!is_luma && has_left_down_block(s, cu->xpos, cu->ypos, 0, 0, size << 1))) {
				521	cu->ipred.has_ld = 1;
				522	for (int y = size; y < size * 2; y++)
				523	cu->ipred.l[y + 1] = src[y*stride - 1];
				524	} else
				525	memset(cu->ipred.l + size + 1, cu->ipred.l[size], size);
				526
				527	if (cu->ypos + yoff > 0)
				528	cu->ipred.l[0] = src[-stride - 1];
				529	}
				530	}
				531
				532	static void pred_plane(const IntraPredContext * p, uint8_t * dst, int stride, int size)
				533	{
				534	int lastl = p->l[size + 1];
				535	int lastt = p->t[size + 1];
				536	int tmp1[64], tmp2[64];
				537	int top_ref[64], left_ref[64];
				538	int shift;
				539
				540	for (int i = 0; i < size; i++) {
				541	tmp1[i] = lastl - p->t[i + 1];
				542	tmp2[i] = lastt - p->l[i + 1];
				543	}
				544
				545	shift = ff_log2(size) + 1;
				546	for (int i = 0; i < size; i++) {
				547	top_ref[i] = p->t[i + 1] << (shift - 1);
				548	left_ref[i] = p->l[i + 1] << (shift - 1);
				549	}
				550
				551	for (int y = 0; y < size; y++) {
				552	int add = tmp2[y];
				553	int sum = left_ref[y] + size;
				554	for (int x = 0; x < size; x++) {
				555	int v = tmp1[x] + top_ref[x];
				556	sum += add;
				557	top_ref[x] = v;
				558	dst[y*stride + x] = (sum + v) >> shift;
				559	}
				560	}
				561	}
				562
				563	static void pred_dc(const IntraPredContext * p, uint8_t * dst, int stride, int size, int filter)
				564	{
				565	int dc;
				566
				567	if (!p->has_t && !p->has_l)
				568	dc = 0x80;
				569	else {
				570	int sum = 0;
				571	if (p->has_t)
				572	for (int x = 0; x < size; x++)
				573	sum += p->t[x + 1];
				574	if (p->has_l)
				575	for (int y = 0; y < size; y++)
				576	sum += p->l[y + 1];
				577	if (p->has_t && p->has_l)
				578	dc = (sum + size) / (size * 2);
				579	else
				580	dc = (sum + size / 2) / size;
				581	}
				582
				583	for (int y = 0; y < size; y++)
				584	memset(dst + y*stride, dc, size);
				585
				586	if (filter && p->has_t && p->has_l) {
				587	dst[0] = (p->t[1] + p->l[1] + 2 * dst[0] + 2) >> 2;
				588	for (int x = 1; x < size; x++)
				589	dst[x] = (p->t[x + 1] + 3 * dst[x] + 2) >> 2;
				590	for (int y = 1; y < size; y++)
				591	dst[ystride] = (p->l[y + 1] + 3 dst[y*stride] + 2) >> 2;
				592	}
				593	}
				594
				595	static void filter_weak(uint8_t * dst, const uint8_t * src, int size)
				596	{
				597	dst[0] = src[0];
				598	for (int i = 1; i < size - 1; i++)
				599	dst[i] = (src[i - 1] + 2*src[i] + src[i + 1] + 2) >> 2;
				600	dst[size - 1] = src[size - 1];
				601	}
				602
				603	static void filter_bilin32(uint8_t * dst, int v0, int v1, int size)
				604	{
				605	int diff = v1 - v0;
				606	int sum = (v0 << 5) + (1 << (5 - 1));
				607	for (int i = 0; i < size; i++) {
				608	dst[i] = sum >> 5;
				609	sum += diff;
				610	}
				611	}
				612
				613	static void pred_hor_angle(uint8_t * dst, int stride, int size, int weight, const uint8_t * src)
				614	{
				615	int sum = 0;
				616	for (int x = 0; x < size; x++) {
				617	int off, frac;
				618	sum += weight;
				619	off = (sum >> 5) + 32;
				620	frac = sum & 0x1F;
				621	if (!frac)
				622	for (int y = 0; y < size; y++)
				623	dst[y*stride + x] = src[off + y];
				624	else {
				625	for (int y = 0; y < size; y++) {
				626	int a = src[off + y];
				627	int b = src[off + y + 1];
				628	dst[ystride + x] = ((32 - frac) a + frac * b + 16) >> 5;
				629	}
				630	}
				631	}
				632	}
				633
				634	static void pred_ver_angle(uint8_t * dst, int stride, int size, int weight, const uint8_t * src)
				635	{
				636	int sum = 0;
				637	for (int y = 0; y < size; y++) {
				638	int off, frac;
				639	sum += weight;
				640	off = (sum >> 5) + 32;
				641	frac = sum & 0x1F;
				642	if (!frac)
				643	memcpy(dst + y*stride, src + off, size);
				644	else {
				645	for (int x = 0; x < size; x++) {
				646	int a = src[off + x];
				647	int b = src[off + x + 1];
				648	dst[ystride + x] = ((32 - frac) a + frac * b + 16) >> 5;
				649	}
				650	}
				651	}
				652	}
				653
				654	static int pred_angle(const IntraPredContext * p, uint8_t * dst, int stride, int size, int imode, int filter)
				655	{
				656	uint8_t filtered1[96], filtered2[96];
				657
				658	if (!imode) {
				659	pred_plane(p, dst, stride, size);
				660	} else if (imode == 1) {
				661	pred_dc(p, dst, stride, size, filter);
				662	} else if (imode <= 9) {
				663	int ang_weight = rv60_ipred_angle[10 - imode];
				664	int add_size = (size * ang_weight + 31) >> 5;
				665	if (size <= 16) {
				666	filter_weak(filtered1 + 32, &p->l[1], size + add_size);
				667	} else {
				668	filter_bilin32(filtered1 + 32, p->l[1], p->l[33], 32);
				669	filter_bilin32(filtered1 + 64, p->l[32], p->l[64], add_size);
				670	}
				671	pred_hor_angle(dst, stride, size, ang_weight, filtered1);
				672	} else if (imode == 10) {
				673	if (size <= 16)
				674	filter_weak(filtered1 + 32, &p->l[1], size);
				675	else
				676	filter_bilin32(filtered1 + 32, p->l[1], p->l[33], 32);
				677	for (int y = 0; y < size; y++)
				678	for (int x = 0; x < size; x++)
				679	dst[y*stride + x] = filtered1[32 + y];
				680	if (filter) {
				681	int tl = p->t[0];
				682	for (int x = 0; x < size; x++)
				683	dst[x] = av_clip_uint8(dst[x] + ((p->t[x + 1] - tl) >> 1));
				684	}
				685	} else if (imode <= 17) {
				686	int ang_weight = rv60_ipred_angle[imode - 10];
				687	int inv_angle = rv60_ipred_inv_angle[imode - 10];
				688	int add_size = (size * ang_weight + 31) >> 5;
				689	if (size <= 16) {
				690	memcpy(filtered1 + 32 - 1, p->l, size + 1);
				691	memcpy(filtered2 + 32 - 1, p->t, size + 1);
				692	} else {
				693	filtered1[32 - 1] = p->l[0];
				694	filter_bilin32(filtered1 + 32, p->l[0], p->l[32], 32);
				695	filtered2[32 - 1] = p->t[0];
				696	filter_bilin32(filtered2 + 32, p->t[0], p->t[32], 32);
				697	}
				698	if (add_size > 1) {
				699	int sum = 0x80;
				700	for (int i = 1; i < add_size; i++) {
				701	sum += inv_angle;
				702	filtered1[32 - 1 - i] = filtered2[32 - 1 + (sum >> 8)];
				703	}
				704	}
				705	pred_hor_angle(dst, stride, size, -ang_weight, filtered1);
				706	} else if (imode <= 25) {
				707	int ang_weight = rv60_ipred_angle[26 - imode];
				708	int inv_angle = rv60_ipred_inv_angle[26 - imode];
				709	int add_size = (size * ang_weight + 31) >> 5;
				710	if (size <= 16) {
				711	memcpy(filtered1 + 32 - 1, p->t, size + 1);
				712	memcpy(filtered2 + 32 - 1, p->l, size + 1);
				713	} else {
				714	filtered1[32 - 1] = p->t[0];
				715	filter_bilin32(filtered1 + 32, p->t[0], p->t[32], 32);
				716	filtered2[32 - 1] = p->l[0];
				717	filter_bilin32(filtered2 + 32, p->l[0], p->l[32], 32);
				718	}
				719	if (add_size > 1) {
				720	int sum = 0x80;
				721	for (int i = 1; i < add_size; i++) {
				722	sum += inv_angle;
				723	filtered1[32 - 1 - i] = filtered2[32 - 1 + (sum >> 8)];
				724	}
				725	}
				726	pred_ver_angle(dst, stride, size, -ang_weight, filtered1);
				727	} else if (imode == 26) {
				728	if (size <= 16)
				729	filter_weak(&filtered1[32], &p->t[1], size);
				730	else
				731	filter_bilin32(filtered1 + 32, p->t[1], p->t[33], 32);
				732	for (int i = 0; i < size; i++)
				733	memcpy(dst + i*stride, filtered1 + 32, size);
				734	if (filter) {
				735	int tl = p->l[0];
				736	for (int y = 0; y < size; y++)
				737	dst[ystride] = av_clip_uint8(dst[ystride] + ((p->l[y+1] - tl) >> 1));
				738	}
				739	} else if (imode <= 34) {
				740	int ang_weight = rv60_ipred_angle[imode - 26];
				741	int add_size = (size * ang_weight + 31) >> 5;
				742	if (size <= 16)
				743	filter_weak(&filtered1[32], &p->t[1], size + add_size);
				744	else {
				745	filter_bilin32(filtered1 + 32, p->t[1], p->t[33], 32);
				746	filter_bilin32(filtered1 + 64, p->t[32], p->t[64], add_size);
				747	}
				748	pred_ver_angle(dst, stride, size, ang_weight, filtered1);
				749	} else
				750	return AVERROR_INVALIDDATA;
				751	return 0;
				752	}
				753
				754	static int pu_is_intra(const PUInfo * pu)
				755	{
				756	return pu->cu_type == CU_INTRA;
				757	}
				758
				759	static int ipm_compar(const void * a, const void * b)
				760	{
				761	return (const enum IntraMode )a - (const enum IntraMode )b;
				762	}
				763
				764	#define MK_UNIQUELIST(name, type, max_size) \
				765	typedef struct { \
				766	type list[max_size]; \
				767	int size; \
				768	} unique_list_##name; \
				769	\
				770	static void unique_list_##name##_init(unique_list_##name * s) \
				771	{ \
				772	memset(s->list, 0, sizeof(s->list)); \
				773	s->size = 0; \
				774	} \
				775	\
				776	static void unique_list_##name##_add(unique_list_##name * s, type cand) \
				777	{ \
				778	if (s->size == max_size) \
				779	return; \
				780	\
				781	for (int i = 0; i < s->size; i++) { \
				782	if (!memcmp(&s->list[i], &cand, sizeof(type))) { \
				783	return; \
				784	} \
				785	} \
				786	s->list[s->size++] = cand; \
				787	}
				788
				789	MK_UNIQUELIST(intramode, enum IntraMode, 3)
				790	MK_UNIQUELIST(mvinfo, MVInfo, 4)
				791
				792	static int reconstruct_intra(const RV60Context * s, const CUContext * cu, int size, int sub)
				793	{
				794	int blk_pos, tl_x, tl_y;
				795	unique_list_intramode ipm_cand;
				796
				797	if (cu->imode[0] == INTRAMODE_DC64)
				798	return 1;
				799
				800	if (cu->imode[0] == INTRAMODE_PLANE64)
				801	return 0;
				802
				803	unique_list_intramode_init(&ipm_cand);
				804
				805	if (has_top_block(s, cu->xpos, cu->ypos, (sub & 1) * 4, 0, size)) {
				806	const PUInfo * pu = &s->pu_info[cu->pu_pos - s->pu_stride];
				807	if (pu_is_intra(pu))
				808	unique_list_intramode_add(&ipm_cand, s->blk_info[cu->blk_pos - s->blk_stride + (sub & 1)].imode);
				809	}
				810
				811	blk_pos = cu->blk_pos + (sub >> 1) * s->blk_stride + (sub & 1);
				812
				813	if (has_left_block(s, cu->xpos, cu->ypos, 0, (sub & 2) * 2, size)) {
				814	const PUInfo * pu = &s->pu_info[cu->pu_pos - 1];
				815	if (pu_is_intra(pu))
				816	unique_list_intramode_add(&ipm_cand, s->blk_info[blk_pos - 1 - (sub & 1)].imode);
				817	}
				818
				819	tl_x = !(sub & 2) ? (cu->xpos + (sub & 1) * 4) : cu->xpos;
				820	tl_y = cu->ypos + (sub & 2) * 4;
				821	if (tl_x > 0 && tl_y > 0) {
				822	const PUInfo * pu;
				823	switch (sub) {
				824	case 0: pu = &s->pu_info[cu->pu_pos - s->pu_stride - 1]; break;
				825	case 1: pu = &s->pu_info[cu->pu_pos - s->pu_stride]; break;
				826	default: pu = &s->pu_info[cu->pu_pos - 1];
				827	}
				828	if (pu_is_intra(pu)) {
				829	if (sub != 3)
				830	unique_list_intramode_add(&ipm_cand, s->blk_info[blk_pos - s->blk_stride - 1].imode);
				831	else
				832	unique_list_intramode_add(&ipm_cand, s->blk_info[blk_pos - s->blk_stride - 2].imode);
				833	}
				834	}
				835
				836	for (int i = 0; i < FF_ARRAY_ELEMS(rv60_candidate_intra_angles); i++)
				837	unique_list_intramode_add(&ipm_cand, rv60_candidate_intra_angles[i]);
				838
				839	if (cu->imode[sub] == INTRAMODE_INDEX)
				840	return ipm_cand.list[cu->imode_param[sub]];
				841
				842	if (cu->imode[sub] == INTRAMODE_MODE) {
				843	enum IntraMode imode = cu->imode_param[sub];
				844	qsort(ipm_cand.list, 3, sizeof(ipm_cand.list[0]), ipm_compar);
				845	for (int i = 0; i < 3; i++)
				846	if (imode >= ipm_cand.list[i])
				847	imode++;
				848	return imode;
				849	}
				850
				851	av_assert0(0); // should never reach here
				852	return 0;
				853	}
				854
				855	static int get_skip_mv_index(enum MVRefEnum mvref)
				856	{
				857	switch (mvref) {
				858	case MVREF_SKIP1: return 1;
				859	case MVREF_SKIP2: return 2;
				860	case MVREF_SKIP3: return 3;
				861	default: return 0;
				862	}
				863	}
				864
				865	static int mvinfo_valid(const MVInfo * mvi)
				866	{
				867	return mvi->mvref != MVREF_NONE;
				868	}
				869
				870	static void fill_mv_skip_cand(RV60Context * s, const CUContext * cu, unique_list_mvinfo * skip_cand, int size)
				871	{
				872	int mv_size = size >> 2;
				873
				874	if (cu->xpos > 0) {
				875	const MVInfo * mv = &s->blk_info[cu->blk_pos - 1].mv;
				876	if (mvinfo_valid(mv))
				877	unique_list_mvinfo_add(skip_cand, *mv);
				878	}
				879	if (cu->ypos > 0) {
				880	const MVInfo * mv = &s->blk_info[cu->blk_pos - s->blk_stride].mv;
				881	if (mvinfo_valid(mv))
				882	unique_list_mvinfo_add(skip_cand, *mv);
				883	}
				884	if (has_top_right_block(s, cu->xpos, cu->ypos, 0, 0, size)) {
				885	const MVInfo * mv = &s->blk_info[cu->blk_pos - s->blk_stride + mv_size].mv;
				886	if (mvinfo_valid(mv))
				887	unique_list_mvinfo_add(skip_cand, *mv);
				888	}
				889	if (has_left_down_block(s, cu->xpos, cu->ypos, 0, 0, size)) {
				890	const MVInfo * mv = &s->blk_info[cu->blk_pos + s->blk_stride * mv_size - 1].mv;
				891	if (mvinfo_valid(mv))
				892	unique_list_mvinfo_add(skip_cand, *mv);
				893	}
				894	if (has_left_block(s, cu->xpos, cu->ypos, 0, 0, size)) {
				895	const MVInfo * mv = &s->blk_info[cu->blk_pos + s->blk_stride * (mv_size - 1) - 1].mv;
				896	if (mvinfo_valid(mv))
				897	unique_list_mvinfo_add(skip_cand, *mv);
				898	}
				899	if (has_top_block(s, cu->xpos, cu->ypos, 0, 0, size)) {
				900	const MVInfo * mv = &s->blk_info[cu->blk_pos - s->blk_stride + mv_size - 1].mv;
				901	if (mvinfo_valid(mv))
				902	unique_list_mvinfo_add(skip_cand, *mv);
				903	}
				904	if (cu->xpos > 0 && cu->ypos > 0) {
				905	const MVInfo * mv = &s->blk_info[cu->blk_pos - s->blk_stride - 1].mv;
				906	if (mvinfo_valid(mv))
				907	unique_list_mvinfo_add(skip_cand, *mv);
				908	}
				909
				910	for (int i = skip_cand->size; i < 4; i++)
				911	skip_cand->list[i] = (MVInfo){.mvref=MVREF_REF0,.f_mv={0,0},.b_mv={0,0}};
				912	}
				913
				914	typedef struct {
				915	int w, h;
				916	} Dimensions;
				917
				918	static void get_mv_dimensions(Dimensions * dim, enum PUType pu_type, int part_no, int size)
				919	{
				920	int mv_size = size >> 2;
				921	switch (pu_type) {
				922	case PU_FULL:
				923	dim->w = dim->h = mv_size;
				924	break;
				925	case PU_N2HOR:
				926	dim->w = mv_size;
				927	dim->h = mv_size >> 1;
				928	break;
				929	case PU_N2VER:
				930	dim->w = mv_size >> 1;
				931	dim->h = mv_size;
				932	break;
				933	case PU_QUARTERS:
				934	dim->w = dim->h = mv_size >> 1;
				935	break;
				936	case PU_N4HOR:
				937	dim->w = mv_size;
				938	dim->h = !part_no ? (mv_size >> 2) : ((3 * mv_size) >> 2);
				939	break;
				940	case PU_N34HOR:
				941	dim->w = mv_size;
				942	dim->h = !part_no ? ((3 * mv_size) >> 2) : (mv_size >> 2);
				943	break;
				944	case PU_N4VER:
				945	dim->w = !part_no ? (mv_size >> 2) : ((3 * mv_size) >> 2);
				946	dim->h = mv_size;
				947	break;
				948	case PU_N34VER:
				949	dim->w = !part_no ? ((3 * mv_size) >> 2) : (mv_size >> 2);
				950	dim->h = mv_size;
				951	break;
				952	}
				953	}
				954
				955	static int has_hor_split(enum PUType pu_type)
				956	{
				957	return pu_type == PU_N2HOR \|\| pu_type == PU_N4HOR \|\| pu_type == PU_N34HOR \|\| pu_type == PU_QUARTERS;
				958	}
				959
				960	static int has_ver_split(enum PUType pu_type)
				961	{
				962	return pu_type == PU_N2VER \|\| pu_type == PU_N4VER \|\| pu_type == PU_N34VER \|\| pu_type == PU_QUARTERS;
				963	}
				964
				965	static int pu_type_num_parts(enum PUType pu_type)
				966	{
				967	switch (pu_type) {
				968	case PU_FULL: return 1;
				969	case PU_QUARTERS: return 4;
				970	default: return 2;
				971	}
				972	}
				973
				974	static void get_next_mv(const RV60Context * s, const Dimensions * dim, enum PUType pu_type, int part_no, int * mv_pos, int * mv_x, int * mv_y)
				975	{
				976	if (pu_type == PU_QUARTERS) {
				977	if (part_no != 1) {
				978	*mv_pos += dim->w;
				979	*mv_x += dim->w;
				980	} else {
				981	mv_pos += dim->hs->blk_stride - dim->w;
				982	*mv_x -= dim->w;
				983	*mv_y += dim->h;
				984	}
				985	} else if (has_hor_split(pu_type)) {
				986	mv_pos += dim->h s->blk_stride;
				987	*mv_y += dim->h;
				988	} else if (has_ver_split(pu_type)) {
				989	*mv_pos += dim->w;
				990	*mv_x += dim->w;
				991	}
				992	}
				993
				994	static int mv_is_ref0(enum MVRefEnum mvref)
				995	{
				996	return mvref == MVREF_REF0 \|\| mvref == MVREF_REF0ANDBREF;
				997	}
				998
				999	static int mv_is_forward(enum MVRefEnum mvref)
				1000	{
				1001	return mvref == MVREF_REF0 \|\| mvref == MVREF_REF1 \|\| mvref == MVREF_REF0ANDBREF;
				1002	}
				1003
				1004	static int mv_is_backward(enum MVRefEnum mvref)
				1005	{
				1006	return mvref == MVREF_BREF \|\| mvref == MVREF_REF0ANDBREF;
				1007	}
				1008
				1009	static int mvinfo_matches_forward(const MVInfo * a, const MVInfo * b)
				1010	{
				1011	return a->mvref == b->mvref \|\| (mv_is_ref0(a->mvref) && mv_is_ref0(b->mvref));
				1012	}
				1013
				1014	static int mvinfo_matches_backward(const MVInfo * a, const MVInfo * b)
				1015	{
				1016	return mv_is_backward(a->mvref) && mv_is_backward(b->mvref);
				1017	}
				1018
				1019	static int mvinfo_is_deblock_cand(const MVInfo * a, const MVInfo * b)
				1020	{
				1021	int diff;
				1022
				1023	if (a->mvref != b->mvref)
				1024	return 1;
				1025
				1026	diff = 0;
				1027	if (mv_is_forward(a->mvref)) {
				1028	int dx = a->f_mv.x - b->f_mv.x;
				1029	int dy = a->f_mv.y - b->f_mv.y;
				1030	diff += FFABS(dx) + FFABS(dy);
				1031	}
				1032	if (mv_is_backward(a->mvref)) {
				1033	int dx = a->b_mv.x - b->b_mv.x;
				1034	int dy = a->b_mv.y - b->b_mv.y;
				1035	diff += FFABS(dx) + FFABS(dy);
				1036	}
				1037	return diff > 4;
				1038	}
				1039
				1040	static void mv_pred(MV * ret, MV a, MV b, MV c)
				1041	{
				1042	#define MEDIAN(x) \
				1043	if (a.x < b.x) \
				1044	if (b.x < c.x) \
				1045	ret->x = b.x; \
				1046	else \
				1047	ret->x = a.x < c.x ? c.x : a.x; \
				1048	else \
				1049	if (b.x < c.x) \
				1050	ret->x = a.x < c.x ? a.x : c.x; \
				1051	else \
				1052	ret->x = b.x; \
				1053
				1054	MEDIAN(x)
				1055	MEDIAN(y)
				1056	}
				1057
				1058	static void predict_mv(const RV60Context * s, MVInfo * dst, int mv_x, int mv_y, int mv_w, const MVInfo * src)
				1059	{
				1060	int mv_pos = mv_y * s->blk_stride + mv_x;
				1061	MV f_mv, b_mv;
				1062
				1063	dst->mvref = src->mvref;
				1064
				1065	if (mv_is_forward(src->mvref)) {
				1066	MV cand[3] = {0};
				1067	int cand_size = 0;
				1068	if (mv_x > 0) {
				1069	const MVInfo * mv = &s->blk_info[mv_pos - 1].mv;
				1070	if (mvinfo_matches_forward(mv, src))
				1071	cand[cand_size++] = mv->f_mv;
				1072	}
				1073	if (mv_y > 0) {
				1074	const MVInfo * mv = &s->blk_info[mv_pos - s->blk_stride].mv;
				1075	if (mvinfo_matches_forward(mv, src))
				1076	cand[cand_size++] = mv->f_mv;
				1077	}
				1078	if (has_top_block(s, mv_x << 2, mv_y << 2, mv_w << 2, 0, 4)) {
				1079	const MVInfo * mv = &s->blk_info[mv_pos - s->blk_stride + mv_w].mv;
				1080	if (mvinfo_matches_forward(mv, src))
				1081	cand[cand_size++] = mv->f_mv;
				1082	}
				1083
				1084	switch (cand_size) {
				1085	case 1:
				1086	f_mv.x = cand[0].x;
				1087	f_mv.y = cand[0].y;
				1088	break;
				1089	case 2:
				1090	f_mv.x = (cand[0].x + cand[1].x) >> 1;
				1091	f_mv.y = (cand[0].y + cand[1].y) >> 1;
				1092	break;
				1093	case 3:
				1094	mv_pred(&f_mv, cand[0], cand[1], cand[2]);
				1095	break;
				1096	default:
				1097	f_mv = (MV){0,0};
				1098	break;
				1099	}
				1100	} else {
				1101	f_mv = (MV){0,0};
				1102	}
				1103
				1104	dst->f_mv.x = src->f_mv.x + f_mv.x;
				1105	dst->f_mv.y = src->f_mv.y + f_mv.y;
				1106
				1107	if (mv_is_backward(src->mvref)) {
				1108	MV cand[3] = {0};
				1109	int cand_size = 0;
				1110	if (mv_x > 0) {
				1111	const MVInfo * mv = &s->blk_info[mv_pos - 1].mv;
				1112	if (mvinfo_matches_backward(mv, src))
				1113	cand[cand_size++] = mv->b_mv;
				1114	}
				1115	if (mv_y > 0) {
				1116	const MVInfo * mv = &s->blk_info[mv_pos - s->blk_stride].mv;
				1117	if (mvinfo_matches_backward(mv, src))
				1118	cand[cand_size++] = mv->b_mv;
				1119	}
				1120	if (has_top_block(s, mv_x << 2, mv_y << 2, mv_w << 2, 0, 4)) {
				1121	const MVInfo * mv = &s->blk_info[mv_pos - s->blk_stride + mv_w].mv;
				1122	if (mvinfo_matches_backward(mv, src))
				1123	cand[cand_size++] = mv->b_mv;
				1124	}
				1125
				1126	switch (cand_size) {
				1127	case 1:
				1128	b_mv.x = cand[0].x;
				1129	b_mv.y = cand[0].y;
				1130	break;
				1131	case 2:
				1132	b_mv.x = (cand[0].x + cand[1].x) >> 1;
				1133	b_mv.y = (cand[0].y + cand[1].y) >> 1;
				1134	break;
				1135	case 3:
				1136	mv_pred(&b_mv, cand[0], cand[1], cand[2]);
				1137	break;
				1138	default:
				1139	b_mv = (MV){0,0};
				1140	break;
				1141	}
				1142	} else {
				1143	b_mv = (MV){0,0};
				1144	}
				1145
				1146	dst->b_mv.x = src->b_mv.x + b_mv.x;
				1147	dst->b_mv.y = src->b_mv.y + b_mv.y;
				1148	}
				1149
				1150	static void reconstruct(RV60Context * s, const CUContext * cu, int size)
				1151	{
				1152	int pu_size = size >> 3;
				1153	PUInfo pui;
				1154	int imode, mv_x, mv_y, mv_pos, count, mv_size;
				1155	unique_list_mvinfo skip_cand;
				1156	Dimensions dim;
				1157	MVInfo mv;
				1158
				1159	pui.cu_type = cu->cu_type;
				1160	pui.pu_type = cu->pu_type;
				1161
				1162	if (cu->cu_type == CU_INTRA && cu->pu_type == PU_QUARTERS) {
				1163	s->pu_info[cu->pu_pos] = pui;
				1164	for (int y = 0; y < 2; y++)
				1165	for (int x = 0; x < 2; x++)
				1166	s->blk_info[cu->blk_pos + y*s->blk_stride + x].imode =
				1167	reconstruct_intra(s, cu, 4, y*2 + x);
				1168	return;
				1169	}
				1170
				1171	switch (cu->cu_type) {
				1172	case CU_INTRA:
				1173	imode = reconstruct_intra(s, cu, size, 0);
				1174	for (int y = 0; y < size >> 2; y++)
				1175	for (int x = 0; x < size >> 2; x++)
				1176	s->blk_info[cu->blk_pos + y*s->blk_stride + x].imode = imode;
				1177	break;
				1178	case CU_INTER_MV:
				1179	mv_x = cu->xpos >> 2;
				1180	mv_y = cu->ypos >> 2;
				1181	mv_pos = cu->blk_pos;
				1182	count = pu_type_num_parts(cu->pu_type);
				1183	for (int part_no = 0; part_no < count; part_no++) {
				1184	MVInfo mv;
				1185	get_mv_dimensions(&dim, cu->pu_type, part_no, size);
				1186	predict_mv(s, &mv, mv_x, mv_y, dim.w, &cu->mv[part_no]);
				1187	for (int y = 0; y < dim.h; y++)
				1188	for (int x = 0; x < dim.w; x++)
				1189	s->blk_info[mv_pos + y*s->blk_stride + x].mv = mv;
				1190	get_next_mv(s, &dim, cu->pu_type, part_no, &mv_pos, &mv_x, &mv_y);
				1191	}
				1192	break;
				1193	default:
				1194	unique_list_mvinfo_init(&skip_cand);
				1195	fill_mv_skip_cand(s, cu, &skip_cand, size);
				1196	mv = skip_cand.list[get_skip_mv_index(cu->mv[0].mvref)];
				1197	mv_size = size >> 2;
				1198	for (int y = 0; y < mv_size; y++)
				1199	for (int x = 0; x < mv_size; x++)
				1200	s->blk_info[cu->blk_pos + y*s->blk_stride + x].mv = mv;
				1201	}
				1202
				1203	for (int y = 0; y < pu_size; y++)
				1204	for (int x = 0; x < pu_size; x++)
				1205	s->pu_info[cu->pu_pos + y*s->pu_stride + x] = pui;
				1206	}
				1207
				1208	static void read_mv(GetBitContext * gb, MV * mv)
				1209	{
				1210	mv->x = get_interleaved_se_golomb(gb);
				1211	mv->y = get_interleaved_se_golomb(gb);
				1212	}
				1213
				1214	static void read_mv_info(RV60Context s, GetBitContext gb, MVInfo * mvinfo, int size, enum PUType pu_type)
				1215	{
				1216	if (s->pict_type != AV_PICTURE_TYPE_B) {
				1217	if (s->two_f_refs && get_bits1(gb))
				1218	mvinfo->mvref = MVREF_REF1;
				1219	else
				1220	mvinfo->mvref = MVREF_REF0;
				1221	read_mv(gb, &mvinfo->f_mv);
				1222	mvinfo->b_mv.x = mvinfo->b_mv.y = 0;
				1223	} else {
				1224	if ((size <= 8 && (size != 8 \|\| pu_type != PU_FULL)) \|\| get_bits1(gb)) {
				1225	if (!get_bits1(gb)) {
				1226	mvinfo->mvref = MVREF_REF0;
				1227	read_mv(gb, &mvinfo->f_mv);
				1228	mvinfo->b_mv.x = mvinfo->b_mv.y = 0;
				1229	} else {
				1230	mvinfo->mvref = MVREF_BREF;
				1231	mvinfo->f_mv.x = mvinfo->f_mv.y = 0;
				1232	read_mv(gb, &mvinfo->b_mv);
				1233	}
				1234	} else {
				1235	mvinfo->mvref = MVREF_REF0ANDBREF;
				1236	read_mv(gb, &mvinfo->f_mv);
				1237	read_mv(gb, &mvinfo->b_mv);
				1238	}
				1239	}
				1240	}
				1241
				1242	#define FILTER1(src, src_stride, src_y_ofs, step) \
				1243	( (src)[(y + src_y_ofs)(src_stride) + x - 2step] \
				1244	- 5 * (src)[(y + src_y_ofs)(src_stride) + x - 1step] \
				1245	+52 * (src)[(y + src_y_ofs)*(src_stride) + x ] \
				1246	+20 * (src)[(y + src_y_ofs)(src_stride) + x + 1step] \
				1247	- 5 * (src)[(y + src_y_ofs)(src_stride) + x + 2step] \
				1248	+ (src)[(y + src_y_ofs)(src_stride) + x + 3step] + 32) >> 6
				1249
				1250	#define FILTER2(src, src_stride, src_y_ofs, step) \
				1251	( (src)[(y + src_y_ofs)(src_stride) + x - 2step] \
				1252	- 5 * (src)[(y + src_y_ofs)(src_stride) + x - 1step] \
				1253	+20 * (src)[(y + src_y_ofs)*(src_stride) + x ] \
				1254	+20 * (src)[(y + src_y_ofs)(src_stride) + x + 1step] \
				1255	- 5 * (src)[(y + src_y_ofs)(src_stride) + x + 2step] \
				1256	+ (src)[(y + src_y_ofs)(src_stride) + x + 3step] + 16) >> 5
				1257
				1258	#define FILTER3(src, src_stride, src_y_ofs, step) \
				1259	( (src)[(y + src_y_ofs)(src_stride) + x - 2step] \
				1260	- 5 * (src)[(y + src_y_ofs)(src_stride) + x - 1step] \
				1261	+20 * (src)[(y + src_y_ofs)*(src_stride) + x ] \
				1262	+52 * (src)[(y + src_y_ofs)(src_stride) + x + 1step] \
				1263	- 5 * (src)[(y + src_y_ofs)(src_stride) + x + 2step] \
				1264	+ (src)[(y + src_y_ofs)(src_stride) + x + 3step] + 32) >> 6
				1265
				1266	#define FILTER_CASE(idx, dst, dst_stride, filter, w, h) \
				1267	case idx: \
				1268	for (int y = 0; y < h; y++) \
				1269	for (int x = 0; x < w; x++) \
				1270	(dst)[y*dst_stride + x] = av_clip_uint8(filter); \
				1271	break;
				1272
				1273	#define FILTER_BLOCK(dst, dst_stride, src, src_stride, src_y_ofs, w, h, cond, step) \
				1274	switch (cond) { \
				1275	FILTER_CASE(1, dst, dst_stride, FILTER1(src, src_stride, src_y_ofs, step), w, h) \
				1276	FILTER_CASE(2, dst, dst_stride, FILTER2(src, src_stride, src_y_ofs, step), w, h) \
				1277	FILTER_CASE(3, dst, dst_stride, FILTER3(src, src_stride, src_y_ofs, step), w, h) \
				1278	}
				1279
				1280	static void luma_mc(uint8_t * dst, int dst_stride, const uint8_t * src, int src_stride, int w, int h, int cx, int cy)
				1281	{
				1282	if (!cx && !cy) {
				1283	for (int y = 0; y < h; y++)
				1284	memcpy(dst + ydst_stride, src + ysrc_stride, w);
				1285	} else if (!cy) {
				1286	FILTER_BLOCK(dst, dst_stride, src, src_stride, 0, w, h, cx, 1)
				1287	} else if (!cx) {
				1288	FILTER_BLOCK(dst, dst_stride, src, src_stride, 0, w, h, cy, src_stride)
				1289	} else if (cx != 3 \|\| cy != 3) {
				1290	uint8_t tmp[70 * 64];
				1291	FILTER_BLOCK(tmp, 64, src - src_stride * 2, src_stride, 0, w, h + 5, cx, 1)
				1292	FILTER_BLOCK(dst, dst_stride, tmp + 2*64, 64, 0, w, h, cy, 64)
				1293	} else {
				1294	for (int j = 0; j < h; j++)
				1295	for (int i = 0; i < w; i++)
				1296	dst[j*dst_stride + i] = (
				1297	src[j*src_stride + i] +
				1298	src[j*src_stride + i + 1] +
				1299	src[(j + 1)*src_stride + i] +
				1300	src[(j + 1)*src_stride + i + 1] + 2) >> 2;
				1301	}
				1302	}
				1303
				1304	static void chroma_mc(uint8_t * dst, int dst_stride, const uint8_t * src, int src_stride, int w, int h, int x, int y)
				1305	{
				1306	if (!x && !y) {
				1307	for (int j = 0; j < h; j++)
				1308	memcpy(dst + jdst_stride, src + jsrc_stride, w);
				1309	} else if (x > 0 && y > 0) {
				1310	int a, b, c, d;
				1311
				1312	if (x == 3 && y == 3)
				1313	y = 2; //reproduce bug in rv60 decoder. tested with realplayer version 18.1.7.344 and 22.0.0.321
				1314
				1315	a = (4 - x) * (4 - y);
				1316	b = x * (4 - y);
				1317	c = (4 - x) * y;
				1318	d = x * y;
				1319	for (int j = 0; j < h; j++)
				1320	for (int i = 0; i < w; i++)
				1321	dst[j*dst_stride + i] =
				1322	(a * src[j*src_stride + i] +
				1323	b * src[j*src_stride + i + 1] +
				1324	c * src[(j + 1)*src_stride + i] +
				1325	d * src[(j + 1)*src_stride + i + 1] + 8) >> 4;
				1326	} else {
				1327	int a = (4 - x) * (4 - y);
				1328	int e = x * (4 - y) + (4 - x) * y;
				1329	int step = y > 0 ? src_stride : 1;
				1330	for (int j = 0; j < h; j++)
				1331	for (int i = 0; i < w; i++)
				1332	dst[j*dst_stride + i] =
				1333	(a * src[j*src_stride + i] +
				1334	e * src[j*src_stride + i + step] + 8) >> 4;
				1335	}
				1336	}
				1337
				1338	static int check_pos(int x, int y, int cw, int ch, int w, int h, int dx, int dy, int e0, int e1, int e2, int e3)
				1339	{
				1340	int x2 = x + dx;
				1341	int y2 = y + dy;
				1342	return x2 - e0 >= 0 && x2 + cw + e1 <= w && y2 - e2 >= 0 && y2 + ch + e3 <= h;
				1343	}
				1344
				1345	static void mc(RV60Context * s, uint8_t * frame_data[3], int frame_linesize[3], const AVFrame * ref, int x, int y, int w, int h, MV mv, int avg)
				1346	{
				1347	{
				1348	int off = !avg ? y * frame_linesize[0] + x : 0;
				1349	int fw = s->awidth;
				1350	int fh = s->aheight;
				1351	int dx = mv.x >> 2;
				1352	int cx = mv.x & 3;
				1353	int dy = mv.y >> 2;
				1354	int cy = mv.y & 3;
				1355
				1356	if (check_pos(x, y, w, h, fw, fh, dx, dy, rv60_edge1[cx], rv60_edge2[cx], rv60_edge1[cy], rv60_edge2[cy])) {
				1357	luma_mc(
				1358	frame_data[0] + off,
				1359	frame_linesize[0],
				1360	ref->data[0] + (y + dy) * ref->linesize[0] + x + dx,
				1361	ref->linesize[0],
				1362	w, h, cx, cy);
				1363	} else {
				1364	uint8_t buf[70*70];
				1365	int xoff = x + dx - 2;
				1366	int yoff = y + dy - 2;
				1367	s->vdsp.emulated_edge_mc(buf,
				1368	ref->data[0] + yoff * ref->linesize[0] + xoff,
				1369	70, ref->linesize[0],
				1370	w + 5, h + 5,
				1371	xoff, yoff,
				1372	fw, fh);
				1373
				1374	luma_mc(frame_data[0] + off, frame_linesize[0],
				1375	buf + 70 * 2 + 2, 70, w, h, cx, cy);
				1376	}
				1377	}
				1378	{
				1379	int fw = s->awidth >> 1;
				1380	int fh = s->aheight >> 1;
				1381	int mvx = mv.x / 2;
				1382	int mvy = mv.y / 2;
				1383	int dx = mvx >> 2;
				1384	int cx = mvx & 3;
				1385	int dy = mvy >> 2;
				1386	int cy = mvy & 3;
				1387	int cw = w >> 1;
				1388	int ch = h >> 1;
				1389
				1390	for (int plane = 1; plane < 3; plane++) {
				1391	int off = !avg ? (y >> 1) * frame_linesize[plane] + (x >> 1) : 0;
				1392	if (check_pos(x >> 1, y >> 1, cw, ch, fw, fh, dx, dy, 0, 1, 0, 1)) {
				1393	chroma_mc(
				1394	frame_data[plane] + off,
				1395	frame_linesize[plane],
				1396	ref->data[plane] + ((y >> 1) + dy) * ref->linesize[plane] + (x >> 1) + dx,
				1397	ref->linesize[plane],
				1398	cw, ch, cx, cy);
				1399	} else {
				1400	uint8_t buf[40*40];
				1401	s->vdsp.emulated_edge_mc(buf,
				1402	ref->data[plane] + ((y >> 1) + dy) * ref->linesize[plane] + (x >> 1) + dx,
				1403	40, ref->linesize[plane],
				1404	cw + 1, ch + 1,
				1405	(x >> 1) + dx, (y >> 1) + dy,
				1406	fw, fh);
				1407	chroma_mc(frame_data[plane] + off, frame_linesize[plane], buf, 40, cw, ch, cx, cy);
				1408	}
				1409	}
				1410	}
				1411	}
				1412
				1413	static void avg_plane(uint8_t * dst, int dst_stride, const uint8_t * src, int src_stride, int w, int h)
				1414	{
				1415	for (int j = 0; j < h; j++)
				1416	for (int i = 0; i < w; i++)
				1417	dst[jdst_stride + i] = (dst[jdst_stride + i] + src[j*src_stride + i]) >> 1;
				1418	}
				1419
				1420	static void avg(AVFrame * frame, uint8_t * prev_frame_data[3], int prev_frame_linesize[3], int x, int y, int w, int h)
				1421	{
				1422	for (int plane = 0; plane < 3; plane++) {
				1423	int shift = !plane ? 0 : 1;
				1424	avg_plane(frame->data[plane] + (y >> shift) * frame->linesize[plane] + (x >> shift), frame->linesize[plane],
				1425	prev_frame_data[plane], prev_frame_linesize[plane],
				1426	w >> shift, h >> shift);
				1427	}
				1428	}
				1429
				1430	static int get_c4x4_set(int qp, int is_intra)
				1431	{
				1432	if (is_intra)
				1433	return rv60_qp_to_idx[qp + 32];
				1434	else
				1435	return rv60_qp_to_idx[qp];
				1436	}
				1437
				1438	static int quant(int v, int q)
				1439	{
				1440	return (v * q + 8) >> 4;
				1441	}
				1442
				1443	static int decode_coeff(GetBitContext * gb, const CoeffVLCs * vlcs, int inval, int val)
				1444	{
				1445	int esc_sym;
				1446
				1447	if (inval != val)
				1448	return inval && get_bits1(gb) ? -inval : inval;
				1449
				1450	esc_sym = get_vlc2(gb, vlcs->esc, 9, 2);
				1451	if (esc_sym > 23) {
				1452	int esc_bits = esc_sym - 23;
				1453	val += (1 << esc_bits) + get_bits(gb, esc_bits) + 22;
				1454	} else
				1455	val += esc_sym;
				1456
				1457	return get_bits1(gb) ? -val : val;
				1458	}
				1459
				1460	static void decode_2x2_dc(GetBitContext * gb, const CoeffVLCs * vlcs, int16_t * coeffs, int stride, int block2, int dsc, int q_dc, int q_ac)
				1461	{
				1462	const uint8_t * lx;
				1463	if (!dsc)
				1464	return;
				1465
				1466	lx = rv60_dsc_to_lx[dsc - 1];
				1467
				1468	coeffs[0] = quant(decode_coeff(gb, vlcs, lx[0], 3), q_dc);
				1469	if (!block2) {
				1470	coeffs[1] = quant(decode_coeff(gb, vlcs, lx[1], 2), q_ac);
				1471	coeffs[stride] = quant(decode_coeff(gb, vlcs, lx[2], 2), q_ac);
				1472	} else {
				1473	coeffs[stride] = quant(decode_coeff(gb, vlcs, lx[1], 2), q_ac);
				1474	coeffs[1] = quant(decode_coeff(gb, vlcs, lx[2], 2), q_ac);
				1475	}
				1476	coeffs[stride + 1] = quant(decode_coeff(gb, vlcs, lx[3], 2), q_ac);
				1477	}
				1478
				1479	static void decode_2x2(GetBitContext * gb, const CoeffVLCs * vlcs, int16_t * coeffs, int stride, int block2, int dsc, int q_ac)
				1480	{
				1481	const uint8_t * lx;
				1482	if (!dsc)
				1483	return;
				1484
				1485	lx = rv60_dsc_to_lx[dsc - 1];
				1486
				1487	coeffs[0] = quant(decode_coeff(gb, vlcs, lx[0], 3), q_ac);
				1488	if (!block2) {
				1489	coeffs[1] = quant(decode_coeff(gb, vlcs, lx[1], 2), q_ac);
				1490	coeffs[stride] = quant(decode_coeff(gb, vlcs, lx[2], 2), q_ac);
				1491	} else {
				1492	coeffs[stride] = quant(decode_coeff(gb, vlcs, lx[1], 2), q_ac);
				1493	coeffs[1] = quant(decode_coeff(gb, vlcs, lx[2], 2), q_ac);
				1494	}
				1495	coeffs[stride + 1] = quant(decode_coeff(gb, vlcs, lx[3], 2), q_ac);
				1496	}
				1497
				1498	static void decode_4x4_block_dc(GetBitContext * gb, const CoeffVLCs * vlcs, int is_luma, int16_t * coeffs, int stride, int q_dc, int q_ac)
				1499	{
				1500	int sym0 = get_vlc2(gb, vlcs->l0[!is_luma], 9, 2);
				1501	int grp0 = sym0 >> 3;
				1502
				1503	if (grp0)
				1504	decode_2x2_dc(gb, vlcs, coeffs, stride, 0, grp0, q_dc, q_ac);
				1505
				1506	if (sym0 & 4) {
				1507	int grp = get_vlc2(gb, vlcs->l12[!is_luma], 9, 2);
				1508	decode_2x2(gb, vlcs, coeffs + 2, stride, 0, grp, q_ac);
				1509	}
				1510	if (sym0 & 2) {
				1511	int grp = get_vlc2(gb, vlcs->l12[!is_luma], 9, 2);
				1512	decode_2x2(gb, vlcs, coeffs + 2*stride, stride, 1, grp, q_ac);
				1513	}
				1514	if (sym0 & 1) {
				1515	int grp = get_vlc2(gb, vlcs->l3[!is_luma], 9, 2);
				1516	decode_2x2(gb, vlcs, coeffs + 2*stride + 2, stride, 0, grp, q_ac);
				1517	}
				1518	}
				1519
				1520	static void decode_4x4_block(GetBitContext * gb, const CoeffVLCs * vlcs, int is_luma, int16_t * coeffs, int stride, int q_ac)
				1521	{
				1522	int sym0 = get_vlc2(gb, vlcs->l0[!is_luma], 9, 2);
				1523	int grp0 = (sym0 >> 3);
				1524
				1525	if (grp0)
				1526	decode_2x2(gb, vlcs, coeffs, stride, 0, grp0, q_ac);
				1527
				1528	if (sym0 & 4) {
				1529	int grp = get_vlc2(gb, vlcs->l12[!is_luma], 9, 2);
				1530	decode_2x2(gb, vlcs, coeffs + 2, stride, 0, grp, q_ac);
				1531	}
				1532	if (sym0 & 2) {
				1533	int grp = get_vlc2(gb, vlcs->l12[!is_luma], 9, 2);
				1534	decode_2x2(gb, vlcs, coeffs + 2*stride, stride, 1, grp, q_ac);
				1535	}
				1536	if (sym0 & 1) {
				1537	int grp = get_vlc2(gb, vlcs->l3[!is_luma], 9, 2);
				1538	decode_2x2(gb, vlcs, coeffs + 2*stride + 2, stride, 0, grp, q_ac);
				1539	}
				1540	}
				1541
				1542	static void decode_cu_4x4in16x16(GetBitContext * gb, int is_intra, int qp, int sel_qp, int16_t * y_coeffs, int16_t * u_coeffs, int16_t * v_coeffs, int cbp)
				1543	{
				1544	int cb_set = get_c4x4_set(sel_qp, is_intra);
				1545	const CoeffVLCs * vlc = is_intra ? &intra_coeff_vlc[cb_set] : &inter_coeff_vlc[cb_set];
				1546	int q_y = rv60_quants_b[qp];
				1547	int q_c_dc = rv60_quants_b[rv60_chroma_quant_dc[qp]];
				1548	int q_c_ac = rv60_quants_b[rv60_chroma_quant_ac[qp]];
				1549
				1550	memset(y_coeffs, 0, sizeof(y_coeffs[0])*256);
				1551	for (int i = 0; i < 16; i++)
				1552	if ((cbp >> i) & 1)
				1553	decode_4x4_block(gb, vlc, 1, y_coeffs + i * 16 , 4, q_y);
				1554
				1555	memset(u_coeffs, 0, sizeof(u_coeffs[0])*64);
				1556	for (int i = 0; i < 4; i++)
				1557	if ((cbp >> (16 + i)) & 1)
				1558	decode_4x4_block_dc(gb, vlc, 0, u_coeffs + i * 16, 4, q_c_dc, q_c_ac);
				1559
				1560	memset(v_coeffs, 0, sizeof(v_coeffs[0])*64);
				1561	for (int i = 0; i < 4; i++)
				1562	if ((cbp >> (20 + i)) & 1)
				1563	decode_4x4_block_dc(gb, vlc, 0, v_coeffs + i * 16, 4, q_c_dc, q_c_ac);
				1564	}
				1565
				1566	static int decode_cbp8(GetBitContext * gb, int subset, int qp)
				1567	{
				1568	int cb_set = rv60_qp_to_idx[qp];
				1569	return get_vlc2(gb, cbp8_vlc[cb_set][subset], 9, 2);
				1570	}
				1571
				1572	static void decode_cu_8x8(GetBitContext * gb, int is_intra, int qp, int sel_qp, int16_t * y_coeffs, int16_t * u_coeffs, int16_t * v_coeffs, int ccbp, int mode4x4)
				1573	{
				1574	int cb_set = get_c4x4_set(sel_qp, is_intra);
				1575	const CoeffVLCs * vlc = is_intra ? &intra_coeff_vlc[cb_set] : &inter_coeff_vlc[cb_set];
				1576	int q_y = rv60_quants_b[qp];
				1577	int q_c_dc = rv60_quants_b[rv60_chroma_quant_dc[qp]];
				1578	int q_c_ac = rv60_quants_b[rv60_chroma_quant_ac[qp]];
				1579
				1580	memset(y_coeffs, 0, sizeof(y_coeffs[0])*64);
				1581	for (int i = 0; i < 4; i++) {
				1582	if ((ccbp >> i) & 1) {
				1583	int offset, stride;
				1584	if (mode4x4) {
				1585	offset = i*16;
				1586	stride = 4;
				1587	} else {
				1588	offset = (i & 1) * 4 + (i & 2) * 2 * 8;
				1589	stride = 8;
				1590	}
				1591	decode_4x4_block(gb, vlc, 1, y_coeffs + offset, stride, q_y);
				1592	}
				1593	}
				1594
				1595	if ((ccbp >> 4) & 1) {
				1596	memset(u_coeffs, 0, sizeof(u_coeffs[0])*16);
				1597	decode_4x4_block_dc(gb, vlc, 0, u_coeffs, 4, q_c_dc, q_c_ac);
				1598	}
				1599
				1600	if ((ccbp >> 5) & 1) {
				1601	memset(v_coeffs, 0, sizeof(u_coeffs[0])*16);
				1602	decode_4x4_block_dc(gb, vlc, 0, v_coeffs, 4, q_c_dc, q_c_ac);
				1603	}
				1604	}
				1605
				1606	static void decode_cu_16x16(GetBitContext * gb, int is_intra, int qp, int sel_qp, int16_t * y_coeffs, int16_t * u_coeffs, int16_t * v_coeffs, int ccbp)
				1607	{
				1608	int cb_set = get_c4x4_set(sel_qp, is_intra);
				1609	const CoeffVLCs * vlc = is_intra ? &intra_coeff_vlc[cb_set] : &inter_coeff_vlc[cb_set];
				1610	int q_y = rv60_quants_b[qp];
				1611	int q_c_dc = rv60_quants_b[rv60_chroma_quant_dc[qp]];
				1612	int q_c_ac = rv60_quants_b[rv60_chroma_quant_ac[qp]];
				1613
				1614	memset(y_coeffs, 0, sizeof(y_coeffs[0])*256);
				1615	for (int i = 0; i < 16; i++)
				1616	if ((ccbp >> i) & 1) {
				1617	int off = (i & 3) * 4 + (i >> 2) * 4 * 16;
				1618	decode_4x4_block(gb, vlc, 1, y_coeffs + off, 16, q_y);
				1619	}
				1620
				1621	memset(u_coeffs, 0, sizeof(u_coeffs[0])*64);
				1622	for (int i = 0; i < 4; i++)
				1623	if ((ccbp >> (16 + i)) & 1) {
				1624	int off = (i & 1) * 4 + (i & 2) * 2 * 8;
				1625	if (!i)
				1626	decode_4x4_block_dc(gb, vlc, 0, u_coeffs + off, 8, q_c_dc, q_c_ac);
				1627	else
				1628	decode_4x4_block(gb, vlc, 0, u_coeffs + off, 8, q_c_ac);
				1629	}
				1630
				1631	memset(v_coeffs, 0, sizeof(v_coeffs[0])*64);
				1632	for (int i = 0; i < 4; i++)
				1633	if ((ccbp >> (20 + i)) & 1) {
				1634	int off = (i & 1) * 4 + (i & 2) * 2 * 8;
				1635	if (!i)
				1636	decode_4x4_block_dc(gb, vlc, 0, v_coeffs + off, 8, q_c_dc, q_c_ac);
				1637	else
				1638	decode_4x4_block(gb, vlc, 0, v_coeffs + off, 8, q_c_ac);
				1639	}
				1640	}
				1641
				1642	static int decode_super_cbp(GetBitContext * gb, const VLCElem * vlc[4])
				1643	{
				1644	int sym0 = get_vlc2(gb, vlc[0], 9, 2);
				1645	int sym1 = get_vlc2(gb, vlc[1], 9, 2);
				1646	int sym2 = get_vlc2(gb, vlc[2], 9, 2);
				1647	int sym3 = get_vlc2(gb, vlc[3], 9, 2);
				1648	return 0
				1649	+ ((sym0 & 0x03) << 0)
				1650	+ ((sym0 & 0x0C) << 2)
				1651	+ ((sym0 & 0x10) << 12)
				1652	+ ((sym0 & 0x20) << 15)
				1653	+ ((sym1 & 0x03) << 2)
				1654	+ ((sym1 & 0x0C) << 4)
				1655	+ ((sym1 & 0x10) << 13)
				1656	+ ((sym1 & 0x20) << 16)
				1657	+ ((sym2 & 0x03) << 8)
				1658	+ ((sym2 & 0x0C) << 10)
				1659	+ ((sym2 & 0x10) << 14)
				1660	+ ((sym2 & 0x20) << 17)
				1661	+ ((sym3 & 0x03) << 10)
				1662	+ ((sym3 & 0x0C) << 12)
				1663	+ ((sym3 & 0x10) << 15)
				1664	+ ((sym3 & 0x20) << 18);
				1665	}
				1666
				1667	static int decode_cbp16(GetBitContext * gb, int subset, int qp)
				1668	{
				1669	int cb_set = rv60_qp_to_idx[qp];
				1670	if (!subset)
				1671	return decode_super_cbp(gb, cbp8_vlc[cb_set]);
				1672	else
				1673	return decode_super_cbp(gb, cbp16_vlc[cb_set][subset - 1]);
				1674	}
				1675
				1676	static int decode_cu_r(RV60Context * s, AVFrame * frame, ThreadContext * thread, GetBitContext * gb, int xpos, int ypos, int log_size, int qp, int sel_qp)
				1677	{
				1678	int size = 1 << log_size;
				1679	int split, ret, ttype, count, is_intra, cu_pos, subset, cbp8, imode, split_i4x4, num_clusters, cl_cbp, super_cbp, mv_x, mv_y, mv_pos;
				1680	int16_t y_coeffs[1616], u_coeffs[88], v_coeffs[8*8];
				1681	CUContext cu;
				1682
				1683	if (xpos >= s->awidth \|\| ypos >= s->aheight)
				1684	return 0;
				1685
				1686	split = xpos + size > s->awidth \|\| ypos + size > s->aheight \|\| (size > 8 && get_bits1(gb));
				1687	thread->cu_split[thread->cu_split_pos++] = split;
				1688	if (split) {
				1689	size >>= 1;
				1690	log_size -= 1;
				1691	if ((ret = decode_cu_r(s, frame, thread, gb, xpos, ypos, log_size, qp, sel_qp)) < 0 \|\|
				1692	(ret = decode_cu_r(s, frame, thread, gb, xpos + size, ypos, log_size, qp, sel_qp)) < 0 \|\|
				1693	(ret = decode_cu_r(s, frame, thread, gb, xpos, ypos + size, log_size, qp, sel_qp)) < 0 \|\|
				1694	(ret = decode_cu_r(s, frame, thread, gb, xpos + size, ypos + size, log_size, qp, sel_qp)) < 0)
				1695	return ret;
				1696	return 0;
				1697	}
				1698
				1699	cu.xpos = xpos;
				1700	cu.ypos = ypos;
				1701	cu.pu_pos = (xpos >> 3) + (ypos >> 3) * s->pu_stride;
				1702	cu.blk_pos = (xpos >> 2) + (ypos >> 2) * s->blk_stride;
				1703	cu.cu_type = s->pict_type != AV_PICTURE_TYPE_I ? get_bits(gb, 2) : CU_INTRA;
				1704
				1705	switch (cu.cu_type) {
				1706	case CU_INTRA:
				1707	cu.pu_type = size == 8 && get_bits1(gb) ? PU_QUARTERS : PU_FULL;
				1708	if (cu.pu_type == PU_QUARTERS)
				1709	for (int i = 0; i < 4; i++)
				1710	cu.imode[i] = read_intra_mode(gb, &cu.imode_param[i]);
				1711	else if (size <= 32)
				1712	cu.imode[0] = read_intra_mode(gb, &cu.imode_param[0]);
				1713	else
				1714	cu.imode[0] = get_bits1(gb) ? INTRAMODE_PLANE64 : INTRAMODE_DC64;
				1715	break;
				1716	case CU_INTER_MV:
				1717	cu.pu_type = get_bits(gb, size == 8 ? 2 : 3);
				1718	count = pu_type_num_parts(cu.pu_type);
				1719	for (int i = 0; i < count; i++)
				1720	read_mv_info(s, gb, &cu.mv[i], size, cu.pu_type);
				1721	break;
				1722	default:
				1723	cu.pu_type = PU_FULL;
				1724	cu.mv[0].mvref = skip_mv_ref[get_unary(gb, 0, 3)];
				1725	break;
				1726	}
				1727
				1728	reconstruct(s, &cu, size);
				1729
				1730	split_i4x4 = cu.cu_type == CU_INTRA && size == 8 && cu.pu_type == PU_QUARTERS;
				1731
				1732	switch (cu.cu_type) {
				1733	case CU_INTRA:
				1734	imode = s->blk_info[cu.blk_pos].imode;
				1735	if (!split_i4x4) {
				1736	int off = ypos * frame->linesize[0] + xpos;
				1737	populate_ipred(s, &cu, frame->data[0], frame->linesize[0], 0, 0, size, 1);
				1738	if (pred_angle(&cu.ipred, frame->data[0] + off, frame->linesize[0], size, imode, 1) < 0)
				1739	return AVERROR_INVALIDDATA;
				1740	}
				1741	for (int plane = 1; plane < 3; plane++) {
				1742	int off = (ypos >> 1) * frame->linesize[plane] + (xpos >> 1);
				1743	populate_ipred(s, &cu, frame->data[plane], frame->linesize[plane], 0, 0, size >> 1, 0);
				1744	if (pred_angle(&cu.ipred, frame->data[plane] + off, frame->linesize[plane], size >> 1, imode, 0) < 0)
				1745	return AVERROR_INVALIDDATA;
				1746	}
				1747	break;
				1748	default:
				1749	mv_x = xpos >> 2;
				1750	mv_y = ypos >> 2;
				1751	mv_pos = mv_y * s->blk_stride + mv_x;
				1752	count = pu_type_num_parts(cu.pu_type);
				1753	for (int part_no = 0; part_no < count; part_no++) {
				1754	MVInfo mv;
				1755	Dimensions dim;
				1756	int bw, bh, bx, by;
				1757
				1758	mv = s->blk_info[mv_pos].mv;
				1759	get_mv_dimensions(&dim, cu.pu_type, part_no, size);
				1760	bw = dim.w << 2;
				1761	bh = dim.h << 2;
				1762	bx = mv_x << 2;
				1763	by = mv_y << 2;
				1764
				1765	switch (mv.mvref) {
				1766	case MVREF_REF0:
				1767	mc(s, frame->data, frame->linesize, s->last_frame[LAST_PIC], bx, by, bw, bh, mv.f_mv, 0);
				1768	break;
				1769	case MVREF_REF1:
				1770	if (!s->last_frame[NEXT_PIC]->data[0]) {
				1771	av_log(s->avctx, AV_LOG_ERROR, "missing reference frame\n");
				1772	return AVERROR_INVALIDDATA;
				1773	}
				1774	mc(s, frame->data, frame->linesize, s->last_frame[NEXT_PIC], bx, by, bw, bh, mv.f_mv, 0);
				1775	break;
				1776	case MVREF_BREF:
				1777	mc(s, frame->data, frame->linesize, s->last_frame[NEXT_PIC], bx, by, bw, bh, mv.b_mv, 0);
				1778	break;
				1779	case MVREF_REF0ANDBREF:
				1780	mc(s, frame->data, frame->linesize, s->last_frame[LAST_PIC], bx, by, bw, bh, mv.f_mv, 0);
				1781	mc(s, thread->avg_data, thread->avg_linesize, s->last_frame[NEXT_PIC], bx, by, bw, bh, mv.b_mv, 1);
				1782	avg(frame, thread->avg_data, thread->avg_linesize, bx, by, bw, bh);
				1783	break;
				1784	default:
				1785	av_assert0(0); //should never reach here
				1786	}
				1787	get_next_mv(s, &dim, cu.pu_type, part_no, &mv_pos, &mv_x, &mv_y);
				1788	}
				1789	break;
				1790	}
				1791
				1792	if (cu.cu_type == CU_SKIP)
				1793	ttype = TRANSFORM_NONE;
				1794	else if (size >= 32)
				1795	ttype = TRANSFORM_16X16;
				1796	else if (size == 16)
				1797	ttype = cu.cu_type == CU_INTRA \|\| cu.pu_type == PU_FULL ? TRANSFORM_16X16 : TRANSFORM_4X4;
				1798	else
				1799	ttype = cu.pu_type == PU_FULL ? TRANSFORM_8X8 : TRANSFORM_4X4;
				1800
				1801	is_intra = cu.cu_type == CU_INTRA;
				1802	cu_pos = ((xpos & 63) >> 3) + ((ypos & 63) >> 3) * 8;
				1803
				1804	switch (ttype) {
				1805	case TRANSFORM_4X4:
				1806	subset = is_intra ? 0 : 2;
				1807	if (size == 16) {
				1808	int cbp16 = get_bits1(gb) ? decode_cbp16(gb, subset, sel_qp) : 0;
				1809	if (cbp16) {
				1810	decode_cu_4x4in16x16(gb, is_intra, qp, sel_qp, y_coeffs, u_coeffs, v_coeffs, cbp16);
				1811	for (int y = 0; y < 4; y++)
				1812	for (int x = 0; x < 4; x++) {
				1813	int i = y*4 + x;
				1814	if ((cbp16 >> i) & 1) {
				1815	int off = (ypos + y * 4)frame->linesize[0] + xpos + x 4;
				1816	ff_rv60_idct4x4_add(y_coeffs + i*16, frame->data[0] + off, frame->linesize[0]);
				1817	thread->coded_blk[cu_pos + (y/2)*8 + (x/2)] = 1;
				1818	}
				1819	}
				1820	for (int y = 0; y < 2; y++)
				1821	for (int x = 0; x < 2; x++) {
				1822	int i = y * 2 + x;
				1823	int xoff = (xpos >> 1) + x * 4;
				1824	int yoff = (ypos >> 1) + y * 4;
				1825	if ((cbp16 >> (16 + i)) & 1) {
				1826	int off = yoff * frame->linesize[1] + xoff;
				1827	ff_rv60_idct4x4_add(u_coeffs + i * 16, frame->data[1] + off, frame->linesize[1]);
				1828	thread->coded_blk[cu_pos + y*8 + x] = 1;
				1829	}
				1830	if ((cbp16 >> (20 + i)) & 1) {
				1831	int off = yoff * frame->linesize[2] + xoff;
				1832	ff_rv60_idct4x4_add(v_coeffs + i * 16, frame->data[2] + off, frame->linesize[2]);
				1833	thread->coded_blk[cu_pos + y*8 + x] = 1;
				1834	}
				1835	}
				1836	}
				1837	} else {
				1838	cbp8 = decode_cbp8(gb, subset, sel_qp);
				1839	if (cbp8) {
				1840	thread->coded_blk[cu_pos] = 1;
				1841	decode_cu_8x8(gb, is_intra, qp, sel_qp, y_coeffs, u_coeffs, v_coeffs, cbp8, 1);
				1842	}
				1843	for (int i = 0; i < 4; i++) {
				1844	int xoff = (i & 1) << 2;
				1845	int yoff = (i & 2) << 1;
				1846	if (split_i4x4) {
				1847	int off = (ypos + yoff) * frame->linesize[0] + xpos + xoff;
				1848	int imode = s->blk_info[cu.blk_pos + (i >> 1) * s->blk_stride + (i & 1)].imode;
				1849	populate_ipred(s, &cu, frame->data[0], frame->linesize[0], xoff, yoff, 4, 1);
				1850	if (pred_angle(&cu.ipred, frame->data[0] + off, frame->linesize[0], 4, imode, 1) < 0)
				1851	return AVERROR_INVALIDDATA;
				1852	}
				1853	if ((cbp8 >> i) & 1) {
				1854	int off = (ypos + yoff) * frame->linesize[0] + xpos + xoff;
				1855	ff_rv60_idct4x4_add(y_coeffs + i * 16, frame->data[0] + off, frame->linesize[0]);
				1856	}
				1857	}
				1858	if ((cbp8 >> 4) & 1) {
				1859	int off = (ypos >> 1) * frame->linesize[1] + (xpos >> 1);
				1860	ff_rv60_idct4x4_add(u_coeffs, frame->data[1] + off, frame->linesize[1]);
				1861	}
				1862	if ((cbp8 >> 5) & 1) {
				1863	int off = (ypos >> 1) * frame->linesize[2] + (xpos >> 1);
				1864	ff_rv60_idct4x4_add(v_coeffs, frame->data[2] + off, frame->linesize[2]);
				1865	}
				1866	}
				1867	break;
				1868	case TRANSFORM_8X8:
				1869	subset = is_intra ? 1 : 3;
				1870	cbp8 = decode_cbp8(gb, subset, sel_qp);
				1871	if (cbp8) {
				1872	thread->coded_blk[cu_pos] = 1;
				1873	decode_cu_8x8(gb, is_intra, qp, sel_qp, y_coeffs, u_coeffs, v_coeffs, cbp8, 0);
				1874	if (cbp8 & 0xF) {
				1875	int off = ypos * frame->linesize[0] + xpos;
				1876	ff_rv60_idct8x8_add(y_coeffs, frame->data[0] + off, frame->linesize[0]);
				1877	}
				1878	if ((cbp8 >> 4) & 1) {
				1879	int off = (ypos >> 1) * frame->linesize[1] + (xpos >> 1);
				1880	ff_rv60_idct4x4_add(u_coeffs, frame->data[1] + off, frame->linesize[1]);
				1881	}
				1882	if ((cbp8 >> 5) & 1) {
				1883	int off = (ypos >> 1) * frame->linesize[2] + (xpos >> 1);
				1884	ff_rv60_idct4x4_add(v_coeffs, frame->data[2] + off, frame->linesize[2]);
				1885	}
				1886	}
				1887	break;
				1888	case TRANSFORM_16X16:
				1889	subset = is_intra ? 1 : 3;
				1890	num_clusters = size >> 4;
				1891	cl_cbp = get_bits(gb, num_clusters * num_clusters);
				1892	for (int y = 0; y < num_clusters; y++) {
				1893	for (int x = 0; x < num_clusters; x++) {
				1894	if (!((cl_cbp >> (y*num_clusters + x)) & 1))
				1895	continue;
				1896	thread->coded_blk[cu_pos + y28 + x*2 + 0] = 1;
				1897	thread->coded_blk[cu_pos + y28 + x*2 + 1] = 1;
				1898	thread->coded_blk[cu_pos + y28 + x*2 + 8] = 1;
				1899	thread->coded_blk[cu_pos + y28 + x*2 + 9] = 1;
				1900	super_cbp = decode_cbp16(gb, subset, sel_qp);
				1901	if (super_cbp) {
				1902	decode_cu_16x16(gb, is_intra, qp, sel_qp, y_coeffs, u_coeffs, v_coeffs, super_cbp);
				1903	if (super_cbp & 0xFFFF) {
				1904	int off = (ypos + y * 16) * frame->linesize[0] + xpos + x * 16;
				1905	ff_rv60_idct16x16_add(y_coeffs, frame->data[0] + off, frame->linesize[0]);
				1906	}
				1907	if ((super_cbp >> 16) & 0xF) {
				1908	int off = ((ypos >> 1) + y * 8) * frame->linesize[1] + (xpos >> 1) + x * 8;
				1909	ff_rv60_idct8x8_add(u_coeffs, frame->data[1] + off, frame->linesize[1]);
				1910	}
				1911	if ((super_cbp >> 20) & 0xF) {
				1912	int off = ((ypos >> 1) + y * 8) * frame->linesize[2] + (xpos >> 1) + x * 8;
				1913	ff_rv60_idct8x8_add(v_coeffs, frame->data[2] + off, frame->linesize[2]);
				1914	}
				1915	}
				1916	}
				1917	}
				1918	break;
				1919	}
				1920
				1921	return 0;
				1922	}
				1923
				1924	static int deblock_get_pos(RV60Context * s, int xpos, int ypos)
				1925	{
				1926	return (ypos >> 2) * s->dblk_stride + (xpos >> 2);
				1927	}
				1928
				1929	static void deblock_set_strength(RV60Context * s, int xpos, int ypos, int size, int q, int strength)
				1930	{
				1931	int pos = deblock_get_pos(s, xpos, ypos);
				1932	int dsize = size >> 2;
				1933	int dval = (q << 2) + strength;
				1934
				1935	for (int x = 0; x < dsize; x++) {
				1936	s->top_str[pos + x] = dval;
				1937	s->top_str[pos + (dsize - 1)*s->dblk_stride + x] = dval;
				1938	}
				1939
				1940	for (int y = 0; y < dsize; y++) {
				1941	s->left_str[pos + y*s->dblk_stride] = dval;
				1942	s->left_str[pos + y*s->dblk_stride + dsize - 1] = dval;
				1943	}
				1944	}
				1945
				1946	static int deblock_get_top_strength(const RV60Context * s, int pos)
				1947	{
				1948	return s->top_str[pos] & 3;
				1949	}
				1950
				1951	static int deblock_get_left_strength(const RV60Context * s, int pos)
				1952	{
				1953	return s->left_str[pos] & 3;
				1954	}
				1955
				1956	static void deblock_set_top_strength(RV60Context * s, int pos, int strength)
				1957	{
				1958	s->top_str[pos] \|= strength;
				1959	}
				1960
				1961	static void deblock_set_left_strength(RV60Context * s, int pos, int strength)
				1962	{
				1963	s->left_str[pos] \|= strength;
				1964	}
				1965
				1966	static void derive_deblock_strength(RV60Context * s, int xpos, int ypos, int size)
				1967	{
				1968	int blk_pos = (ypos >> 2) * s->blk_stride + (xpos >> 2);
				1969	int dblk_pos = deblock_get_pos(s, xpos, ypos);
				1970	if (ypos > 0)
				1971	for (int i = 0; i < size; i++)
				1972	if (!deblock_get_top_strength(s, dblk_pos - s->dblk_stride + i) && mvinfo_is_deblock_cand(&s->blk_info[blk_pos + i].mv, &s->blk_info[blk_pos - s->blk_stride + i].mv))
				1973	deblock_set_top_strength(s, dblk_pos + i, 1);
				1974	if (xpos > 0)
				1975	for (int i = 0; i < size; i++)
				1976	if (!deblock_get_left_strength(s, dblk_pos + i s->dblk_stride - 1) && mvinfo_is_deblock_cand(&s->blk_info[blk_pos + is->blk_stride].mv, &s->blk_info[blk_pos + i*s->blk_stride - 1].mv))
				1977	deblock_set_left_strength(s, dblk_pos + i *s->dblk_stride, 1);
				1978	}
				1979
				1980	#define STRENGTH(el, lim) (FFABS(el) < (lim) ? 3 : 1)
				1981	#define CLIP_SYMM(a, b) av_clip(a, -(b), b)
				1982
				1983	static void filter_luma_edge(uint8_t * dst, int step, int stride, int mode1, int mode2, int lim1, int lim2)
				1984	{
				1985	int16_t diff_q1q0[4];
				1986	int16_t diff_p1p0[4];
				1987	int str_p, str_q, msum, maxprod, weak;
				1988
				1989	for (int i = 0; i < 4; i++) {
				1990	diff_q1q0[i] = dst[i * stride - 2step] - dst[istride - step];
				1991	diff_p1p0[i] = dst[i * stride + step] - dst[i*stride];
				1992	}
				1993
				1994	str_p = STRENGTH(diff_q1q0[0] + diff_q1q0[1] + diff_q1q0[2] + diff_q1q0[3], lim2);
				1995	str_q = STRENGTH(diff_p1p0[0] + diff_p1p0[1] + diff_p1p0[2] + diff_p1p0[3], lim2);
				1996
				1997	if (str_p + str_q <= 2)
				1998	return;
				1999
				2000	msum = (mode1 + mode2 + str_q + str_p) >> 1;
				2001	if (str_q == 1 \|\| str_p == 1) {
				2002	maxprod = 384;
				2003	weak = 1;
				2004	} else {
				2005	maxprod = 256;
				2006	weak = 0;
				2007	}
				2008
				2009	for (int y = 0; y < 4; y++) {
				2010	int diff_p0q0 = dst[0] - dst[-step];
				2011	int result = (lim1 * FFABS(diff_p0q0)) & -128;
				2012	if (diff_p0q0 && result <= maxprod) {
				2013	int diff_q1q2 = dst[-2step] - dst[-3step];
				2014	int diff_p1p2 = dst[step] - dst[2*step];
				2015	int delta;
				2016	if (weak) {
				2017	delta = CLIP_SYMM((diff_p0q0 + 1) >> 1, msum >> 1);
				2018	} else {
				2019	int diff_strg = (dst[-2step] - dst[step] + 4 diff_p0q0 + 4) >> 3;
				2020	delta = CLIP_SYMM(diff_strg, msum);
				2021	}
				2022	dst[-step] = av_clip_uint8(dst[-step] + delta);
				2023	dst[0] = av_clip_uint8(dst[0] - delta);
				2024	if (str_p != 1 && FFABS(diff_q1q2) <= (lim2 >> 2)) {
				2025	int diff = (diff_q1q0[y] + diff_q1q2 - delta) >> 1;
				2026	int delta_q1 = weak ? CLIP_SYMM(diff, mode1 >> 1) : CLIP_SYMM(diff, mode1);
				2027	dst[-2 * step] = av_clip_uint8(dst[-2*step] - delta_q1);
				2028	}
				2029	if (str_q != 1 && FFABS(diff_p1p2) <= (lim2 >> 2)) {
				2030	int diff = (diff_p1p0[y] + diff_p1p2 + delta) >> 1;
				2031	int delta_p1 = weak ? CLIP_SYMM(diff, mode2 >> 1) : CLIP_SYMM(diff, mode2);
				2032	dst[step] = av_clip_uint8(dst[step] - delta_p1);
				2033	}
				2034	}
				2035	dst += stride;
				2036	}
				2037	}
				2038
				2039	static void filter_chroma_edge(uint8_t * dst, int step, int stride, int mode1, int mode2, int lim1, int lim2)
				2040	{
				2041	int diff_q = 4 * FFABS(dst[-2*step] - dst[-step]);
				2042	int diff_p = 4 * FFABS(dst[ step] - dst[0]);
				2043	int str_q = STRENGTH(diff_q, lim2);
				2044	int str_p = STRENGTH(diff_p, lim2);
				2045	int msum, maxprod, weak;
				2046
				2047	if (str_p + str_q <= 2)
				2048	return;
				2049
				2050	msum = (mode1 + mode2 + str_q + str_p) >> 1;
				2051	if (str_q == 1 \|\| str_p == 1) {
				2052	maxprod = 384;
				2053	weak = 1;
				2054	} else {
				2055	maxprod = 256;
				2056	weak = 0;
				2057	}
				2058
				2059	for (int y = 0; y < 2; y++) {
				2060	int diff_pq = dst[0] - dst[-step];
				2061	int result = (lim1 * FFABS(diff_pq)) & -128;
				2062	if (diff_pq && result <= maxprod) {
				2063	int delta;
				2064	if (weak) {
				2065	delta = CLIP_SYMM((diff_pq + 1) >> 1, msum >> 1);
				2066	} else {
				2067	int diff_strg = (dst[-2step] - dst[step] + 4 diff_pq + 4) >> 3;
				2068	delta = CLIP_SYMM(diff_strg, msum);
				2069	}
				2070	dst[-step] = av_clip_uint8(dst[-step] + delta);
				2071	dst[ 0 ] = av_clip_uint8(dst[ 0 ] - delta);
				2072	}
				2073	dst += stride;
				2074	}
				2075	}
				2076
				2077	static void deblock_edge_ver(AVFrame * frame, int xpos, int ypos, int dblk_l, int dblk_r, int deblock_chroma)
				2078	{
				2079	int qp_l = dblk_l >> 2;
				2080	int str_l = dblk_l & 3;
				2081	int qp_r = dblk_r >> 2;
				2082	int str_r = dblk_r & 3;
				2083	const uint8_t * dl_l = rv60_deblock_limits[qp_l];
				2084	const uint8_t * dl_r = rv60_deblock_limits[qp_r];
				2085	int mode_l = str_l ? dl_l[str_l - 1] : 0;
				2086	int mode_r = str_r ? dl_r[str_r - 1] : 0;
				2087	int lim1 = dl_r[2];
				2088	int lim2 = dl_r[3] * 4;
				2089
				2090	filter_luma_edge(frame->data[0] + ypos * frame->linesize[0] + xpos, 1, frame->linesize[0], mode_l, mode_r, lim1, lim2);
				2091	if ((str_l \| str_r) >= 2 && deblock_chroma)
				2092	for (int plane = 1; plane < 3; plane++)
				2093	filter_chroma_edge(frame->data[plane] + (ypos >> 1) * frame->linesize[plane] + (xpos >> 1), 1, frame->linesize[plane], mode_l, mode_r, lim1, lim2);
				2094	}
				2095
				2096	static void deblock_edge_hor(AVFrame * frame, int xpos, int ypos, int dblk_t, int dblk_d, int deblock_chroma)
				2097	{
				2098	int qp_t = dblk_t >> 2;
				2099	int str_t = dblk_t & 3;
				2100	int qp_d = dblk_d >> 2;
				2101	int str_d = dblk_d & 3;
				2102	const uint8_t * dl_t = rv60_deblock_limits[qp_t];
				2103	const uint8_t * dl_d = rv60_deblock_limits[qp_d];
				2104	int mode_t = str_t ? dl_t[str_t - 1] : 0;
				2105	int mode_d = str_d ? dl_d[str_d - 1] : 0;
				2106	int lim1 = dl_d[2];
				2107	int lim2 = dl_d[3] * 4;
				2108
				2109	filter_luma_edge(frame->data[0] + ypos * frame->linesize[0] + xpos, frame->linesize[0], 1, mode_t, mode_d, lim1, lim2);
				2110	if ((str_t \| str_d) >= 2 && deblock_chroma)
				2111	for (int plane = 1; plane < 3; plane++)
				2112	filter_chroma_edge(frame->data[plane] + (ypos >> 1) * frame->linesize[plane] + (xpos >> 1), frame->linesize[plane], 1, mode_t, mode_d, lim1, lim2);
				2113	}
				2114
				2115	static void deblock8x8(const RV60Context * s, AVFrame * frame, int xpos, int ypos, int dblkpos)
				2116	{
				2117	if (xpos > 0) {
				2118	if (ypos > 0) {
				2119	int str_l = s->left_str[dblkpos - s->dblk_stride - 1];
				2120	int str_r = s->left_str[dblkpos - s->dblk_stride];
				2121	if ((str_l \| str_r) & 3)
				2122	deblock_edge_ver(frame, xpos, ypos - 4, str_l, str_r, s->deblock_chroma);
				2123	}
				2124	{
				2125	int str_l = s->left_str[dblkpos - 1];
				2126	int str_r = s->left_str[dblkpos];
				2127	if ((str_l \| str_r) & 3)
				2128	deblock_edge_ver(frame, xpos, ypos, str_l, str_r, s->deblock_chroma);
				2129	}
				2130	if (ypos + 8 >= s->aheight) {
				2131	int str_l = s->left_str[dblkpos + s->dblk_stride - 1];
				2132	int str_r = s->left_str[dblkpos + s->dblk_stride];
				2133	if ((str_l \| str_r) & 3)
				2134	deblock_edge_ver(frame, xpos, ypos + 4, str_l, str_r, s->deblock_chroma);
				2135	}
				2136	}
				2137	if (ypos > 0) {
				2138	if (xpos > 0) {
				2139	int str_t = s->top_str[dblkpos - s->dblk_stride - 1];
				2140	int str_d = s->top_str[dblkpos - 1];
				2141	if ((str_t \| str_d) & 3)
				2142	deblock_edge_hor(frame, xpos - 4, ypos, str_t, str_d, s->deblock_chroma);
				2143	}
				2144	{
				2145	int str_t = s->top_str[dblkpos - s->dblk_stride];
				2146	int str_d = s->top_str[dblkpos];
				2147	if ((str_t \| str_d) & 3)
				2148	deblock_edge_hor(frame, xpos, ypos, str_t, str_d, s->deblock_chroma);
				2149	}
				2150	if (xpos + 8 >= s->awidth) {
				2151	int str_t = s->top_str[dblkpos - s->dblk_stride + 1];
				2152	int str_d = s->top_str[dblkpos + 1];
				2153	if ((str_t \| str_d) & 3)
				2154	deblock_edge_hor(frame, xpos + 4, ypos, str_t, str_d, s->deblock_chroma);
				2155	}
				2156	}
				2157	}
				2158
				2159	static void deblock(const RV60Context * s, AVFrame * frame, int xpos, int ypos, int size, int dpos)
				2160	{
				2161	for (int x = 0; x < size >> 3; x++)
				2162	deblock8x8(s, frame, xpos + x * 8, ypos, dpos + x * 2);
				2163
				2164	for (int y = 1; y < size >> 3; y++)
				2165	deblock8x8(s, frame, xpos, ypos + y * 8, dpos + y * 2 * s->dblk_stride);
				2166	}
				2167
				2168	static void deblock_cu_r(RV60Context * s, AVFrame * frame, ThreadContext * thread, int xpos, int ypos, int log_size, int qp)
				2169	{
				2170	int pu_pos, tsize, ntiles;
				2171	enum CUType cu_type;
				2172
				2173	if (xpos >= s->awidth \|\| ypos >= s->aheight)
				2174	return;
				2175
				2176	if (thread->cu_split[thread->cu_split_pos++]) {
				2177	int hsize = 1 << (log_size - 1);
				2178	log_size--;
				2179	deblock_cu_r(s, frame, thread, xpos, ypos, log_size, qp);
				2180	deblock_cu_r(s, frame, thread, xpos + hsize, ypos, log_size, qp);
				2181	deblock_cu_r(s, frame, thread, xpos, ypos + hsize, log_size, qp);
				2182	deblock_cu_r(s, frame, thread, xpos + hsize, ypos + hsize, log_size, qp);
				2183	return;
				2184	}
				2185
				2186	pu_pos = (ypos >> 3) * s->pu_stride + (xpos >> 3);
				2187	cu_type = s->pu_info[pu_pos].cu_type;
				2188	switch (log_size) {
				2189	case 3: tsize = 3; break;
				2190	case 4: tsize = cu_type && s->pu_info[pu_pos].pu_type ? 3 : 4; break;
				2191	case 5:
				2192	case 6: tsize = 4; break;
				2193	}
				2194	ntiles = 1 << (log_size - tsize);
				2195
				2196	for (int ty = 0; ty < ntiles; ty++)
				2197	for (int tx = 0; tx < ntiles; tx++) {
				2198	int x = xpos + (tx << tsize);
				2199	int y = ypos + (ty << tsize);
				2200	int cu_pos = ((y & 63) >> 3) * 8 + ((x & 63) >> 3);
				2201
				2202	if (cu_type == CU_INTRA)
				2203	deblock_set_strength(s, x, y, 1 << tsize, qp, 2);
				2204	else if (cu_type != CU_SKIP && thread->coded_blk[cu_pos])
				2205	deblock_set_strength(s, x, y, 1 << tsize, qp, 1);
				2206	else {
				2207	deblock_set_strength(s, x, y, 1 << tsize, qp, 0);
				2208	derive_deblock_strength(s, x, y, 1 << (tsize - 2));
				2209	}
				2210
				2211	deblock(s, frame, x, y, 1 << tsize, deblock_get_pos(s, x, y));
				2212	}
				2213	}
				2214
				2215	static int read_qp_offset(GetBitContext *gb, int qp_off_type)
				2216	{
				2217	int val;
				2218
				2219	switch (qp_off_type) {
				2220	case 0:
				2221	return 0;
				2222	case 1:
				2223	val = read_code012(gb);
				2224	return val != 2 ? val : -1;
				2225	default:
				2226	if (!get_bits1(gb))
				2227	return 0;
				2228	val = get_bits(gb, 2);
				2229	if (!(val & 2))
				2230	return val + 1;
				2231	else
				2232	return -((val & 1) + 1);
				2233	}
				2234	}
				2235
				2236	static int calc_sel_qp(int osvquant, int qp)
				2237	{
				2238	switch (osvquant) {
				2239	case 0: return qp;
				2240	case 1: return qp < 25 ? qp + 5 : qp;
				2241	default:
				2242	if (qp <= 18)
				2243	return qp + 10;
				2244	else if (qp <= 25)
				2245	return qp + 5;
				2246	else
				2247	return qp;
				2248	}
				2249	}
				2250
				2251	static int decode_slice(AVCodecContext avctx, void tdata, int cu_y, int threadnr)
				2252	{
				2253	RV60Context *s = avctx->priv_data;
				2254	AVFrame * frame = tdata;
				2255	ThreadContext thread;
				2256	GetBitContext gb;
				2257	int qp, sel_qp, ret;
				2258
				2259	thread.avg_data[0] = thread.avg_buffer;
				2260	thread.avg_data[1] = thread.avg_buffer + 64*64;
				2261	thread.avg_data[2] = thread.avg_buffer + 6464 + 3232;
				2262	thread.avg_linesize[0] = 64;
				2263	thread.avg_linesize[1] = 32;
				2264	thread.avg_linesize[2] = 32;
				2265
Peter Ross	923f454	2024-11-05 20:58:59	[diff] [blame]	2266	if ((ret = init_get_bits8(&gb, s->slice[cu_y].data, s->slice[cu_y].size)) < 0)
				2267	return ret;
Peter Ross	33802e7	2024-11-02 23:53:15	[diff] [blame]	2268
				2269	for (int cu_x = 0; cu_x < s->cu_width; cu_x++) {
				2270	if ((s->avctx->active_thread_type & FF_THREAD_SLICE) && cu_y)
				2271	ff_thread_progress_await(&s->progress[cu_y - 1], cu_x + 2);
				2272
				2273	qp = s->qp + read_qp_offset(&gb, s->qp_off_type);
Peter Ross	d51a920	2024-11-05 20:57:17	[diff] [blame]	2274	if (qp < 0)
				2275	return AVERROR_INVALIDDATA;
Peter Ross	33802e7	2024-11-02 23:53:15	[diff] [blame]	2276	sel_qp = calc_sel_qp(s->osvquant, qp);
				2277
				2278	memset(thread.coded_blk, 0, sizeof(thread.coded_blk));
				2279	thread.cu_split_pos = 0;
				2280
				2281	if ((ret = decode_cu_r(s, frame, &thread, &gb, cu_x << 6, cu_y << 6, 6, qp, sel_qp)) < 0)
				2282	return ret;
				2283
				2284	if (s->deblock) {
				2285	thread.cu_split_pos = 0;
				2286	deblock_cu_r(s, frame, &thread, cu_x << 6, cu_y << 6, 6, qp);
				2287	}
				2288
				2289	if (s->avctx->active_thread_type & FF_THREAD_SLICE)
				2290	ff_thread_progress_report(&s->progress[cu_y], cu_x + 1);
				2291	}
				2292
				2293	if (s->avctx->active_thread_type & FF_THREAD_SLICE)
				2294	ff_thread_progress_report(&s->progress[cu_y], INT_MAX);
				2295
				2296	return 0;
				2297	}
				2298
				2299	static int rv60_decode_frame(AVCodecContext avctx, AVFrame frame,
				2300	int * got_frame, AVPacket * avpkt)
				2301	{
				2302	RV60Context *s = avctx->priv_data;
				2303	GetBitContext gb;
				2304	int ret, header_size, width, height, ofs;
				2305
				2306	if (avpkt->size == 0) {
				2307	if (s->last_frame[NEXT_PIC]->data[0]) {
				2308	av_frame_move_ref(frame, s->last_frame[NEXT_PIC]);
				2309	*got_frame = 1;
				2310	}
				2311	return 0;
				2312	}
				2313
				2314	if (avpkt->size < 9)
				2315	return AVERROR_INVALIDDATA;
				2316
				2317	header_size = avpkt->data[0] * 8 + 9;
				2318	if (avpkt->size < header_size)
				2319	return AVERROR_INVALIDDATA;
				2320
Peter Ross	923f454	2024-11-05 20:58:59	[diff] [blame]	2321	if ((ret = init_get_bits8(&gb, avpkt->data + header_size, avpkt->size - header_size)) < 0)
				2322	return ret;
Peter Ross	33802e7	2024-11-02 23:53:15	[diff] [blame]	2323
				2324	if ((ret = read_frame_header(s, &gb, &width, &height)) < 0)
				2325	return ret;
				2326
				2327	if (avctx->skip_frame >= AVDISCARD_NONREF && s->pict_type == AV_PICTURE_TYPE_B \|\|
				2328	avctx->skip_frame >= AVDISCARD_NONKEY && s->pict_type != AV_PICTURE_TYPE_I \|\|
				2329	avctx->skip_frame >= AVDISCARD_ALL)
				2330	return avpkt->size;
				2331
				2332	if (s->pict_type != AV_PICTURE_TYPE_B)
				2333	FFSWAP(AVFrame *, s->last_frame[NEXT_PIC], s->last_frame[LAST_PIC]);
				2334
				2335	if ((s->pict_type == AV_PICTURE_TYPE_P && !s->last_frame[LAST_PIC]->data[0]) \|\|
				2336	(s->pict_type == AV_PICTURE_TYPE_B && (!s->last_frame[LAST_PIC]->data[0] \|\| !s->last_frame[NEXT_PIC]->data[0]))) {
				2337	av_log(s->avctx, AV_LOG_ERROR, "missing reference frame\n");
				2338	return AVERROR_INVALIDDATA;
				2339	}
				2340
				2341	s->last_frame[CUR_PIC]->pict_type = s->pict_type;
				2342	if (s->pict_type == AV_PICTURE_TYPE_I)
				2343	s->last_frame[CUR_PIC]->flags \|= AV_FRAME_FLAG_KEY;
				2344
				2345	if ((ret = update_dimensions_clear_info(s, width, height)) < 0)
				2346	return ret;
				2347
				2348	if (!s->last_frame[CUR_PIC]->data[0])
				2349	if ((ret = ff_get_buffer(avctx, s->last_frame[CUR_PIC], 0)) < 0)
				2350	return ret;
				2351
				2352	if ((ret = read_slice_sizes(s, &gb)) < 0)
				2353	return ret;
				2354
				2355	ofs = get_bits_count(&gb) / 8;
				2356
				2357	for (int i = 0; i < s->cu_height; i++) {
Peter Ross	4d4d171	2024-11-06 23:27:06	[diff] [blame^]	2358	if (header_size + ofs >= avpkt->size)
				2359	return AVERROR_INVALIDDATA;
Peter Ross	33802e7	2024-11-02 23:53:15	[diff] [blame]	2360	s->slice[i].data = avpkt->data + header_size + ofs;
				2361	s->slice[i].data_size = FFMIN(s->slice[i].size, avpkt->size - header_size - ofs);
				2362	ofs += s->slice[i].size;
				2363	}
				2364
				2365	ret = progress_init(s, s->cu_height);
				2366	if (ret < 0)
				2367	return ret;
				2368
				2369	s->avctx->execute2(s->avctx, decode_slice, s->last_frame[CUR_PIC], NULL, s->cu_height);
				2370
				2371	ret = 0;
				2372	if (s->pict_type == AV_PICTURE_TYPE_B)
				2373	av_frame_move_ref(frame, s->last_frame[CUR_PIC]);
				2374	else if (s->last_frame[LAST_PIC]->data[0])
				2375	ret = av_frame_ref(frame, s->last_frame[LAST_PIC]);
				2376	if (ret < 0)
				2377	return ret;
				2378
				2379	if (frame->data[0])
				2380	*got_frame = 1;
				2381
				2382	if (s->pict_type != AV_PICTURE_TYPE_B) {
				2383	av_frame_unref(s->last_frame[NEXT_PIC]);
				2384	FFSWAP(AVFrame *, s->last_frame[CUR_PIC], s->last_frame[NEXT_PIC]);
				2385	}
				2386
				2387	if (s->pict_type != AV_PICTURE_TYPE_B) {
				2388	s->ref_pts[0] = s->ref_pts[1];
				2389	s->ref_pts[1] = avpkt->pts;
				2390
				2391	s->ref_ts[0] = s->ref_ts[1];
				2392	s->ref_ts[1] = s->ts;
				2393
				2394	if (s->ref_pts[1] > s->ref_pts[0] && s->ref_ts[1] > s->ref_ts[0])
				2395	s->ts_scale = (s->ref_pts[1] - s->ref_pts[0]) / (s->ref_ts[1] - s->ref_ts[0]);
				2396	} else {
				2397	frame->pts = s->ref_pts[0] + (s->ts - s->ref_ts[0]) * s->ts_scale;
				2398	}
				2399
				2400	return avpkt->size;
				2401	}
				2402
				2403	static void rv60_flush(AVCodecContext *avctx)
				2404	{
				2405	RV60Context *s = avctx->priv_data;
				2406
				2407	for (int i = 0; i < 3; i++)
				2408	av_frame_unref(s->last_frame[i]);
				2409	}
				2410
				2411	static av_cold int rv60_decode_end(AVCodecContext * avctx)
				2412	{
				2413	RV60Context *s = avctx->priv_data;
				2414
				2415	for (int i = 0; i < 3; i++)
				2416	av_frame_free(&s->last_frame[i]);
				2417
				2418	av_freep(&s->slice);
				2419	av_freep(&s->pu_info);
				2420	av_freep(&s->blk_info);
				2421	av_freep(&s->top_str);
				2422	av_freep(&s->left_str);
				2423
				2424	for (int i = 0; i < s->nb_progress; i++)
				2425	ff_thread_progress_destroy(&s->progress[i]);
				2426	av_freep(&s->progress);
				2427
				2428	return 0;
				2429	}
				2430
				2431	const FFCodec ff_rv60_decoder = {
				2432	.p.name = "rv60",
				2433	CODEC_LONG_NAME("RealVideo 6.0"),
				2434	.p.type = AVMEDIA_TYPE_VIDEO,
				2435	.p.id = AV_CODEC_ID_RV60,
				2436	.priv_data_size = sizeof(RV60Context),
				2437	.init = rv60_decode_init,
				2438	.close = rv60_decode_end,
				2439	FF_CODEC_DECODE_CB(rv60_decode_frame),
				2440	.flush = rv60_flush,
				2441	.p.capabilities = AV_CODEC_CAP_DR1 \| AV_CODEC_CAP_DELAY \| AV_CODEC_CAP_SLICE_THREADS,
				2442	.caps_internal = FF_CODEC_CAP_INIT_CLEANUP,
				2443	};