mariadb/mysql-test/main/distinct_notembedded.test

# Embedded doesn't have optimizer trace:
--source include/not_embedded.inc
--source include/have_sequence.inc

--echo #
--echo # MDEV-30660 COUNT DISTINCT seems unnecessarily slow when run on a PK
--echo #

#Enable after fix MDEV-32034
--disable_view_protocol
set @save_optimizer_trace = @@optimizer_trace;
SET optimizer_trace='enabled=on';
let $trace=
SELECT JSON_DETAILED(JSON_EXTRACT(trace, '\$**.prepare_sum_aggregators')) AS JS
  FROM INFORMATION_SCHEMA.OPTIMIZER_TRACE;

CREATE TABLE t1 (a INT NOT NULL PRIMARY KEY, b INT NOT NULL);
INSERT INTO t1 VALUES (1,1), (2,1), (3,1);

--echo # Optimization is applied (aggregator=simple):
SELECT COUNT(DISTINCT a) FROM t1;
eval $trace;

SELECT AVG(DISTINCT a), SUM(DISTINCT b) FROM t1;
eval $trace;

--echo # Only `a` is unique but it's enough to eliminate DISTINCT:
SELECT COUNT(DISTINCT b, a) FROM t1;
eval $trace;

SELECT COUNT(DISTINCT a, a + b) FROM t1;
eval $trace;

SELECT SUM(DISTINCT a), AVG(DISTINCT a), COUNT(DISTINCT a) FROM t1 WHERE a > 1;
eval $trace;

--echo # Optimization is not applied 'cause function argument is not a field
--echo # (aggregator=distinct):
SELECT SUM(DISTINCT a + b) FROM t1;
eval $trace;

SELECT COUNT(DISTINCT b) FROM t1;
eval $trace;

SELECT AVG(DISTINCT b / a) FROM t1;
eval $trace;

EXPLAIN SELECT COUNT(DISTINCT (SELECT a)) FROM t1;
eval $trace;

CREATE TABLE t2 (a INT);
INSERT INTO t2 VALUES (1), (2);

--echo # Optimization is not applied 'cause there is more than one table
SELECT COUNT(DISTINCT t1.a) FROM t1, t2;
eval $trace;

SELECT AVG(DISTINCT t1.a) FROM t1, t2;
eval $trace;

--echo # Const tables, optimization is applied
SELECT COUNT(DISTINCT a) FROM t1, (SELECT 1) AS t2;
eval $trace;

SELECT AVG(DISTINCT t1.a) FROM (SELECT 1 AS a) AS t2, t1, (SELECT 2 AS a) AS t3;
eval $trace;

SELECT COUNT(DISTINCT a) FROM t1, (SELECT 1 UNION SELECT 2) AS t2;
eval $trace;

--echo # Unique index on two columns
CREATE TABLE t3 (a INT NOT NULL, b INT NOT NULL);
INSERT INTO t3 VALUES (1,1), (1,2), (1,3), (2,1), (2,2), (3,1), (3,2);
CREATE UNIQUE INDEX t3_a_b ON t3 (a, b);
--echo # Optimization is applied:
SELECT COUNT(DISTINCT a, b) FROM t3;
eval $trace;

SELECT COUNT(DISTINCT b, a) FROM t3;
eval $trace;

SELECT COUNT(DISTINCT b, a) FROM t3 WHERE a < 3;
eval $trace;

--echo # Optimization is applied to one of the functions:
SELECT COUNT(DISTINCT b), SUM(DISTINCT a), SUM(DISTINCT a + b) FROM t3 GROUP BY a;
eval $trace;

--echo # Can't apply optimization 'cause GROUP BY argument is not a field:
SELECT COUNT(DISTINCT b) FROM t3 GROUP BY a+b;
eval $trace;

--echo # Test merged view
CREATE VIEW v1 AS SELECT * FROM t1;
--echo # Optimization is applied
SELECT COUNT(DISTINCT a, b) FROM v1;
eval $trace;

--echo # GROUP_CONCAT implements non-standard distinct aggregator
SELECT GROUP_CONCAT(b) FROM t1;
eval $trace;

SELECT GROUP_CONCAT(DISTINCT b) FROM t1;
eval $trace;

DROP TABLE t1, t2, t3;
DROP VIEW v1;
SET optimizer_trace = @save_optimizer_trace;
--enable_view_protocol

--echo #
--echo # end of 10.5 tests
--echo #
MDEV-30660 Aggregation functions fail to leverage uniqueness property When executing a statement of the form SELECT AGGR_FN(DISTINCT c1, c2,..,cn) FROM t1, where AGGR_FN is an aggregate function such as COUNT(), AVG() or SUM(), and a unique index exists on table t1 covering some or all of the columns (c1, c2,..,cn), the retrieved values are inherently unique. Consequently, the need for de-duplication imposed by the DISTINCT clause can be eliminated, leading to optimization of aggregation operations. This optimization applies under the following conditions: - only one table involved in the join (not counting const tables) - some arguments of the aggregate function are fields (not functions/subqueries) This optimization extends to queries of the form SELECT AGGR_FN(c1, c2,..,cn) GROUP BY cx,..cy when a unique index covers some or all of the columns (c1, c2,..cn, cx,..cy) 2024-01-18 10:18:08 +01:00			`# Embedded doesn't have optimizer trace:`
			`--source include/not_embedded.inc`
			`--source include/have_sequence.inc`

			`--echo #`
			`--echo # MDEV-30660 COUNT DISTINCT seems unnecessarily slow when run on a PK`
			`--echo #`

MDEV-31933: Make working view-protocol + ps-protocol (running two protocols together) Fix for v. 10.5 2023-08-30 07:22:07 +02:00			`#Enable after fix MDEV-32034`
			`--disable_view_protocol`
MDEV-30660 Aggregation functions fail to leverage uniqueness property When executing a statement of the form SELECT AGGR_FN(DISTINCT c1, c2,..,cn) FROM t1, where AGGR_FN is an aggregate function such as COUNT(), AVG() or SUM(), and a unique index exists on table t1 covering some or all of the columns (c1, c2,..,cn), the retrieved values are inherently unique. Consequently, the need for de-duplication imposed by the DISTINCT clause can be eliminated, leading to optimization of aggregation operations. This optimization applies under the following conditions: - only one table involved in the join (not counting const tables) - some arguments of the aggregate function are fields (not functions/subqueries) This optimization extends to queries of the form SELECT AGGR_FN(c1, c2,..,cn) GROUP BY cx,..cy when a unique index covers some or all of the columns (c1, c2,..cn, cx,..cy) 2024-01-18 10:18:08 +01:00			`set @save_optimizer_trace = @@optimizer_trace;`
			`SET optimizer_trace='enabled=on';`
			`let $trace=`
			`SELECT JSON_DETAILED(JSON_EXTRACT(trace, '\$**.prepare_sum_aggregators')) AS JS`
			`FROM INFORMATION_SCHEMA.OPTIMIZER_TRACE;`

			`CREATE TABLE t1 (a INT NOT NULL PRIMARY KEY, b INT NOT NULL);`
			`INSERT INTO t1 VALUES (1,1), (2,1), (3,1);`

			`--echo # Optimization is applied (aggregator=simple):`
			`SELECT COUNT(DISTINCT a) FROM t1;`
			`eval $trace;`

			`SELECT AVG(DISTINCT a), SUM(DISTINCT b) FROM t1;`
			`eval $trace;`

			--echo # Only `a` is unique but it's enough to eliminate DISTINCT:
			`SELECT COUNT(DISTINCT b, a) FROM t1;`
			`eval $trace;`

			`SELECT COUNT(DISTINCT a, a + b) FROM t1;`
			`eval $trace;`

			`SELECT SUM(DISTINCT a), AVG(DISTINCT a), COUNT(DISTINCT a) FROM t1 WHERE a > 1;`
			`eval $trace;`

			`--echo # Optimization is not applied 'cause function argument is not a field`
			`--echo # (aggregator=distinct):`
			`SELECT SUM(DISTINCT a + b) FROM t1;`
			`eval $trace;`

			`SELECT COUNT(DISTINCT b) FROM t1;`
			`eval $trace;`

			`SELECT AVG(DISTINCT b / a) FROM t1;`
			`eval $trace;`

			`EXPLAIN SELECT COUNT(DISTINCT (SELECT a)) FROM t1;`
			`eval $trace;`

			`CREATE TABLE t2 (a INT);`
			`INSERT INTO t2 VALUES (1), (2);`

			`--echo # Optimization is not applied 'cause there is more than one table`
			`SELECT COUNT(DISTINCT t1.a) FROM t1, t2;`
			`eval $trace;`

			`SELECT AVG(DISTINCT t1.a) FROM t1, t2;`
			`eval $trace;`

			`--echo # Const tables, optimization is applied`
			`SELECT COUNT(DISTINCT a) FROM t1, (SELECT 1) AS t2;`
			`eval $trace;`

			`SELECT AVG(DISTINCT t1.a) FROM (SELECT 1 AS a) AS t2, t1, (SELECT 2 AS a) AS t3;`
			`eval $trace;`

			`SELECT COUNT(DISTINCT a) FROM t1, (SELECT 1 UNION SELECT 2) AS t2;`
			`eval $trace;`

			`--echo # Unique index on two columns`
			`CREATE TABLE t3 (a INT NOT NULL, b INT NOT NULL);`
			`INSERT INTO t3 VALUES (1,1), (1,2), (1,3), (2,1), (2,2), (3,1), (3,2);`
			`CREATE UNIQUE INDEX t3_a_b ON t3 (a, b);`
			`--echo # Optimization is applied:`
			`SELECT COUNT(DISTINCT a, b) FROM t3;`
			`eval $trace;`

			`SELECT COUNT(DISTINCT b, a) FROM t3;`
			`eval $trace;`

			`SELECT COUNT(DISTINCT b, a) FROM t3 WHERE a < 3;`
			`eval $trace;`

			`--echo # Optimization is applied to one of the functions:`
			`SELECT COUNT(DISTINCT b), SUM(DISTINCT a), SUM(DISTINCT a + b) FROM t3 GROUP BY a;`
			`eval $trace;`

			`--echo # Can't apply optimization 'cause GROUP BY argument is not a field:`
			`SELECT COUNT(DISTINCT b) FROM t3 GROUP BY a+b;`
			`eval $trace;`

			`--echo # Test merged view`
			`CREATE VIEW v1 AS SELECT * FROM t1;`
			`--echo # Optimization is applied`
			`SELECT COUNT(DISTINCT a, b) FROM v1;`
			`eval $trace;`

			`--echo # GROUP_CONCAT implements non-standard distinct aggregator`
			`SELECT GROUP_CONCAT(b) FROM t1;`
			`eval $trace;`

			`SELECT GROUP_CONCAT(DISTINCT b) FROM t1;`
			`eval $trace;`

			`DROP TABLE t1, t2, t3;`
			`DROP VIEW v1;`
			`SET optimizer_trace = @save_optimizer_trace;`
MDEV-31933: Make working view-protocol + ps-protocol (running two protocols together) Fix for v. 10.5 2023-08-30 07:22:07 +02:00			`--enable_view_protocol`

MDEV-30660 Aggregation functions fail to leverage uniqueness property When executing a statement of the form SELECT AGGR_FN(DISTINCT c1, c2,..,cn) FROM t1, where AGGR_FN is an aggregate function such as COUNT(), AVG() or SUM(), and a unique index exists on table t1 covering some or all of the columns (c1, c2,..,cn), the retrieved values are inherently unique. Consequently, the need for de-duplication imposed by the DISTINCT clause can be eliminated, leading to optimization of aggregation operations. This optimization applies under the following conditions: - only one table involved in the join (not counting const tables) - some arguments of the aggregate function are fields (not functions/subqueries) This optimization extends to queries of the form SELECT AGGR_FN(c1, c2,..,cn) GROUP BY cx,..cy when a unique index covers some or all of the columns (c1, c2,..cn, cx,..cy) 2024-01-18 10:18:08 +01:00			`--echo #`
			`--echo # end of 10.5 tests`
			`--echo #`