神奇的 SQL 之谓词 → 难理解的 EXISTS

  • 时间:
  • 浏览:0
  • 来源:大发uu快3_uu快3规则_大发uu快3规则

前言

  开心一刻

我能飞的更高,飞的更高,啊!

谓词

  SQL 中的谓词指的是:返回值是逻辑值的函数。亲戚亲戚大家儿知道函数的返回值有不可能 是数字、字符串不可能 日期等等,但谓词的返回值完整篇 是逻辑值(TRUE/FALSE/UNKNOW),谓词是有两种特殊的函数。关于逻辑值,都不能查看:神奇的 SQL 之温柔的陷阱 → 三值逻辑 与 NULL !

  SQL 中的谓词有太满,如 =、>、<、<> 等,亲戚亲戚大家儿来看看 SQL 具体有那先 常用的谓词

  比较谓词

    创建表与初始化数据

-- 1、表创建并初始化数据
DROP TABLE IF EXISTS tbl_student;
CREATE TABLE tbl_student (
  id INT(8) unsigned NOT NULL AUTO_INCREMENT COMMENT '自增主键',
  sno VARCHAR(12) NOT NULL COMMENT '学号',
    name VARCHAR(5) NOT NULL COMMENT '姓名',
    age TINYINT(3) NOT NULL COMMENT '年龄',
  sex TINYINT(1) NOT NULL COMMENT '性别,1:男,2:女',
  PRIMARY KEY (id)
);
INSERT INTO tbl_student(sno,name,age,sex) VALUES
('201903007001','李小龙',21,1),
('201903007002','王祖贤',16,2),
('20190300300003','林青霞',17,2),
('20190300300004','李嘉欣',15,2),
('201903009005','周润发',20,1),
('201903009006','张国荣',18,1);

DROP TABLE IF EXISTS tbl_student_class;
CREATE TABLE tbl_student_class (
  id int(8) unsigned NOT NULL AUTO_INCREMENT COMMENT '自增主键',
  sno varchar(12) NOT NULL COMMENT '学号',
  cno varchar(5) NOT NULL COMMENT '班级号',
  cname varchar(20) NOT NULL COMMENT '班级名',
  PRIMARY KEY (`id`)
) COMMENT='学生班级表';
INSERT INTO tbl_student_class VALUES 
('1', '201903007001', '03007', '影视7班'),
('2', '201903007002', '03007', '影视7班'),
('3', '20190300300003', '03008', '影视8班'),
('4', '20190300300004', '03008', '影视8班'),
('5', '201903009005', '03009', '影视9班'),
('6', '201903009006', '03009', '影视9班');

SELECT * FROM tbl_student;
SELECT * FROM tbl_student_class;

    相信亲戚亲戚大家儿对 =、>、<、<>(!=)等比较运算符都非常熟悉,它们的正式名称就是比较谓词,使用示类式下

-- 比较谓词示例
SELECT * FROM tbl_student WHERE name = '王祖贤';
SELECT * FROM tbl_student WHERE age > 18;
SELECT * FROM tbl_student WHERE age < 18;
SELECT * FROM tbl_student WHERE age <> 18;
SELECT * FROM tbl_student WHERE age <= 18;

  LIKE

    当亲戚亲戚大家儿想用 SQL 做随后 简单的模糊查询时,都有用到 LIKE 谓词,分为 前一致、中一致和后一致,使用示类式下

-- LIKE谓词
SELECT * FROM tbl_student WHERE name LIKE '李%';         -- 前一致
SELECT * FROM tbl_student WHERE name LIKE '%青%';        -- 中一致
SELECT * FROM tbl_student WHERE name LIKE '青%';        -- 后一致

    不可能 name字段上建了索引,如此前一致会利用索引;而中一致、后一致会走全表扫描。

  BETWEEN

    当亲戚亲戚大家儿想进行范围查询时,往往会用到 BETWEEN 谓词,示类式下

-- BETWEEN谓词
SELECT * FROM tbl_student WHERE age BETWEEN 15 AND 22;
SELECT * FROM tbl_student WHERE age NOT BETWEEN 15 AND 22;

    BETWEEN  和它随后 的第3个 多多 AND 组成3个 多多范围条件;BETWEEN 会蕴含临界值 15 和 22

SELECT * FROM tbl_student WHERE age BETWEEN 15 AND 22;
-- 等价于
SELECT * FROM tbl_student WHERE age >= 15 AND age <= 22;

    若随后蕴含临界值,那就需要如此写了

SELECT * FROM tbl_student WHERE age > 15 AND age < 22;

  IS NULL 和 IS NOT NULL

    NULL 的水太满,具体可看:神奇的 SQL 之温柔的陷阱 → 三值逻辑 与 NULL !

  IN

    有如此 3个 多多需求:查询出年龄等于 15、18以及20的学生,亲戚亲戚大家儿会用 OR 来查

-- OR
SELECT * FROM tbl_student WHERE age = 15 OR age = 18 OR age = 20;

    用 OR 来查没问题报告 ,随后 有随后 严重不足,不可能 选择的对象太满,SQL会变得如此长,阅读性会如此差。太满亲戚亲戚大家儿都不能用 IN 来代替

-- IN
SELECT * FROM tbl_student WHERE age IN(15,18,20);

    IN 有有两种随后 谓词如此的使用土依据 :使用子查询作为其参数,你这一在平时项目中也是用的非常多的,类式:查询出影视7班的学生信息

-- IN实现,但不推荐
SELECT * FROM tbl_student 
WHERE sno IN (
    SELECT sno FROM tbl_student_class 
    WHERE cname = '影视7班'
); 

-- 联表查,推荐
SELECT ts.* FROM
tbl_student_class tsc LEFT JOIN tbl_student ts ON tsc.sno = ts.sno
WHERE tsc.cname = '影视7班';

    太满状况下,IN 是都不能用联表查询来替换的

EXISTS

  EXISTS也是 SQL 谓词,但平时用的太满,都有 说适用场景少,就是它不好驾驭,亲戚亲戚大家儿用不好它。它用法与随后 谓词不一样,随后 不好理解,另外太满状况下亲戚亲戚大家儿都用 IN 来替代它了。

  理论篇

    在真正讲解 EXSITS 示例随后 ,亲戚亲戚大家儿先来了解下理论知识:实体的阶层 、全称量化与地处量化

    实体的阶层

      SQL 严格区分阶层,必须跨阶层操作。就用亲戚亲戚大家儿常用的谓词来举例,同样是谓词,随后 与 = 、BETWEEN 等相比,EXISTS 的用法还是大不相同的。概括来说,区别在于“谓词的参数都不能取那先 值”;“x = y”或 “x BETWEEN y ” 等谓词都不能取的参数是像 “21” 不可能 “李小龙” 如此 的单一值,亲戚亲戚大家儿称之为标量值,而 EXISTS 都不能取的参数究竟是那先 呢?从下面这条 SQL 句子来看,EXISTS 的参数不像是单一值

SELECT * FROM tbl_student ts
WHERE EXISTS (
    SELECT * FROM tbl_student_class tsc
    WHERE ts.sno = tsc.sno
);

      亲戚亲戚大家儿都不能看出 EXISTS 的参数是行数据的集合。随便说说如此说,是不可能 无论子查询中选择那先 样的列,对于 EXISTS 来说都有 一样的。在 EXISTS 的子查询里, SELECT 子句的列表就算是下面这有两种写法。

1. 通配符:SELECT *
2. 常量:SELECT '1'
3. 列名:SELECT tsc.id

      也就是说如下 3 条 SQL 查到的结果是一样的

      用个图来概括下一般的谓词与 EXISTS 的区别

 

      从上图亲戚亲戚大家儿知道,EXISTS 的特殊性在于输入值的阶数(输出值和随后 谓词一样,都有 逻辑值)。谓词逻辑中,根据输入值的阶数对谓词进行分类。= 不可能 BETWEEEN 等输入值为一行的谓词叫作“一阶谓词”,而像 EXISTS 如此 输入值为行的集合的谓词叫作 “二阶谓词”。关于 “阶” ,有兴趣的都不能区看我的另一篇博客:神奇的 SQL 之层级 → 为那先 GROUP BY 随后 必须直接引用原表中的列

    全称量化和地处量化

      谓词逻辑蕴含量词(限量词、数量词)类式特殊的谓词。亲戚亲戚大家儿都不能用它们来表达随后 如此 的命题:“所有的 x 都满足条件 P” 不可能 “地处(为宜3个 多多)满足条件 P 的 x ”,前者称为“全称量词”,后者称为“地处量词”,分别记作 ∀(A的下倒)、∃(E的左倒)。

      SQL 中的 EXISTS 谓词实现了谓词逻辑中的地处量词,然而遗憾的是, SQL 却并如此实现全称量词。随后 如此全称量词无须算是 SQL 的致命严重不足,不可能 全称量词和地处量词假使 定义了3个 多多,如此 就都不能被推导出来。具体都不能参考下面你这一等价改写的规则(德·摩根定律)。

∀ x P x = ¬ ∃ x ¬P(所有的 x 都满足条件 P =不地处不满足条件 P 的 x )

∃ x P x = ¬ ∀ x ¬Px(地处 x 满足条件 P =无须所有的 x 都有 满足条件 P)

      随后 在 SQL 中,为了表达全称量化,需要将"所有的行都满足条件P" 如此 的命题转加进去 "不地处不满足条件 P 的行"

  实践篇

    底下的理论篇,亲戚亲戚大家儿看过随后 不可能 还是有点儿晕,亲戚亲戚大家儿结合具体的实际案例来看看 EXISTS 的妙用

    查询表中“不”地处的数据

      底下的 tbl_student中的学生都分配到了具体的班级,假设新来了3个 多多学生(刘德华、张家辉),亲戚亲戚大家暂时还未被分配到班级,亲戚亲戚大家儿怎样才能将亲戚亲戚大家查询出来(查询未被分配到班级的学生信息)。

-- 新来、未被分配到班级的学生
INSERT INTO tbl_student(sno,name,age,sex) VALUES
('201906300010','刘德华',55,1),
('201906300011','张家辉',46,1);

      亲戚亲戚大家儿最容易想到的 SQL 肯定是下面这条

-- NOT IN 实现
SELECT * FROM tbl_student WHERE sno NOT IN(SELECT sno FROM tbl_student_class);

      随便说说用 NOT EXISTS 也是都不能实现的

-- NOT EXISTS 实现
SELECT * FROM tbl_student ts
WHERE NOT EXISTS (
    SELECT * FROM tbl_student_class tsc WHERE ts.sno = tsc.sno
);

    全称量化 :习惯 “肯定 ⇔ 双重否定” 之间的转换

      EXISTS 谓词来表达全称量化,这是EXISTS 的用法中很具有代表性的3个 多多用法。随后 需要亲戚亲戚大家儿打破常规思维,习惯从全称量化 “所有的行都××” 到其双重否定 “不××的行一行都有 地处” 的转换。

      假设亲戚亲戚大家儿有学生成绩表:tbl_student_score

-- 学生成绩表
DROP TABLE IF EXISTS tbl_student_score;
CREATE TABLE tbl_student_score (
  id INT(8) unsigned NOT NULL AUTO_INCREMENT COMMENT '自增主键',
  sno VARCHAR(12) NOT NULL COMMENT '学号',
    subject VARCHAR(5) NOT NULL COMMENT '课程',
    score TINYINT(3) NOT NULL COMMENT '分数',
  PRIMARY KEY (id)
);
INSERT INTO tbl_student_score(sno,subject,score) VALUES
('201903007001','数学',3000),
('201903007001','语文',3000),
('201903007001','物理',3000),
('20190300300003','数学',3000),
('20190300300003','语文',95),
('201903009006','数学',40),
('201903009006','语文',90),
('201906300011','数学',3000);

SELECT * FROM tbl_student_score;

      1、查询出“所有科目分数都有 3000 分以上的学生”

        201903007001、20190300300003、201906300011 这3个 多多学生满足条件,亲戚亲戚大家儿需要将这 3 个学生查出来,你这一 SQL 该怎样才能写? 亲戚亲戚大家儿需要转换下命题,将查询条件“所有科目分数都有 3000 分以上” 转加进去它的双重否定 “如此3个 多多科目分数不满 3000 分”,随后 用 NOT EXISTS 来表示转换后的命题

-- 如此3个



多多科目分数不满 3000 分
SELECT DISTINCT sno
FROM tbl_student_score tss1
WHERE NOT EXISTS -- 不地处满足以下条件的行
(    SELECT * FROM tbl_student_score tss2
    WHERE tss2.sno = tss1.sno
    AND tss2.score < 3000    -- 分数不满3000 分的科目
);

      2、查询出“数学分数在 3000 分以上(蕴含3000)且语文分数在 3000 分以上(蕴含)的学生”

        结果应该是学号分别为 201903007001、20190300300003 的学生。像如此 的需求,亲戚亲戚大家儿在实际业务中应该会总是遇到,随后 乍一看不可能 会随便说说不太像是全称量化的条件。不可能 改成下面如此 的说法,不可能 亲戚亲戚大家儿一下子就能明白它是全称量化的命题了。

"某个学生的所有行数据中,不可能

科目是数学,则分数在 3000 分以上;不可能

科目是语文,则分数在 3000 分以上。"

        亲戚亲戚大家儿再转加进去它双重否定:某个学生的所有行数据中,不可能 科目是数学,则分数不低于 3000;不可能 科目是语文,则分数不低于 3000 ;亲戚亲戚大家儿都不能按照如下顺序写出亲戚亲戚大家儿随后的 SQL

-- 1、CASE 表达式,肯定
CASE WHEN subject = '数学' AND score >= 3000 THEN 1
        WHEN subject = '语文' AND score >= 3000 THEN 1
        ELSE 0 
END;

-- 2、CASE 表达式,单重否定(加进去去 NOT EXISTS才算双重)
CASE WHEN subject = '数学' AND score < 3000 THEN 1
        WHEN subject = '语文' AND score < 3000 THEN 1
    ELSE 0 
END;

-- 3、结果蕴含了 201906300011 的 SQL 
SELECT DISTINCT sno
FROM tbl_student_score tss1
WHERE subject IN ('数学', '语文')
AND NOT EXISTS
(
    SELECT *FROM tbl_student_score tss2
    WHERE tss2.sno = tss1.sno
    AND 1 = CASE WHEN subject = '数学' AND score < 3000 THEN 1
                        WHEN subject = '语文' AND score < 3000 THEN 1
                        ELSE 0 
                    END
);

-- 4、201906300011 如此语文成绩,剔除掉
SELECT sno
FROM tbl_student_score tss1
WHERE subject IN ('数学', '语文')
AND NOT EXISTS
(
    SELECT * FROM tbl_student_score tss2
    WHERE tss2.sno = tss1.sno
    AND 1 = CASE WHEN subject = '数学' AND score < 3000 THEN 1
                        WHEN subject = '语文' AND score < 3000 THEN 1
                        ELSE 0 
                        END
)
GROUP BY sno
HAVING COUNT(*) = 2; -- 需要两门科目都有

分数

    关于 EXISTS 的案例有太满,这里就不再举例了,有兴趣的小伙伴都不能看看:SQL 中的 EXISTS 到底做了那先 ?

    不可能 亲戚亲戚大家儿想掌握 EXISTS,希望亲戚亲戚大家儿多看看 EXISTS 的案例,看过了你就会发现其中的通性:那先 场景适合用 EXISTS。

总结

  1、SQL 中的谓词分有两种:一阶谓词和二阶谓词(EXISTS),区别主要在于接收的参数不同,一阶谓词接收的是 行,而二阶谓词接收的是 行的集合;

  2、SQL 中如此与全称量词相当的谓词,都不能使用 NOT EXISTS 代替;

  3、EXISTS 随便说说难用(都有 不好用,就是不必用),主就是全称量词的命题转换(肯定 ⇔ 双重否定)比较难(楼主也懵!)。实际工作中往往会舍弃 EXISTS,寻找它的替代土依据 ,不可能 是 SQL 的替代,就是可能 是业务方面的转换,太满说,EXISTS 掌握不了没关系,当然,能掌握那是最好了;

参考

  《SQL基础教程》

  《SQL进阶教程》