• 第12章 汇总数据
    • 一、聚集函数
      • 1、AVG()函数
      • 2、COUNT()函数
      • 3、MAX()函数
      • 4、MIN()函数
      • 5、SUM()函数
    • 二、聚集不同值
    • 三、组合聚集函数

    第12章 汇总数据

    1. 聚集函数
    2. AVG()函数
    3. COUNT()函数
    4. MAX()函数
    5. MIN()函数
    6. SUM()函数
    7. 聚集不同值
    8. 组合聚集函数

      

    一、聚集函数

      我们经常需要汇总数据而不用把它们实际检索出来,为此MySQL提供了专门的函数。使用这些函数,MySQL查询可用于检索数据,以便分析和报表生成。这种类型的检索例子有以下几种。

      ※ 确定表中行数(或者满足某个条件或包含某个特定值的行数)。  ※ 获得表中行组的和。  ※ 找出表列(或所有行或某些特定的行)的最大值、最小值和平均值。

      上述例子都需要对表中数据(而不是实际数据本身)汇总。因此,返回实际表数据是对时间和处理资源的一种浪费(更不用说带宽了)。重复一遍,实际想要的是汇总信息。

    聚集函数:运行在行组上,计算和返回单个值的函数。
    函数说明
    AVG()返回某列的平均值
    COUNT()返回某列的行数
    MAX()返回某列的最大值
    MIN()返回某列的最小值
    SUM()返回某列值之和

    1、AVG()函数

      AVG()通过对表中行数计数并计算特定列值之和,求得该列的平均值。  AVG()可用来返回所有列的平均值,也可以用来返回特定列或行的平均值。

      下面的例子使用AVG()返回products表中所有产品的平均价格:

    1. select AVG(prod_price) as avg_price
    2. from products;

      此select语句返回值avg_price,它包含products表中所有产品的平均价格。

      AVG()也可以用来确定特定列或行的平均值。下面的例子返回特定供应商所提供产品的平均价格:

    1. select avg(prod_price) as avg_price
    2. from products
    3. where vend_id = 1003;
    只用于单个列AVG()只能用来确定特定数值列的平均值,而且列名必须作为函数参数给出。为了获得多个列的平均值,必须使用多个AVG()函数。

      

    NULL值AVG()函数忽略列值为NULL的行。

    2、COUNT()函数

      COUNT()函数进行计数。可利用COUNT()确定表中行的数目或符合特定条件的行的数目。

      COUNT()函数有两种使用方式。

      使用COUNT(*)对表中行的数目进行计数,不管表列中包含是空值还是非空值。  使用COUNT(column)对特定列中具有值的行进行计数,忽略NULL值。

      例如,返回customers表中客户的总数:

    1. select count(*) as num_cust
    2. from customers;

      下面的例子只对具有电子邮件地址的客户计数:

    1. select count(cust_email) as num_cust
    2. from customers;

    3、MAX()函数

      MAX()返回指定列中的最大值。MAX()要求指定列名。

    1. select max(prod_price) as max_price
    2. from products;
    对非数值数据使用MAX()虽然MAX()一般用来找出最大的数值或日期值,但MySQL允许将它用来返回任意列中的最大值,包括返回文本列中的最大值。在用于文本数据时,如果数据按相应的列排序,则MAX()返回最后一行。

      

    NULL值MAX()函数忽略列值为NULL的行。

    4、MIN()函数

      MIN()的功能正好与MAX()功能相反,它返回指定列的最小值。与MAX()一样,MIN()要求指定列名。

    1. select min(prod_price) as min_price
    2. from products;
    对非数值数据使用MIN()MIN()函数与MAX()函数类似,MySQL允许将它用来返回任意列中的最小值,包括返回文本列中的最小值。在用于文本数据时,如果数据按相应的列排序,则MIN()返回最前面的行。

      

    NULL值MIN()函数忽略列值为NULL的行。

    5、SUM()函数

      SUM()用来返回指定列值的和(总计)。

      下面举一个例子,orderitems表包含订单中实际的物品,每个物品有相应的数量(quantity)。可如下检索所订购物品的总数(所有quantity值之和):

    1. select sum(quantity) as items_ordered
    2. from orderitems
    3. where order_num = 20005;

      SUM()也可以用来合计计算值。在下面的例子中,合计每项物品的item_price*quantity,得出总的订单金额:

    1. select sum(item_price*quantity) as total_price
    2. from orderitems
    3. where order_num = 20005;
    在多个列上进行计算如本例所示,利用标准的算术操作符,所有聚集函数都可用来执行多个列上的计算。

      

    NULL值SUM()函数忽略列值为NULL的行。

      

    二、聚集不同值

      以上5个聚集函数都可以如下使用:

      对所有的行执行计算,指定ALL参数或不给参数(因为ALL是默认行为);  只包含不同的值,指定DISTINCT参数。

      下面的例子使用AVG()函数返回特定供应商提供的产品的平均价格。它与上面的select语句相同,但使用了distinct参数,因此平均值只考虑各个不同的价格:

    1. select avg(distinct prod_price) as avg_price
    2. from products
    3. where vend_id = 1003;
    注意:如果指定列名,则distinct只能用于count()distinct不能用于count(*),因此不允许使用count(distinct),否则会产生错误。类似地,distinct必须使用列名,不能用于计算或表达式。

      

    distinct用于min()max()虽然distinct从技术上可用于min()max(),但这样做实际上没有价值。一个列中的最小值和最大值不管是否包含不同值都是相同的。

      

    三、组合聚集函数

      目前为止的所有聚集函数例子都只涉及单个函数。但实际上select语句可根据需要包含多个聚集函数。

    1. select count(*) as num_items,
    2. min(prod_price) as price_min,
    3. max(prod_price) as price_max,
    4. avg(prod_price) as price_avg
    5. from products;

      这里用单条select语句执行了4个聚集计算,返回4个值(products表中物品的数目,产品价格的最高、最低以及平均值)。

    取别名在指定别名以包含聚集函数的结果时,不应该使用表中实际的列名。虽然这样做并不合法,但使用唯一的名字会使你的SQL更易于理解和使用(以及将来容易排除故障)。

      

    ?