index.html

<!DOCTYPE html>
<html>
<head>
  <meta charset="utf-8">
  
  
  <title>Mw&#39;s Hexo</title>
  <meta name="viewport" content="width=device-width, initial-scale=1, shrink-to-fit=no">
  <meta name="description" content="静静的来，静静的去，静静的前行，静静的收获。">
<meta property="og:type" content="website">
<meta property="og:title" content="Mw&#39;s Hexo">
<meta property="og:url" content="http://example/index.html">
<meta property="og:site_name" content="Mw&#39;s Hexo">
<meta property="og:description" content="静静的来，静静的去，静静的前行，静静的收获。">
<meta property="og:locale" content="en_US">
<meta property="article:author" content="mawan">
<meta name="twitter:card" content="summary">
  
    <link rel="alternate" href="/atom.xml" title="Mw's Hexo" type="application/atom+xml">
  
  
    <link rel="shortcut icon" href="/favicon.png">
  
  
<link rel="stylesheet" href="https://cdn.jsdelivr.net/npm/typeface-source-code-pro@0.0.71/index.min.css">

  
<link rel="stylesheet" href="/css/style.css">

  
<link rel="stylesheet" href="/fancybox/jquery.fancybox.min.css">

  
<meta name="generator" content="Hexo 5.3.0"></head>

<body>
  <div id="container">
    <div id="wrap">
      <header id="header">
  <div id="banner"></div>
  <div id="header-outer" class="outer">
    <div id="header-title" class="inner">
      <h1 id="logo-wrap">
        <a href="/" id="logo">Mw&#39;s Hexo</a>
      </h1>
      
    </div>
    <div id="header-inner" class="inner">
      <nav id="main-nav">
        <a id="main-nav-toggle" class="nav-icon"></a>
        
          <a class="main-nav-link" href="/">Home</a>
        
          <a class="main-nav-link" href="/archives">Archives</a>
        
      </nav>
      <nav id="sub-nav">
        
          <a id="nav-rss-link" class="nav-icon" href="/atom.xml" title="RSS Feed"></a>
        
        <a id="nav-search-btn" class="nav-icon" title="Search"></a>
      </nav>
      <div id="search-form-wrap">
        <form action="//google.com/search" method="get" accept-charset="UTF-8" class="search-form"><input type="search" name="q" class="search-form-input" placeholder="Search"><button type="submit" class="search-form-submit">&#xF002;</button><input type="hidden" name="sitesearch" value="http://example"></form>
      </div>
    </div>
  </div>
</header>

      <div class="outer">
        <section id="main">
  
    <article id="post-MyBatis从入门到精通第1章" class="h-entry article article-type-post" itemprop="blogPost" itemscope itemtype="https://schema.org/BlogPosting">
  <div class="article-meta">
    <a href="/2023/02/06/MyBatis%E4%BB%8E%E5%85%A5%E9%97%A8%E5%88%B0%E7%B2%BE%E9%80%9A%E7%AC%AC1%E7%AB%A0/" class="article-date">
  <time class="dt-published" datetime="2023-02-05T16:00:00.000Z" itemprop="datePublished">2023-02-06</time>
</a>
    
  </div>
  <div class="article-inner">
    
    
      <header class="article-header">
        
  
    <h1 itemprop="name">
      <a class="p-name article-title" href="/2023/02/06/MyBatis%E4%BB%8E%E5%85%A5%E9%97%A8%E5%88%B0%E7%B2%BE%E9%80%9A%E7%AC%AC1%E7%AB%A0/">第1章：MyBatis入门</a>
    </h1>
  

      </header>
    
    <div class="e-content article-entry" itemprop="articleBody">
      
        <h1 id="第1章：MyBatis入门"><a href="#第1章：MyBatis入门" class="headerlink" title="第1章：MyBatis入门"></a>第1章：MyBatis入门</h1><h2 id="随记："><a href="#随记：" class="headerlink" title="随记："></a>随记：</h2><p>MyBatis的<br> 配置项的顺序不能颠倒。如果颠倒了它们的顺序，那么在MyBatis去启动阶段就会发生异常，导致程序无法正常运行。  </p>
<h2 id="MyBtis简介"><a href="#MyBtis简介" class="headerlink" title="MyBtis简介"></a>MyBtis简介</h2><p>&emsp;&emsp;MyBatis是一款优秀的支持自定以SQL查询、存储过程和高级映射的持久层框架，消除了几乎所有的JDBC代码和参数的手动设置以及结果集的检索。&nbsp;&nbsp;MyBatis可以使用XML或注解进行配置和映射，MyBatis通过将参数映射到配置的SQL形成最终执行的SQL语句，最后将执行SQL的结果映射成JAVA对象返回。<br>&emsp;&emsp;与其他的ORM（对象关系映射）框架不同，MyBatis并没有将Java对象与数据库表关联起来，而是将Java方法与SQL语句关联。MyBatis允许用户充分利用数据库的各种功能，例如存储过程、视图、各种复杂的查询以及某数据库的专有特性。如果要对遗留数据库、不规范的数据库进行操作，或者要完全控制SQL的执行，MyBatis将会是一个不错的选择。<br>&emsp;&emsp;与JDBC相比，MyBatis简化了相关代码，SQL语句在一行代码中就能执行。MyBatis提供了一个映射引擎，声明式地将SQL语句地执行结果与对象树映射起来。通过使用一种内嵌地XMl表达式语言，SQL语句可以被动态生成。<br>&emsp;&emsp;MyBatis支持生命是数据缓存（declarative data caching）.当一条SQL语句被标记为”可缓存”后，首次执行它时从数据库获取地所有数据会被存储在高速缓存中，后面在执行这条语句时会从高速缓存中读取结果，而不是再次命中数据库。MyBatis提供了默认情况下基于Java HashMap地缓存实现，以及用于OSCache、Encache、Hazelcast和Memcached连接地默认连接器，同时还提供了API供其他缓存实现使用。  </p>
<h2 id="创建项目后地相关依赖"><a href="#创建项目后地相关依赖" class="headerlink" title="创建项目后地相关依赖"></a>创建项目后地相关依赖</h2><pre><code class="java">&lt;dependencies&gt;

        &lt;!-- Junit依赖--&gt;
        &lt;dependency&gt;
            &lt;groupId&gt;junit&lt;/groupId&gt;
            &lt;artifactId&gt;junit&lt;/artifactId&gt;
            &lt;version&gt;4.12&lt;/version&gt;
            &lt;scope&gt;test&lt;/scope&gt;
        &lt;/dependency&gt;

        &lt;!-- MyBatis依赖--&gt;
        &lt;dependency&gt;
            &lt;groupId&gt;org.mybatis&lt;/groupId&gt;
            &lt;artifactId&gt;mybatis&lt;/artifactId&gt;
            &lt;version&gt;3.4.2&lt;/version&gt;
        &lt;/dependency&gt;
        &lt;dependency&gt;
            &lt;groupId&gt;mysql&lt;/groupId&gt;
            &lt;artifactId&gt;mysql-connector-java&lt;/artifactId&gt;
            &lt;version&gt;5.1.38&lt;/version&gt;
        &lt;/dependency&gt;

        &lt;!-- Log4j依赖--&gt;
        &lt;dependency&gt;
            &lt;groupId&gt;org.slf4j&lt;/groupId&gt;
            &lt;artifactId&gt;slf4j-api&lt;/artifactId&gt;
            &lt;version&gt;1.7.12&lt;/version&gt;
        &lt;/dependency&gt;
        &lt;dependency&gt;
            &lt;groupId&gt;org.slf4j&lt;/groupId&gt;
            &lt;artifactId&gt;slf4j-log4j12&lt;/artifactId&gt;
            &lt;version&gt;1.7.12&lt;/version&gt;
        &lt;/dependency&gt;
        &lt;dependency&gt;
            &lt;groupId&gt;log4j&lt;/groupId&gt;
            &lt;artifactId&gt;log4j&lt;/artifactId&gt;
            &lt;version&gt;1.2.17&lt;/version&gt;
        &lt;/dependency&gt;

&lt;/dependencies&gt;  </code></pre>
<h2 id="配置MyBtis"><a href="#配置MyBtis" class="headerlink" title="配置MyBtis"></a>配置MyBtis</h2><p>&emsp;&emsp;配置MyBatis有多种方式，本节使用最基础最常用地XMl形式进行配置。  </p>
<ul>
<li>注意：除XML方式外，在后面介绍和Spring集成地时候还会使用SpringBean方式进行配置。另外还可以通过Java编码方式进行配置。但Java编码配置方式不常用。  </li>
</ul>
<p>&emsp;&emsp;使用XML形式进行配置，首先在src/main/resources下面创建mybatis-config.xml配置文件，具体内容如下：  </p>
<pre><code class="java">&lt;?xml version=&quot;1.0&quot; encoding=&quot;UTF-8&quot; ?&gt;
&lt;!DOCTYPE configuration
        PUBLIC &quot;-//mybatis.org//DTD Config 3.0//EN&quot;
        &quot;http://mybatis.org/dtd/mybatis-3-config.dtd&quot;&gt;
&lt;configuration&gt;
    &lt;!--  指定使用LOG4J输出日志--&gt;
    &lt;settings&gt;
        &lt;setting name=&quot;logImpl&quot; value=&quot;LOG4J&quot;/&gt;

        &lt;!--        此配置属性为true可以自动将以下划线命名的数据库列映射到Java对象的驼峰式命名属性中。--&gt;
        &lt;!--        &lt;setting name=&quot;mapUnderscoreToCamelCase&quot; value=&quot;true&quot;/&gt;--&gt;
    &lt;/settings&gt;

    &lt;!--  配置一个包名，以免MyBatis频繁使用全限定名称--&gt;
    &lt;typeAliases&gt;
        &lt;package name=&quot;tk.mybatis.simple.model&quot;&gt;&lt;/package&gt;
    &lt;/typeAliases&gt;

    &lt;!--    配置数据库连接--&gt;
    &lt;environments default=&quot;development&quot;&gt;
        &lt;environment id=&quot;development&quot;&gt;
            &lt;transactionManager type=&quot;JDBC&quot;&gt;
                &lt;property name=&quot;&quot; value=&quot;&quot;/&gt;
            &lt;/transactionManager&gt;
            &lt;dataSource type=&quot;UNPOOLED&quot;&gt;
                &lt;property name=&quot;driver&quot; value=&quot;com.mysql.jdbc.Driver&quot;&gt;&lt;/property&gt;
                &lt;property name=&quot;url&quot; value=&quot;jdbc:mysql://localhost:3306/mybatis&quot;/&gt;
                &lt;property name=&quot;username&quot; value=&quot;root&quot;/&gt;
                &lt;property name=&quot;password&quot; value=&quot;123456&quot;/&gt;
            &lt;/dataSource&gt;
        &lt;/environment&gt;
    &lt;/environments&gt;

    &lt;!-- 配置一个包含完整类路径的CountryMapper.xml,这是一个MyBatis的SQL语句与映射配置文件--&gt;
    &lt;mappers&gt;
        &lt;!--        这是单个配置--&gt;
        &lt;!--        &lt;mapper resource=&quot;tk/mybatis/simple/mapper/CountryMapper.xml&quot;&gt;&lt;/mapper&gt;--&gt;

        &lt;!--直接使用整个包配置--&gt;
        &lt;package name=&quot;tk.mybatis.simple.mapper&quot;/&gt;
    &lt;/mappers&gt;


&lt;/configuration&gt;</code></pre>
<p>&emsp;&emsp;相关配置的含义：  </p>
<ul>
<li>&lt;settings&gt;中的logImpl属性指定使用LOG4J输出日志。  </li>
<li>&lt;typeAliases&gt;元素下面配置了一个包的别名，通常确定一个类的时候需要使用类的全限定名称，例如：tk.mybatis.simple.model.Country。在MyBatis中需要频繁用到类的全限定名称，为了方便使用，我们配置了tk.mybatis.simple.model包，这样配置后，在使用类的时候不需要写包名的部分，只是用Country即可。  </li>
<li>&lt;enviroments&gt;环境配置中主要配置了数据库连接，数据库的url为jdbc:mysql//localhost:3306/mybatis,使用的是本机MySQL中的mybatis数据库，后面的username和password分别是数据库的用户名和密码。    </li>
<li>&lt;mapper&gt;中配置了一个包含完整类路的CountryMapper.xml,这是一个MyBatis的SQL语句和映射文件，这个XMl会在后面介绍。<br><font color="red">注意在原始代码中由于md语法需要，符号’&lt;’要写成’&lt;’</font> </li>
</ul>
<h2 id="创建实体类和Mapper-xml文件"><a href="#创建实体类和Mapper-xml文件" class="headerlink" title="创建实体类和Mapper.xml文件"></a>创建实体类和Mapper.xml文件</h2><p>&emsp;&emsp;MyBatis是一个姐u哦映射框架，这里创建的实体类实际上是一个数据值对象（Data Value Object），在实际应用中，一个表一般会对应一个实体，用于INSERT、UPDATE、DELETE和简单的SELECT操作，所以姑且称这个简单的对象为实体类。  </p>
<ul>
<li>提示！关于Mapper的明明方式：在MyBatis中，根据MyBayis官方的习惯，一般用Mapper作为XML和接口类名的后缀，这里的Mapper和我们常用DAO后缀类似，只是一种习惯而已，本书中全部使用Mapper后缀。通常称XMl为Mapper.xml文件，称接口为Mapper接口，在实际应用中可以根据自己的需要来定义命名方式。  </li>
</ul>
<p>&emsp;&emsp;下面我们先展示一下这个项目的目录结构：图片已上传到远端，在本地加载不出来？<br><img src="https://github.com/seasky-wjl/MyBatisIndoor/blob/main/note/Mybatis%E5%85%A5%E9%97%A8/imgs/projectStructure.PNG" alt="该项目的目录结构" title="该项目的目录结构"></p>
<p>&emsp;&emsp;在src/main/java下创建一个基础的包tk.mybatis.simple,在这个包下面再创建model包。根据数据库表名country，再model包下创建实体类Country。属性与数据库中的一一对应。  </p>
<p>&emsp;&emsp;在src/main/resoures下面创建tk/mybatus/simple/mapper目录，再在该目录下面创建CountryMapper.xml文件，内容如下：  </p>
<pre><code class="java"> &lt;?xml version=&quot;1.0&quot; encoding=&quot;UTF-8&quot; ?&gt;
 &lt;!DOCTYPE mapper PUBLIC &quot;-//mybatis.org//DTD Mapper 3.0//EN&quot; &quot;http://mybatis.org/dtd/mybatis-3-mapper.dtd&quot; &gt;
 &lt;mapper namespace=&quot;tk.mybatis.simple.mapper.CountryMapper&quot;&gt;
     &lt;select id=&quot;selectAll&quot; resultType=&quot;Country&quot;&gt;
         select id,countryname,countrycode from country
     &lt;/select&gt;
 &lt;/mapper&gt;  </code></pre>
<p>SQL定义在CounryMapper.xml文件中，里面的配置作用如下。  </p>
<ul>
<li>&lt;mapper&gt;元素:XML的根元素，属性namespace定义了当前XMl的命名空间。  </li>
<li>&lt;select&gt;元素：我们所定义的一个SELECT查询。  </li>
<li>id属性：定义了当前查询的返回值类型，此处就是指十日类COuntry，前面配置中提到的别名主要用于这里，如果没有设置别名，此处就需要写成resultType=”tk.mybatis.simple.model.Country”。</li>
<li>select id,…:查询SQL语句。  </li>
</ul>
<p>&emsp;&emsp; 创建好实体和Mapper.xml后，接下来要有针对性地配置Log4j,让MyBatis在执行数据库操作地时候可以将执行的SQL和其他信息输出到控制台。  </p>
<h2 id="配置Log4j"><a href="#配置Log4j" class="headerlink" title="配置Log4j"></a>配置Log4j</h2><p>&emsp;&emsp;在src/main/resources中添加log4j.properties配置文件，输入如下内容。      </p>
<pre><code class="java">  # 全局配置
  log4j.rootLogger=ERROR, stdout
  # MyBatis日志配置
  log4j.logger.tk.mybatis.simple.mapper=TRACE
  # 控制台输出配置
  log4j.appender.stdout=org.apache.log4j.ConsoleAppender
  log4j.appender.stdout.layout=org.apache.log4j.PatternLayout
  log4j.appender.stdout.layout.ConversionPattern=%5p [%t] - %m%n</code></pre>
<blockquote>
<p>日志注意事项！<br>&emsp;&emsp;用过Log4j日志组件的人可能都会知道，配置中的log4j.logger.tk.mybatis.simple.mapper对应的是tk.mybatis.simple.mapper包，但是目前为止，该例子中Java目录下并没有这个报名，只有在资源目录下有mapper目录。<br>&emsp;&emsp;在MyBatis的日志实现中，所谓包名实际上是XML配置中的namespace属性值的一部分。后面章节中介绍结合接口使用的相关内容时，由于namespace属性值必须和接口全限定类名相同，因此才会真正对应到Java中的包。当使用纯注解方式时，使用就是纯粹的包名。<br>&emsp;&emsp;MyBatis日志的最低级别是TRACE,在这个日志级别下，M有B按提示、会输出执行SQL过程的详细信息，这个级别特别适合在开发时使用。</p>
</blockquote>

      
    </div>
    <footer class="article-footer">
      <a data-url="http://example/2023/02/06/MyBatis%E4%BB%8E%E5%85%A5%E9%97%A8%E5%88%B0%E7%B2%BE%E9%80%9A%E7%AC%AC1%E7%AB%A0/" data-id="clemvoh6u00007s7ef6v28r7v" data-title="第1章：MyBatis入门" class="article-share-link">Share</a>
      
      
  <ul class="article-tag-list" itemprop="keywords"><li class="article-tag-list-item"><a class="article-tag-list-link" href="/tags/MyBatis%E4%BB%8E%E5%85%A5%E9%97%A8%E5%88%B0%E7%B2%BE%E9%80%9A/" rel="tag">MyBatis从入门到精通</a></li></ul>

    </footer>
  </div>
  
</article>


    <article id="post-基于笔画识别的手写汉字美化方法研究华科2020" class="h-entry article article-type-post" itemprop="blogPost" itemscope itemtype="https://schema.org/BlogPosting">
  <div class="article-meta">
    <a href="/2022/10/03/%E5%9F%BA%E4%BA%8E%E7%AC%94%E7%94%BB%E8%AF%86%E5%88%AB%E7%9A%84%E6%89%8B%E5%86%99%E6%B1%89%E5%AD%97%E7%BE%8E%E5%8C%96%E6%96%B9%E6%B3%95%E7%A0%94%E7%A9%B6%E5%8D%8E%E7%A7%912020/" class="article-date">
  <time class="dt-published" datetime="2022-10-03T11:01:16.000Z" itemprop="datePublished">2022-10-03</time>
</a>
    
  </div>
  <div class="article-inner">
    
    
      <header class="article-header">
        
  
    <h1 itemprop="name">
      <a class="p-name article-title" href="/2022/10/03/%E5%9F%BA%E4%BA%8E%E7%AC%94%E7%94%BB%E8%AF%86%E5%88%AB%E7%9A%84%E6%89%8B%E5%86%99%E6%B1%89%E5%AD%97%E7%BE%8E%E5%8C%96%E6%96%B9%E6%B3%95%E7%A0%94%E7%A9%B6%E5%8D%8E%E7%A7%912020/">基于笔画识别的手写汉字美化方法研究华科2020</a>
    </h1>
  

      </header>
    
    <div class="e-content article-entry" itemprop="articleBody">
      
        <h2 id="Article"><a href="#Article" class="headerlink" title="Article:"></a>Article:</h2><p>潘冬冬. 基于笔画识别的手写汉字美化方法研究[D].华中科技大学,2020.DOI:10.27157/d.cnki.ghzku.2020.002244.</p>
<hr>
<h2 id="Data"><a href="#Data" class="headerlink" title="Data:"></a>Data:</h2><p>题目：<br>&nbsp; &nbsp;&nbsp; &nbsp;基于笔画识别的手写汉字美化方法研究    </p>
<p>&nbsp; &nbsp;&nbsp; &nbsp;提出了一种基于笔画识别的手写汉字美化方法，它融合了笔画识别与拐点检测、笔画结构以及笔画轮廓美化等方法。虽然作者是采用联机的方式来进行这一研究。  </p>
<p>背景：<br>&nbsp; &nbsp;&nbsp; &nbsp;美化汉字的主流研究方向有3种：</p>
<ol>
<li>以整字为基本单位，对用户手写汉字识别后将其替换为标准字体；  </li>
<li>以笔画为基本单位，直接对笔画进行美化，对用户手写汉字的所有壁画进行美化即完成了汉字的美化；  </li>
<li>首先对笔画进行笔画识别和笔画拐点检测，利用笔画拐点检测的结果将笔画分解为多个笔段，然后根据笔画识别的结果利用自己的美化算法针对性的对每个笔段进行美化，最后美化后的笔段拼接起来即完成了笔画的美化。  </li>
</ol>
<p>研究现状：  </p>
<pre><code>汉字美化：</code></pre>
<p>&nbsp; &nbsp;&nbsp; &nbsp;Elena J. Jakubia提出一种 SSF(Stylized Stroke Fonts)的方法，该方法提出每一个字形由三部分构成：一条由线段和贝塞尔曲线构成的笔画路径、一系列描述笔画宽度的参数、以及一系列的端点。这和夏伟平提出的将每一个笔画分解为笔段和连接点，然后分别对笔段和连接点进 行建模，最后将笔段和连接点按照每个笔画的规则连接起来的思想非常相似。<br>刘丽娟在夏伟平的方法的基础上进行了进一步的丰富和完善，其对笔段和拐点的分类更加完善，对笔段和连接点的拼接规则考虑到汉字的整体结构，更加科学严谨。<br>本文的手写汉字美化算法将在刘丽娟提出的算法基础上对笔画识别和笔画拐点检测算法进行优化，并进行 笔画结构调整。  </p>
<pre><code>笔画识别：</code></pre>
<p>&nbsp; &nbsp;&nbsp; &nbsp;Xinyue Zhang提出使用卷积神经网络来进行笔画识别，其具体做法是将汉字笔画划分为20种，自建数据集，请20个志愿者为每一种笔画写200次，之后利用自建数据集和卷积神经网络训练出笔画识别的模型，并使用该模型进行笔画分类，对笔画分类为20类，而本文将笔画分类为32类。</p>
<pre><code>笔画拐点检测：</code></pre>
<p>&nbsp; &nbsp;&nbsp; &nbsp;拐点检测是汉字美化的步骤之一，通过拐点检测之后将笔画分解为笔段和连接点，然后分别对笔段和连接点建模，最后将笔段和连接点连接起来，完成美化。<br>目前较为常见的进行拐点(数学上是二阶导数变号的点，或者是原图像凹凸变换的那个点)检测的算法为利用弯曲值检测拐点。<br>本文中采用卷积神经网络进行笔画拐点检测。</p>
<pre><code>笔画结构调整：</code></pre>
<p>&nbsp; &nbsp;&nbsp; &nbsp;笔画结构调整是对用户输入的轨迹进行整体结构的调整和笔画层面的调整，以 使得其满足特定书法的特征。<br>但刘丽娟在其论文中对结构调整非常有限。</p>
<p>方法：<br>&nbsp; &nbsp;&nbsp; &nbsp;本文首先使用卷积神经网络进行笔画识别和拐点检测等问题；在一般手写汉字美化方案的笔画步骤前增加笔画结构调整，使用户手写汉字笔画结构更接近标准书法笔画结构；最后以问卷调查 的形式将本文美化效果与前任美化效果进行对比。<br>使用 ResNet18 训练笔画识别模型，使用 CPM（卷积姿态机）完成了笔画拐点检测模型的训练。<br>从五个方面进行结构调整：整体结构变换、拟合贝塞尔曲线、角度调整、对钩的处理、替换 “横撇弯钩”。</p>
<hr>
<h2 id="Comments："><a href="#Comments：" class="headerlink" title="Comments："></a>Comments：</h2><p>&nbsp; &nbsp;&nbsp; &nbsp;使用了目前比较热门的卷积神经网络来训练模型，让笔画识别和笔画拐点检测等问题的准确率都得到了一定提升。<br>我们的课题可以用到与作者类似的方法，笔画识别、拐点检测、再根据特定笔画结构的特点，对该笔画的书写进行评价并作修改意见。<br>因为本文的目的就是对用户在设备上手写的汉字进行美化，所以它没有对用户这个字写的好不好的量化标准，不管用户写的好不好，都会对其进行美化，但是可以从这个美化的标准中去寻找我们需要的量化标准，如果可以，可以直接将原来的字与美化后的字来进行一个对比，美化的地方即是用户可以提升的地方。</p>
<p>关于数据集：<br>&nbsp; &nbsp;&nbsp; &nbsp;目前关于手写汉字笔画没有公开的数据集。手写汉字有几个比较知名的公开数据集，哈大深采集的 HIT-OR3C、华南理工大学采集的SCUT-COUCH009、中科院采集的 CASIA-OLHWDB1.0 和 1.1 数据集。由于这些数据集在用户的手写汉字轨迹，存在大量连笔，本文作者自建了手写汉字笔画的数据集。</p>
<hr>
<h2 id="Why"><a href="#Why" class="headerlink" title="Why:"></a>Why:</h2><p>了解汉字识别的课题背景，学习前人的实验方法。</p>
<hr>
<h2 id="Summary"><a href="#Summary" class="headerlink" title="Summary:"></a>Summary:</h2><p>对于用户在设备上手写的汉字，识别笔画、笔画拐点，将笔画分解为笔段和连接点，对其分别建模，再连接起来形成笔画。最后进行笔画的结构调整以达到整个汉字美化的目的。</p>

      
    </div>
    <footer class="article-footer">
      <a data-url="http://example/2022/10/03/%E5%9F%BA%E4%BA%8E%E7%AC%94%E7%94%BB%E8%AF%86%E5%88%AB%E7%9A%84%E6%89%8B%E5%86%99%E6%B1%89%E5%AD%97%E7%BE%8E%E5%8C%96%E6%96%B9%E6%B3%95%E7%A0%94%E7%A9%B6%E5%8D%8E%E7%A7%912020/" data-id="clemvoh7j00097s7e6yf27gtk" data-title="基于笔画识别的手写汉字美化方法研究华科2020" class="article-share-link">Share</a>
      
      
  <ul class="article-tag-list" itemprop="keywords"><li class="article-tag-list-item"><a class="article-tag-list-link" href="/tags/%E7%9C%8B%E6%96%87%E7%8C%AE/" rel="tag">看文献</a></li></ul>

    </footer>
  </div>
  
</article>


    <article id="post-基于-相似度-的手写汉字识别与美感评分北邮2019" class="h-entry article article-type-post" itemprop="blogPost" itemscope itemtype="https://schema.org/BlogPosting">
  <div class="article-meta">
    <a href="/2022/09/29/%E5%9F%BA%E4%BA%8E-%E7%9B%B8%E4%BC%BC%E5%BA%A6-%E7%9A%84%E6%89%8B%E5%86%99%E6%B1%89%E5%AD%97%E8%AF%86%E5%88%AB%E4%B8%8E%E7%BE%8E%E6%84%9F%E8%AF%84%E5%88%86%E5%8C%97%E9%82%AE2019/" class="article-date">
  <time class="dt-published" datetime="2022-09-29T12:54:17.000Z" itemprop="datePublished">2022-09-29</time>
</a>
    
  </div>
  <div class="article-inner">
    
    
      <header class="article-header">
        
  
    <h1 itemprop="name">
      <a class="p-name article-title" href="/2022/09/29/%E5%9F%BA%E4%BA%8E-%E7%9B%B8%E4%BC%BC%E5%BA%A6-%E7%9A%84%E6%89%8B%E5%86%99%E6%B1%89%E5%AD%97%E8%AF%86%E5%88%AB%E4%B8%8E%E7%BE%8E%E6%84%9F%E8%AF%84%E5%88%86%E5%8C%97%E9%82%AE2019/">基于_相似度_的手写汉字识别与美感评分北邮2019</a>
    </h1>
  

      </header>
    
    <div class="e-content article-entry" itemprop="articleBody">
      
        <h1 id="基于-相似度-的手写汉字识别与美感评分北邮2019"><a href="#基于-相似度-的手写汉字识别与美感评分北邮2019" class="headerlink" title="基于_相似度_的手写汉字识别与美感评分北邮2019"></a><center>基于_相似度_的手写汉字识别与美感评分北邮2019</center></h1><h2 id="Article"><a href="#Article" class="headerlink" title="Article:"></a>Article:</h2><p>[1]庄子明. 基于深度学习的手写汉字识别与美感评分[D].北京邮电大学,2019.<br>==<em>基于相似度的手写汉字美感评分</em>  </p>
<hr>
<h2 id="Data："><a href="#Data：" class="headerlink" title="Data："></a>Data：</h2><p>题目：<br>基于深度学习的手写汉字识别与美感评分</p>
<p>背景：<br>数据采集方式有两种：联机和脱机。前者可以记录笔者笔顺轨迹、笔画数量等信息、识别对象具有时间顺序的采样点信息，需要有特定输入设备，实际场景比较少。脱机的使用场景更多，但会缺少笔顺信息，有光照、分辨率、书写背景等不同条件的干扰。</p>
<p>汉字识别研究背景：<br>基于传统的“预处理+特征提取+分类器”的HCCR框架在识别性能上突破不够。随着研究者们将许多深度学习模型，如深度卷积神经网络（CNN）、深度置信网络（DBN）、深度递归神经网络（DRNN）应用到手写文字识别，取得了大量突破。</p>
<p>美感分析的现状：<br>传统的方法基本都专注于探索文字的特征构建和优化特征提取方法，如陈惠敏等人按照书写特征，将汉字的笔画简单地分为直线笔画和弧线笔画，分别给出了识别模型和评估算法，评价结果波动较大；李玉峰等人在工程制图字体场景下通过抓取手写字体的点阵特征根据汉字在结构方面特征相似度来评价书写质量，但这仅限于规定格式的标准书写字体；李艺等人提出了从笔画。部件、整字等三个层次建立汉字书写特征集，并以此为依据对书写者硬币汉字书写的工整性进行评价；王耀等人针对四线格英文字母书写练习场景，提出了规定格式书写质量评价方法，分别从比例、位置、大小、畸变四个方面分析参照字符与被分析字符的参数距离，给出书写的质量评价，这一方法直接应用于手写汉字效果并不很理想。</p>
<p>方法：<br>手写汉字没敢评价方法非常依赖对汉字的特征提取和分析。深度学习的一大优势是消除了复杂的特征工程的困难挑战，只需要将数据直接传递到网络，通过可以让计算机自动学习出模型特征，让特征学习融入到建立模型的过程中。</p>
<p>深度学习的根本原理是利用海量的数据在多隐层网络中训练模型，学习数据中有价值的信息——特征。深度学习的本质是特征学习。</p>
<p>对于手写汉字的识别和美感评分，最难也是最关键的核心就是特征提取。而无监督是深度学习学习最大的特点，在训练时无需人工进行特征提取，全过程自主取样自主学习。</p>
<p>模型分为三大部分：汉字检测、识别、美感评分。</p>
<p>作者使用自然场景下手写汉字检测模型–连接文本区域候选网络（CTPN）的相关原理和细节，将RNN的网络结构与Faster-RCNN网络相结合，既可以提取到深度特征，也能够进行序列的特征识别。<br>手写汉字识别模型——HCCR-GoogleLeNet网络，将手动提取的汉字特征作为先验知识嵌入到深度卷积神经网络中，有助于网络更好地学习到汉字辅助特征。</p>
<p>作者将传统的评价手写汉字美感的两类结构特征——重心特征和网格特征与CNN特征结合来优化手写汉字美感评分效果。</p>
<p> <font color="yellow">作者的相似度检索策略的思路为：将待测汉字与已含有美感类别标签的手写汉字数据库进行相似度检索，根据检索出来的手写美感类别标签确定待测的手写汉字的美感分数。手写汉字相似度检索分成两部分：手写汉字特征的提取与手写汉字特征的距离度量。</font></p>
<p>形近字难以区分，可以用什么方法来根据语境推测这到底是什么字。</p>
<hr>
<h2 id="Comments："><a href="#Comments：" class="headerlink" title="Comments："></a>Comments：</h2><p>先选一部分字让们打分，算出每个字的平均分，再让模型学习，学习完了之后，就可以直接用这个模型根据库中已有文字及其分数来对新的手写汉字进行打分，而且结果是写得越好的字，它的得分的准确率就会越高，因为好的标准已经确定，且笔画的结构相似度越高；而写得越不好的字，它的得分的准确率就会相对较低。</p>
<p>这篇文章就是老师说的情况，只是通过它的相似度去给出一个评价，而没有去给这个字怎样写得更好去提出建议和指导。</p>
<p>作者认识到，这个系统将检测、识别、美感评分散步分别构建了三个深度学习的网络模型，而且在实验过程中，基于相似度检索的手写汉字没敢评分CNN网络实际上具有一定成都的手写汉字识别功能，既可以通过待评分汉字与数据库中已有汉字的特征相似度的距离排序来确定汉字的识别结果，但目前准确度还不高。</p>
<hr>
<h2 id="Why："><a href="#Why：" class="headerlink" title="Why："></a>Why：</h2><p>了解汉字识别的课题背景，学习前人的实验方法。</p>
<hr>
<h2 id="Summary："><a href="#Summary：" class="headerlink" title="Summary："></a>Summary：</h2><p>基于相似度的手写汉字美感评分。</p>

      
    </div>
    <footer class="article-footer">
      <a data-url="http://example/2022/09/29/%E5%9F%BA%E4%BA%8E-%E7%9B%B8%E4%BC%BC%E5%BA%A6-%E7%9A%84%E6%89%8B%E5%86%99%E6%B1%89%E5%AD%97%E8%AF%86%E5%88%AB%E4%B8%8E%E7%BE%8E%E6%84%9F%E8%AF%84%E5%88%86%E5%8C%97%E9%82%AE2019/" data-id="clemvoh7i00087s7e6p8571f3" data-title="基于_相似度_的手写汉字识别与美感评分北邮2019" class="article-share-link">Share</a>
      
      
  <ul class="article-tag-list" itemprop="keywords"><li class="article-tag-list-item"><a class="article-tag-list-link" href="/tags/%E7%9C%8B%E6%96%87%E7%8C%AE/" rel="tag">看文献</a></li></ul>

    </footer>
  </div>
  
</article>


    <article id="post-看文献应该做什么" class="h-entry article article-type-post" itemprop="blogPost" itemscope itemtype="https://schema.org/BlogPosting">
  <div class="article-meta">
    <a href="/2022/09/29/%E7%9C%8B%E6%96%87%E7%8C%AE%E5%BA%94%E8%AF%A5%E5%81%9A%E4%BB%80%E4%B9%88/" class="article-date">
  <time class="dt-published" datetime="2022-09-29T12:49:33.000Z" itemprop="datePublished">2022-09-29</time>
</a>
    
  </div>
  <div class="article-inner">
    
    
      <header class="article-header">
        
  
    <h1 itemprop="name">
      <a class="p-name article-title" href="/2022/09/29/%E7%9C%8B%E6%96%87%E7%8C%AE%E5%BA%94%E8%AF%A5%E5%81%9A%E4%BB%80%E4%B9%88/">看文献应该做什么</a>
    </h1>
  

      </header>
    
    <div class="e-content article-entry" itemprop="articleBody">
      
        <h1 id="看一篇文献后需要干什么"><a href="#看一篇文献后需要干什么" class="headerlink" title="看一篇文献后需要干什么"></a><center>看一篇文献后需要干什么</center></h1><p>看一篇文献需要做以下工作：<br>Article: 文献出处（方便再次搜索）<br>Data: 文献数据（总结归纳，方便理解）<br>Comments: 对文献的想法 （强迫自己思考，结合自己的学科）<br>Why: 为什么看这篇文献 （方便再次搜索）<br>Summary: 文献方向归纳 （方便分类管理）  </p>
<ol>
<li><p>Article：记录文献出处，包括作者、文献题目、文献时间。</p>
</li>
<li><p>Data：文献数据，包括这篇文章的题目、背景介绍、方法、结果、结论。</p>
</li>
<li><p>Comments：自己的想法，记录自己看了文章之后有什么想法，创新点，不足之处，经验教训等等等。</p>
</li>
<li><p>Why：为什么？即为什么要精读这篇文献，为什么做文献笔记？原因可以是：了解课题背景，用于实验设计，用于写作仿真等。</p>
</li>
<li><p>Summary：文献总结。用尽量少的话来概括此文。可以是文献关键词的组合，也可以是自己的总结。目的是为了让你以后对相关文献笔记进行分类，搜索的时候也更容易。</p>
</li>
</ol>

      
    </div>
    <footer class="article-footer">
      <a data-url="http://example/2022/09/29/%E7%9C%8B%E6%96%87%E7%8C%AE%E5%BA%94%E8%AF%A5%E5%81%9A%E4%BB%80%E4%B9%88/" data-id="clemvoh86001d7s7e7zgefpeo" data-title="看文献应该做什么" class="article-share-link">Share</a>
      
      
  <ul class="article-tag-list" itemprop="keywords"><li class="article-tag-list-item"><a class="article-tag-list-link" href="/tags/%E7%9C%8B%E6%96%87%E7%8C%AE/" rel="tag">看文献</a></li></ul>

    </footer>
  </div>
  
</article>


    <article id="post-morris遍历" class="h-entry article article-type-post" itemprop="blogPost" itemscope itemtype="https://schema.org/BlogPosting">
  <div class="article-meta">
    <a href="/2022/09/11/morris%E9%81%8D%E5%8E%86/" class="article-date">
  <time class="dt-published" datetime="2022-09-11T14:24:15.000Z" itemprop="datePublished">2022-09-11</time>
</a>
    
  </div>
  <div class="article-inner">
    
    
      <header class="article-header">
        
  
    <h1 itemprop="name">
      <a class="p-name article-title" href="/2022/09/11/morris%E9%81%8D%E5%8E%86/">morris遍历</a>
    </h1>
  

      </header>
    
    <div class="e-content article-entry" itemprop="articleBody">
      
        <h1 id="morris遍历"><a href="#morris遍历" class="headerlink" title="morris遍历"></a><center>morris遍历</center></h1><h2 id="前序遍历"><a href="#前序遍历" class="headerlink" title="前序遍历"></a>前序遍历</h2><p>核心思想是利用大量空闲指针，实现空间开销的极限缩减。其前序遍历规则总结如下：<br>1.新建临时节点，另该节点为root;<br>2.如果当前节点的左子节点为空，将当前节点加入答案，并遍历当前节点的右子节点。<br>3.如果当前节点的左子节点不为空，在当前节点的左子树中找到当前节点在中序遍历中的前驱节点：<br>&nbsp;&nbsp;&nbsp;&nbsp; 1）.如果前驱节点的右子节点为空，将前驱节点设置为当前节点。然后将当前节点加入答案，并将前驱节点的右子节点更新为当前节点。当前节点更新为当前节点的左子节点。<br>&nbsp;&nbsp;&nbsp;&nbsp; 2）.如果前驱节点的右子节点为当前节点，将他的右边子节点重新设为空。当前节点更新为当前节点的右子节点。<br>4.重复步骤2和3，直到遍历结束。<br>Java代码为：</p>
<pre><code>public List&lt;Integer&gt; preorderTraverse(TreeNode root)&#123;

    List&lt;Integer&gt; res=new ArrayList&lt;&gt;();
    TreeNode p1=root,p2=null;
    while(p1!=null)&#123;
        p2=p1.left;
        if(p2!=null)&#123;
            while(p2.right!=null &amp;&amp; p2.right!=p1)&#123;
                p2=p2.right;                        //去找p1的中序遍历前驱节点
            &#125;
            if(p2.right==null)&#123;                     //前驱找到且还没把p1链接到右孩子
                res.add(p1.val);
                p2.right=p1;
                p1=p1.left;                         //p1向左子树走
                continue;
            &#125;else&#123;
                p1=p2.right;
            &#125;
        &#125;else&#123;
            add(p1.val);
        &#125;
        p1=p1.right;
    &#125;

    return res;
&#125;</code></pre>
<p>复杂度分析：  </p>
<ul>
<li>时间：O(n),其中n是二叉树的节点数。没有左子树的节点制备访问一次，有左子树的节点被访问两次。  </li>
<li>空间：O(1),只需常数的额外空间。  </li>
</ul>
<h2 id="后序遍历"><a href="#后序遍历" class="headerlink" title="后序遍历"></a>后序遍历</h2><p>其后序遍历规则总结如下：<br>1.新建临时节点，令该节点为 root；<br>2.如果当前节点的左子节点为空，则遍历当前节点的右子节点；<br>3.如果当前节点的左子节点不为空，在当前节点的左子树中找到当前节点在中序遍历下的前驱节点；<br>&nbsp;&nbsp;&nbsp;&nbsp; 1）.如果前驱节点的右子节点为空，将前驱节点的右子节点设置为当前节点，当前节点更新为当前节点的左子节点。<br>&nbsp;&nbsp;&nbsp;&nbsp; 2).如果前驱节点的右子节点为当前节点，将它的右子节点重新设为空。倒序输出从当前节点的左子节点到该前驱节点这条路径上的所有节点。当前节点更新为当前节点的右子节点。<br>4.重复步骤 2 和步骤 3，直到遍历结束。 </p>
<p>Java代码为：</p>
<pre><code>public List&lt;Integer&gt; postorderTraversal(TreeNode root) &#123;
    List&lt;Integer&gt; res = new ArrayList&lt;Integer&gt;();
    if (root == null) &#123;
        return res;
    &#125;

    TreeNode p1 = root, p2 = null;

    while (p1 != null) &#123;
        p2 = p1.left;
        if (p2 != null) &#123;
            while (p2.right != null &amp;&amp; p2.right != p1) &#123;
                p2 = p2.right;
            &#125;
            if (p2.right == null) &#123;
                p2.right = p1;
                p1 = p1.left;
                continue;
            &#125; else &#123;
                p2.right = null;
                addPath(res, p1.left);
            &#125;
        &#125;
        p1 = p1.right;
    &#125;
    addPath(res, root);
    return res;
&#125;

public void addPath(List&lt;Integer&gt; res, TreeNode node) &#123;
    int count = 0;
    while (node != null) &#123;
        ++count;
        res.add(node.val);
        node = node.right;
    &#125;
    int left = res.size() - count, right = res.size() - 1;
    while (left &lt; right) &#123;
        int temp = res.get(left);
        res.set(left, res.get(right));
        res.set(right, temp);
        left++;
        right--;
    &#125;
&#125;</code></pre>
<p>复杂度分析：  </p>
<ul>
<li>时间复杂度：O(n)O(n)，其中 nn 是二叉树的节点数。没有左子树的节点只被访问一次，有左子树的节点被访*问两次。    </li>
<li>空间复杂度：O(1)O(1)。只操作已经存在的指针（树的空闲指针），因此只需要常数的额外空间。</li>
</ul>

      
    </div>
    <footer class="article-footer">
      <a data-url="http://example/2022/09/11/morris%E9%81%8D%E5%8E%86/" data-id="clemvoh7w000s7s7ee5846kfj" data-title="morris遍历" class="article-share-link">Share</a>
      
      
  <ul class="article-tag-list" itemprop="keywords"><li class="article-tag-list-item"><a class="article-tag-list-link" href="/tags/%E7%AE%97%E6%B3%95/" rel="tag">算法</a></li></ul>

    </footer>
  </div>
  
</article>


    <article id="post-第13章分组数据" class="h-entry article article-type-post" itemprop="blogPost" itemscope itemtype="https://schema.org/BlogPosting">
  <div class="article-meta">
    <a href="/2022/07/18/%E7%AC%AC13%E7%AB%A0%E5%88%86%E7%BB%84%E6%95%B0%E6%8D%AE/" class="article-date">
  <time class="dt-published" datetime="2022-07-18T10:56:21.000Z" itemprop="datePublished">2022-07-18</time>
</a>
    
  </div>
  <div class="article-inner">
    
    
      <header class="article-header">
        
  
    <h1 itemprop="name">
      <a class="p-name article-title" href="/2022/07/18/%E7%AC%AC13%E7%AB%A0%E5%88%86%E7%BB%84%E6%95%B0%E6%8D%AE/">第13章分组数据</a>
    </h1>
  

      </header>
    
    <div class="e-content article-entry" itemprop="articleBody">
      
        <h1 id="第13章：分组数据"><a href="#第13章：分组数据" class="headerlink" title="第13章：分组数据"></a><center>第13章：分组数据</center></h1><h2 id="13-1-数据分组"><a href="#13-1-数据分组" class="headerlink" title="13.1 数据分组"></a>13.1 数据分组</h2><p>&nbsp; &nbsp;&nbsp; &nbsp;从上一章知道，SQL聚集函数可用来汇总数据。这使我们能够对行进<br>行计数，计算和与平均数，获得最大和最小值而不用检索所有数据。<br>&nbsp; &nbsp;&nbsp; &nbsp;目前为止的所有计算都是在表的所有数据或匹配特定的WHERE子句的<br>数据上进行的。提示一下，下面的例子返回供应商1003提供的产品数目：</p>
<blockquote>
<p>输入：SELECT COUNT(*) AS num_prods FROm products WHERE vend_id=1003;  </p>
</blockquote>
<p>输出： </p>
<table>
<thead>
<tr>
<th align="center">num_prods</th>
</tr>
</thead>
<tbody><tr>
<td align="center">7</td>
</tr>
</tbody></table>
<p>&nbsp; &nbsp;&nbsp; &nbsp;但如果要返回每个供应商提供的产品数目怎么办？或者返回只提供单项产品的供应商所提供的产品，或返回提供10个以上产品的供应商怎么办？这就是分组显身手的时候了。分组允许把数据分为多个逻辑组，以便能对每个组进行聚集计算。</p>
<h2 id="13-2-创建分组"><a href="#13-2-创建分组" class="headerlink" title="13.2 创建分组"></a>13.2 创建分组</h2><p>&nbsp; &nbsp;&nbsp; &nbsp;分组是在SELECT语句的GROUP BY子句中建立的。理解分组的最好办法是看一个例子：  </p>
<blockquote>
<p>输入：SELECT vend_id ,COUNT(*) AS num_prods FROm products GROUP BY vend_id;  </p>
</blockquote>
<p>输出：</p>
<table>
<thead>
<tr>
<th align="left">vend_id</th>
<th align="left">num_prods</th>
</tr>
</thead>
<tbody><tr>
<td align="left">1001</td>
<td align="left">3</td>
</tr>
<tr>
<td align="left">1002</td>
<td align="left">2</td>
</tr>
<tr>
<td align="left">1003</td>
<td align="left">7</td>
</tr>
<tr>
<td align="left">1005</td>
<td align="left">2</td>
</tr>
</tbody></table>
<blockquote>
<p>分析：上面的SELECT语句指定了两个列，vend_id包含产品供应商的ID，num_prods为计算字段（用COUNT(*)函数建立）。GROUP BY子句指示MySQL按vend_id排序并分组数据。这导致对每个vend_id而不是整个表计算num_prods一次。从输出中可以看到，供应商1001有3个产品，供应商1002有2个产品，供应商1003有7个产品，而供应商1005有2个产品。</p>
</blockquote>
<p>&nbsp; &nbsp;&nbsp; &nbsp;因为使用了GROUP BY，就不必指定要计算和估值的每个组了。系统会自动完成。GROUP BY子句指示MySQL分组数据，然后对每个组而不是整个结果集进行聚集。<br>&nbsp; &nbsp;&nbsp; &nbsp;在具体使用GROUP BY子句前，需要知道一些重要的规定。</p>
<ol>
<li><p>GROUP BY子句可以包含任意数目的列。这使得能对分组进行嵌套，为数据分组提供更细致的控制。</p>
</li>
<li><p>如果在GROUP BY子句中嵌套了分组，数据将在最后规定的分组上进行汇总。换句话说，在建立分组时，指定的所有列都一起计算（所以不能从个别的列取回数据）。</p>
</li>
<li><p> GROUP BY子句中列出的每个列都必须是检索列或有效的表达式（但不能是聚集函数）。如果在SELECT中使用表达式，则必须在GROUP BY子句中指定相同的表达式。不能使用别名。</p>
</li>
<li><p>除聚集计算语句外，SELECT语句中的每个列都必须在GROUP BY子句中给出。</p>
</li>
<li><p>如果分组列中具有NULL值，则NULL将作为一个分组返回。如果列中有多行NULL值，它们将分为一组。</p>
</li>
<li><p>GROUP BY子句必须出现在WHERE子句之后，ORDER BY子句之前。</p>
<pre><code> 使用ROLLUP 使用WITH ROLLUP关键字，可以得到每个分组以及每个分组汇总级别（针对每个分组）的值，如下所示：</code></pre>
</li>
</ol>
<h2 id="13-3-过滤分组"><a href="#13-3-过滤分组" class="headerlink" title="13.3 过滤分组"></a>13.3 过滤分组</h2><p>&nbsp; &nbsp;&nbsp; &nbsp;除了能用GROUP BY分组数据外，MySQL还允许过滤分组，规定包括哪些分组，排除哪些分组。例如，可能想要列出至少有两个订单的所有顾客。为得出这种数据，必须基于完整的分组而不是个别的行进行过滤。<br>&nbsp; &nbsp;&nbsp; &nbsp;我们已经看到了WHERE子句的作用（第6章中引入）。但是，在这个例子中WHERE不能完成任务，因为WHERE过滤指定的是行而不是分组。事实上，WHERE没有分组的概念。<br>&nbsp; &nbsp;&nbsp; &nbsp;那么，不使用WHERE使用什么呢？MySQL为此目的提供了另外的子句，那就是HAVING子句。HAVING非常类似于WHERE。事实上，目前为止所学过的所有类型的WHERE子句都可以用HAVING来替代。唯一的差别是WHERE过滤行，而HAVING过滤分组。</p>
<pre><code>    HAVING支持所有WHERE操作符 在第6章和第7章中，我们学习了WHERE子句的条件（包括通配符条件和带多个操作符的子句）。所学过的有关WHERE的所有这些技术和选项都适用于HAVING。它们的句法是相同的，只是关键字有差别。</code></pre>
<blockquote>
<p>输入： SELECT cust_id,COUNT(<em>) AS orders FROM orders GROUP BY cust_id HAVING COUNT(</em>)&gt;=2;</p>
</blockquote>
<p>输出：</p>
<table>
<thead>
<tr>
<th align="center">cust_id</th>
<th align="center">orders</th>
</tr>
</thead>
<tbody><tr>
<td align="center">10001</td>
<td align="center">2</td>
</tr>
</tbody></table>
<blockquote>
<p>分析：这条SELECT语句的前3行类似于上面的语句。最后一行增加了HAVING子句，它过滤COUNT(*) &gt;=2（两个以上的订单）的那些分组。正如所见，这里WHERE子句不起作用，因为过滤是基于分组聚集值而<br>不是特定行值的。</p>
</blockquote>
<pre><code>    HAVING和WHERE的差别 这里有另一种理解方法，WHERE在数据分组前进行过滤，HAVING在数据分组后进行过滤。这是一个重要的区别，WHERE排除的行不包括在分组中。这可能会改变计算值，从而影响HAVING子句中基于这些值过滤掉的分组。</code></pre>
<p>&nbsp; &nbsp;&nbsp; &nbsp;那么，有没有在一条语句中同时使用WHERE和HAVING子句的需要呢？事实上，确实有。假如想进一步过滤上面的语句，使它返回过去12个月内具有两个以上订单的顾客。为达到这一点，可增加一条WHERE子句，过滤出过去12个月内下过的订单。然后再增加HAVING子句过滤出具有两个<br>以上订单的分组。<br>&nbsp; &nbsp;&nbsp; &nbsp;为更好地理解，请看下面的例子，它列出具有2个（含）以上、价格<br>为10（含）以上的产品的供应商：</p>
<blockquote>
<p>输入：SELECT vend_id,COUNT(<em>) AS num_prods FROM products WHERE prod_price &gt;= 10 GROUP BY vend_id HAVING COUNT(</em>)&gt;=2;</p>
</blockquote>
<p>输出：</p>
<table>
<thead>
<tr>
<th align="center">vend_id</th>
<th align="center">num_prods</th>
</tr>
</thead>
<tbody><tr>
<td align="center">1003</td>
<td align="center">4</td>
</tr>
<tr>
<td align="center">1005</td>
<td align="center">2</td>
</tr>
</tbody></table>
<blockquote>
<p>分析：这条语句中，第一行是使用了聚集函数的基本SELECT，它与前面的例子很相像。WHERE子句过滤所有prod_price至少为10的行。然后按vend_id分组数据，HAVING子句过滤计数为2或2以上的分组。如果没有WHERE子句，将会多检索出两行（供应商1002，销售的所有产品价格都在10以下；供应商1001，销售3个产品，但只有一个产品的价格大于等于10）：</p>
</blockquote>
<blockquote>
<p>输入：SELECT vend_id,COUNT(<em>) AS num_prods FROM products GROUP BY vend_id HAVING COUNT(</em>)&gt;=2;</p>
</blockquote>
<p>输出：</p>
<table>
<thead>
<tr>
<th align="center">vend_id</th>
<th align="center">num_prods</th>
</tr>
</thead>
<tbody><tr>
<td align="center">1001</td>
<td align="center">3</td>
</tr>
<tr>
<td align="center">1002</td>
<td align="center">2</td>
</tr>
<tr>
<td align="center">1003</td>
<td align="center">7</td>
</tr>
<tr>
<td align="center">1005</td>
<td align="center">2</td>
</tr>
</tbody></table>
<h3 id="13-4-分组和排序"><a href="#13-4-分组和排序" class="headerlink" title="13.4 分组和排序"></a>13.4 分组和排序</h3><p>&nbsp; &nbsp;&nbsp; &nbsp;虽然GROUP BY和ORDER BY经常完成相同的工作，但它们是非常不同<br>的。下表展示了它们之间的差别。</p>
<table>
<thead>
<tr>
<th align="center">ORDER BY</th>
<th align="center">GROUP BY</th>
</tr>
</thead>
<tbody><tr>
<td align="center">排序产生的输出</td>
<td align="center">分组行。但输出可能不是分组的顺序</td>
</tr>
<tr>
<td align="center">任意列都可以使用（甚至非选择的列也可以使用）</td>
<td align="center">只可能使用选择列或表达式列，而且必须使用每个选择列表达式</td>
</tr>
<tr>
<td align="center">不一定需要</td>
<td align="center">如果与聚集函数一起使用列（或表达式），则必须使用</td>
</tr>
</tbody></table>
<p>&nbsp; &nbsp;&nbsp; &nbsp;表中列出的第一项差别极为重要。我们经常发现用GROUP BY分组的数据确实是以分组顺序输出的。但情况并不总是这样，它并不是SQL规范所要求的。此外，用户也可能会要求以不同于分组的顺序排序。仅因为你以某种方式分组数据（获得特定的分组聚集值），并不表示你需要以相同的方式排序输出。应该提供明确的ORDER BY子句，即使其效果等同于GROUP BY子句也是如此。</p>
<pre><code>    不要忘记ORDER BY 一般在使用GROUP BY子句时，应该也给出ORDER BY子句。这是保证数据正确排序的唯一方法。千万不要仅依赖GROUP BY排序数据。</code></pre>
<p>&nbsp; &nbsp;&nbsp; &nbsp;为说明GROUP BY和ORDER BY的使用方法，请看一个例子。下面的SELECT语句类似于前面那些例子。它检索总计订单价格大于等于50的订单的订单号和总计订单价格：</p>
<blockquote>
<p>输入：SELECT order_num,SUM(quantity<em>item_price) AS ordertotal FROM orderitems GROUP BY order_num HAVING SUM(quantity</em>item_price) &gt;=50;</p>
</blockquote>
<p>输出：</p>
<table>
<thead>
<tr>
<th align="center">order_num</th>
<th align="center">ordertotal</th>
</tr>
</thead>
<tbody><tr>
<td align="center">20005</td>
<td align="center">149.87</td>
</tr>
<tr>
<td align="center">20006</td>
<td align="center">55.00</td>
</tr>
<tr>
<td align="center">20007</td>
<td align="center">1000.00</td>
</tr>
<tr>
<td align="center">20008</td>
<td align="center">125.00</td>
</tr>
</tbody></table>
<p>&nbsp; &nbsp;&nbsp; &nbsp;为按总计订单价格排序输出，需要添加ORDER BY子句，如下所示：</p>
<blockquote>
<p>输入：SELECT order_num,SUM(quantity<em>item_price) AS ordertotal FROM orderitems GROUP BY order_num HAVING SUM(quantity</em>item_price) &gt;=50 ORDER BY ordertotal;</p>
</blockquote>
<p>输出：</p>
<table>
<thead>
<tr>
<th align="center">order_num</th>
<th align="center">ordertotal</th>
</tr>
</thead>
<tbody><tr>
<td align="center">20006</td>
<td align="center">55.00</td>
</tr>
<tr>
<td align="center">20008</td>
<td align="center">125.00</td>
</tr>
<tr>
<td align="center">20005</td>
<td align="center">149.87</td>
</tr>
<tr>
<td align="center">20007</td>
<td align="center">1000.00</td>
</tr>
</tbody></table>
<blockquote>
<p>分析：</p>
</blockquote>
<p>在这个例子中，GROUP BY 子句用来按订单号（order_num列）分组数据，以便SUM(*)函数能够返回总计订单价格。HAVING子句过滤数据，使得只返回总计订单价格大于等于50的订单。最后，用ORDER BY排序。</p>
<h2 id="13-5-SELECT子句顺序"><a href="#13-5-SELECT子句顺序" class="headerlink" title="13.5 SELECT子句顺序"></a>13.5 SELECT子句顺序</h2><p>&nbsp; &nbsp;&nbsp; &nbsp;回顾一下SELECt语句中子句的顺序。<br>|  子句         |  说明               |     是否必须使用        |<br>|  :—–:      |  :——-:          |    :——-:          |<br>|  SELECT    |  要返回的列或表达式  |     是                 |<br>|  FROM            |  从中检索数据的表    |   仅在从表选择数据时使用|<br>|  WHERE    |  行级过滤           |   否                   |<br>|  GROUP BY     |  分组说明           |   仅在按组计算聚集时使用 |<br>|  HAVING       |  组级过滤           |   否                   |<br>|  ORDER BY     |  输出排序顺序       |   否                   |<br>|  LIMIT        |  要检索的行数        |  否                   |</p>
<p>输出：  </p>
<table>
<thead>
<tr>
<th align="left">avg_price</th>
</tr>
</thead>
<tbody><tr>
<td align="left">16.133571</td>
</tr>
</tbody></table>
<blockquote>
<p>分析：此SELECT语句返回值avg_Price，它包含products表中所有产品的平均价格。如第10章所述，avg_price是一个别名。</p>
</blockquote>
<pre><code>    只用于单个列 AVG()只能用来确定特定数值列的平均值，而且列名必须作为函数参数给出。为了获得多个列的平均值，必须使用多个AVG()函数。

    NULL值 AVG()函数忽略列值为NULL的行。</code></pre>
<h3 id="12-1-2-COUNT-函数"><a href="#12-1-2-COUNT-函数" class="headerlink" title="12.1.2 COUNT()函数"></a>12.1.2 COUNT()函数</h3><p>&nbsp; &nbsp;&nbsp; &nbsp;COUNT()函数进行计数。可利用COUNT()确定表中行的数目或符合特定条件的行的数目。<br>&nbsp; &nbsp;&nbsp; &nbsp;COUNT()函数有两种使用方式。  </p>
<ol>
<li>使用COUNT(*)对表中行的数目进行计数，不管表列中包含的是空值（NULL）还是非空值。</li>
<li>使用COUNT(column)对特定列中具有值的行进行计数，忽略NULL值。</li>
</ol>
<blockquote>
<p>输入：SELECT COUNT(*) AS num_cust FROm customers;</p>
</blockquote>
<p>输出:</p>
<table>
<thead>
<tr>
<th align="left">num_cust</th>
</tr>
</thead>
<tbody><tr>
<td align="left">5</td>
</tr>
</tbody></table>
<blockquote>
<p>分析： 在此例子中，利用COUNT(*)对所有行计数，不管行中各列有什么值。计数值在num_cust中返回。  </p>
</blockquote>
<p>&nbsp; &nbsp;&nbsp; &nbsp;下面的例子只对具有电子邮件地址的客户计数：  </p>
<blockquote>
<p>SELECT COUNT(cust_email) AS num_cust FROm customers;</p>
</blockquote>
<p>输出：</p>
<table>
<thead>
<tr>
<th align="left">num_cust</th>
</tr>
</thead>
<tbody><tr>
<td align="left">3</td>
</tr>
</tbody></table>
<blockquote>
<p>分析：这条SELECT语句使用COUNT(cust_email)对cust_email列中有值的行进行计数。在此例子中，cust_email的计数为3（表示5个客户中只有3个客户有电子邮件地址）。</p>
</blockquote>
<pre><code>    NULL值 如果指定列名，则指定列的值为空的行被COUNT()函数忽略，但如果COUNT()函数中用的是星号（*），则不忽略。</code></pre>
<h3 id="12-1-3-MAX-函数"><a href="#12-1-3-MAX-函数" class="headerlink" title="12.1.3 MAX()函数"></a>12.1.3 MAX()函数</h3><p>&nbsp; &nbsp;&nbsp; &nbsp;MAX()返回指定列中的最大值。MAX()要求指定列名，如下所示：  </p>
<blockquote>
<p>输入：SELECT MAX(prod_price) AS max_price FROM products;  </p>
</blockquote>
<p>输出:  </p>
<table>
<thead>
<tr>
<th align="left">min_price</th>
</tr>
</thead>
<tbody><tr>
<td align="left">55.00</td>
</tr>
</tbody></table>
<blockquote>
<p>分析：这里，MAX()返回products表中最贵的物品的价格。  </p>
</blockquote>
<pre><code>    对非数值数据使用MAX() 虽然MAX()一般用来找出最大的数值或日期值，但MySQL允许将它用来返回任意列中的最大值，包括返回文本列中的最大值。在用于文本数据时，如果数据按相应的列排序，则MAX()返回最后一行。  

    NULL值 MAX()函数忽略列值为NULL的行。</code></pre>
<h3 id="12-1-4-MIN-函数"><a href="#12-1-4-MIN-函数" class="headerlink" title="12.1.4 MIN()函数"></a>12.1.4 MIN()函数</h3><p>&nbsp; &nbsp;&nbsp; &nbsp;MIN()的功能正好与MAX()功能相反，它返回指定列的最小值。</p>
<h3 id="12-1-5-SUM-函数"><a href="#12-1-5-SUM-函数" class="headerlink" title="12.1.5 SUM()函数"></a>12.1.5 SUM()函数</h3><p>&nbsp; &nbsp;&nbsp; &nbsp;SUM()用来返回指定列值得和（总计）。<br>&nbsp; &nbsp;&nbsp; &nbsp;下面举一个例子，orderitems表包含订单中实际的物品，每个物品有相应的数量（quantity）。可如下检索所订购物品的总数（所有quantity值之和）：</p>
<blockquote>
<p>输入：SELECT SUM(quantity) AS items_ordered FROM orderitems WHERE order_num =20005;</p>
</blockquote>
<p>输出：</p>
<table>
<thead>
<tr>
<th align="left">items_ordered</th>
</tr>
</thead>
<tbody><tr>
<td align="left">19</td>
</tr>
</tbody></table>
<blockquote>
<p>分析：函数SUM(quantity)返回订单中所有物品数量之和，WHERE子句保证只统计某个物品订单中的物品。</p>
</blockquote>
<p>&nbsp; &nbsp;&nbsp; &nbsp;SUM()也可以用来合计计算值。在下面的例子中，合计每项物品的<br>item_price*quantity，得出总的订单金额：</p>
<blockquote>
<p>输入：SELECT SUM(item_price*quantity) AS total_price FROM orderitems WHERE order_num =20005;  </p>
</blockquote>
<p>输出：</p>
<table>
<thead>
<tr>
<th align="left">total_price</th>
</tr>
</thead>
<tbody><tr>
<td align="left">149.87</td>
</tr>
</tbody></table>
<blockquote>
<p>分析：函数SUM(item_price*quantity)返回订单中所有物品价钱之和，WHERE子句同样保证只统计某个物品订单中的物品。</p>
</blockquote>
<pre><code>    在多个列上进行计算 如本例所示，利用标准的算术操作符，所有聚集函数都可用来执行多个列上的计算。
    NULL值 SUM()函数忽略列值为NULL的行。</code></pre>
<h2 id="12-2-聚集不同值"><a href="#12-2-聚集不同值" class="headerlink" title="12.2 聚集不同值"></a>12.2 聚集不同值</h2><pre><code>    MySQL 5 及后期版本 下面将要介绍的聚集函数的DISTINCT的使用，已经被添加到MySQL 5.0.3中。下面所述内容在MySQL 4.x中不能正常运行。</code></pre>
<p>&nbsp; &nbsp;&nbsp; &nbsp;以上5个聚集函数都可以如下使用：</p>
<ol>
<li><p>对所有的行执行计算，指定ALL参数或不给参数（因为ALL是默认<br>行为）；  </p>
</li>
<li><p>只包含不同的值，指定DISTINCT参数。</p>
<pre><code> ALL为默认 ALL参数不需要指定，因为它是默认行为。如果不指定DISTINCT，则假定为ALL。</code></pre>
</li>
</ol>
<p>&nbsp; &nbsp;&nbsp; &nbsp;下面的例子使用AVG()函数返回特定供应商提供的产品的平均价格。它与上面的SELECT语句相同，但使用了DISTINCT参数，因此平均值只考虑各个不同的价格：</p>
<blockquote>
<p>输入：SELECT AVG(DISTINCT prod_price) AS avg_price FROM products WHERE end_id=1003;</p>
</blockquote>
<p>输出： </p>
<table>
<thead>
<tr>
<th align="left">avg_price</th>
</tr>
</thead>
<tbody><tr>
<td align="left">15.998000</td>
</tr>
</tbody></table>
<blockquote>
<p>分析：可以看到，在使用了DISTINCT后，此例子中的avg_price比较高，因为有多个物品具有相同的较低价格。排除它们提升了平均价格。</p>
</blockquote>
<pre><code>    注意 如果指定列名，则DISTINCT只能用于COUNT()。DISTINCT不能用于COUNT(*)，因此不允许使用COUNT（DISTINCT），否则会产生错误。类似地，DISTINCT必须使用列名，不能用于计算或表达式。</code></pre>
<h2 id="12-3-组合聚集函数"><a href="#12-3-组合聚集函数" class="headerlink" title="12.3 组合聚集函数"></a>12.3 组合聚集函数</h2><p>&nbsp; &nbsp;&nbsp; &nbsp;SELECT语句可根据需要包含多个聚集函数。请看下面的例子：  </p>
<blockquote>
<p>输入：SELECT COUNT(*) AS num_items,Min(prod_price) AS price_min,MAX(prod_price) AS price_max, AVG(prod_price) AS price_avg FROM products;</p>
</blockquote>
<p>输出：</p>
<table>
<thead>
<tr>
<th align="left">num_items</th>
<th align="left">price_min</th>
<th align="left">price_max</th>
<th align="left">price_avg</th>
</tr>
</thead>
<tbody><tr>
<td align="left">14</td>
<td align="left">2.5</td>
<td align="left">55</td>
<td align="left">16.133571</td>
</tr>
</tbody></table>
<blockquote>
<p>分析：这里用单条SELECT语句执行了4个聚集计算，返回4个值（products表中物品的数目，产品价格的最高、最低以及平均值）。</p>
</blockquote>
<pre><code>    取别名 在指定别名以包含某个聚集函数的结果时，不应该使用表中实际的列名。虽然这样做并非不合法，但使用唯一的名字会使你的SQL更易于理解和使用（以及将来容易排除故障）。</code></pre>

      
    </div>
    <footer class="article-footer">
      <a data-url="http://example/2022/07/18/%E7%AC%AC13%E7%AB%A0%E5%88%86%E7%BB%84%E6%95%B0%E6%8D%AE/" data-id="clemvoh7s000h7s7eba7rev7p" data-title="第13章分组数据" class="article-share-link">Share</a>
      
      
  <ul class="article-tag-list" itemprop="keywords"><li class="article-tag-list-item"><a class="article-tag-list-link" href="/tags/MySQL%E5%BF%85%E7%9F%A5%E5%BF%85%E4%BC%9A/" rel="tag">MySQL必知必会</a></li></ul>

    </footer>
  </div>
  
</article>


    <article id="post-第12章汇总数据" class="h-entry article article-type-post" itemprop="blogPost" itemscope itemtype="https://schema.org/BlogPosting">
  <div class="article-meta">
    <a href="/2022/07/17/%E7%AC%AC12%E7%AB%A0%E6%B1%87%E6%80%BB%E6%95%B0%E6%8D%AE/" class="article-date">
  <time class="dt-published" datetime="2022-07-17T13:29:00.000Z" itemprop="datePublished">2022-07-17</time>
</a>
    
  </div>
  <div class="article-inner">
    
    
      <header class="article-header">
        
  
    <h1 itemprop="name">
      <a class="p-name article-title" href="/2022/07/17/%E7%AC%AC12%E7%AB%A0%E6%B1%87%E6%80%BB%E6%95%B0%E6%8D%AE/">第12章汇总数据</a>
    </h1>
  

      </header>
    
    <div class="e-content article-entry" itemprop="articleBody">
      
        <h1 id="第12章：汇总数据"><a href="#第12章：汇总数据" class="headerlink" title="第12章：汇总数据"></a><center>第12章：汇总数据</center></h1><h2 id="12-1-汇总数据"><a href="#12-1-汇总数据" class="headerlink" title="12.1 汇总数据"></a>12.1 汇总数据</h2><p>&nbsp; &nbsp;&nbsp; &nbsp;我们经常需要汇总数据而不用把它们实际检索出来，为此MySQL提供了专门的函数。使用这些函数，MySQL查询可用于检索数据，以便分析和报表生成。这种类型的检索例子有以下几种。</p>
<ol>
<li>确定表中行数（或者满足某个条件或包含某个特定值的行数）。</li>
<li>获得表中行组的和。</li>
<li>找出表列（或所有行或某些特定的行）的最大值、最小值和平均值。  </li>
</ol>
<p>&nbsp; &nbsp;&nbsp; &nbsp;上述例子都需要对表中数据（而不是实际数据本身）汇总。因此，返回实际表数据是对时间和处理资源的一种浪费（更不用说带宽了）。重复一遍，实际想要的是汇总信息。</p>
<pre><code>    聚集函数（aggregate function） 运行在行组上，计算和返回单个值的函数。</code></pre>
<p>&nbsp; &nbsp;&nbsp; &nbsp;为方便这种类型的检索，MySQL给出了5个聚集函数。<br>|     函数       |   说明            |<br>| :——-      |  :——-         |<br>|   AVG()       |  返回某列的平均值  |<br>|   COUNT()     |  返回某列的行数|<br>|   MAX()       |  返回某列的最大值|<br>|   MIN()       |  返回某列的最小值|<br>|   SUM()       |  返回某列值之和|</p>
<h3 id="12-1-1-AVG-函数"><a href="#12-1-1-AVG-函数" class="headerlink" title="12.1.1 AVG()函数"></a>12.1.1 AVG()函数</h3><p>&nbsp; &nbsp;&nbsp; &nbsp;AVG()通过对表中行数计数并计算特定列值之和，求得该列的平均值。AVG()可用来返回所有列的平均值，也可以用来返回特定列或行的平均值。<br>&nbsp; &nbsp;&nbsp; &nbsp;下面的例子使用AVG()返回products表中所有产品的平均价格：   </p>
<blockquote>
<p>输入: SELECT AVG(prod_price) AS avg_price FROM products;</p>
</blockquote>
<p>输出：  </p>
<table>
<thead>
<tr>
<th align="left">avg_price</th>
</tr>
</thead>
<tbody><tr>
<td align="left">16.133571</td>
</tr>
</tbody></table>
<blockquote>
<p>分析：此SELECT语句返回值avg_Price，它包含products表中所有产品的平均价格。如第10章所述，avg_price是一个别名。</p>
</blockquote>
<pre><code>    只用于单个列 AVG()只能用来确定特定数值列的平均值，而且列名必须作为函数参数给出。为了获得多个列的平均值，必须使用多个AVG()函数。

    NULL值 AVG()函数忽略列值为NULL的行。</code></pre>
<h3 id="12-1-2-COUNT-函数"><a href="#12-1-2-COUNT-函数" class="headerlink" title="12.1.2 COUNT()函数"></a>12.1.2 COUNT()函数</h3><p>&nbsp; &nbsp;&nbsp; &nbsp;COUNT()函数进行计数。可利用COUNT()确定表中行的数目或符合特定条件的行的数目。<br>&nbsp; &nbsp;&nbsp; &nbsp;COUNT()函数有两种使用方式。  </p>
<ol>
<li>使用COUNT(*)对表中行的数目进行计数，不管表列中包含的是空值（NULL）还是非空值。</li>
<li>使用COUNT(column)对特定列中具有值的行进行计数，忽略NULL值。</li>
</ol>
<blockquote>
<p>输入：SELECT COUNT(*) AS num_cust FROm customers;</p>
</blockquote>
<p>输出:</p>
<table>
<thead>
<tr>
<th align="left">num_cust</th>
</tr>
</thead>
<tbody><tr>
<td align="left">5</td>
</tr>
</tbody></table>
<blockquote>
<p>分析： 在此例子中，利用COUNT(*)对所有行计数，不管行中各列有什么值。计数值在num_cust中返回。  </p>
</blockquote>
<p>&nbsp; &nbsp;&nbsp; &nbsp;下面的例子只对具有电子邮件地址的客户计数：  </p>
<blockquote>
<p>SELECT COUNT(cust_email) AS num_cust FROm customers;</p>
</blockquote>
<p>输出：</p>
<table>
<thead>
<tr>
<th align="left">num_cust</th>
</tr>
</thead>
<tbody><tr>
<td align="left">3</td>
</tr>
</tbody></table>
<blockquote>
<p>分析：这条SELECT语句使用COUNT(cust_email)对cust_email列中有值的行进行计数。在此例子中，cust_email的计数为3（表示5个客户中只有3个客户有电子邮件地址）。</p>
</blockquote>
<pre><code>    NULL值 如果指定列名，则指定列的值为空的行被COUNT()函数忽略，但如果COUNT()函数中用的是星号（*），则不忽略。</code></pre>
<h3 id="12-1-3-MAX-函数"><a href="#12-1-3-MAX-函数" class="headerlink" title="12.1.3 MAX()函数"></a>12.1.3 MAX()函数</h3><p>&nbsp; &nbsp;&nbsp; &nbsp;MAX()返回指定列中的最大值。MAX()要求指定列名，如下所示：  </p>
<blockquote>
<p>输入：SELECT MAX(prod_price) AS max_price FROM products;  </p>
</blockquote>
<p>输出:  </p>
<table>
<thead>
<tr>
<th align="left">min_price</th>
</tr>
</thead>
<tbody><tr>
<td align="left">55.00</td>
</tr>
</tbody></table>
<blockquote>
<p>分析：这里，MAX()返回products表中最贵的物品的价格。  </p>
</blockquote>
<pre><code>    对非数值数据使用MAX() 虽然MAX()一般用来找出最大的数值或日期值，但MySQL允许将它用来返回任意列中的最大值，包括返回文本列中的最大值。在用于文本数据时，如果数据按相应的列排序，则MAX()返回最后一行。  

    NULL值 MAX()函数忽略列值为NULL的行。</code></pre>
<h3 id="12-1-4-MIN-函数"><a href="#12-1-4-MIN-函数" class="headerlink" title="12.1.4 MIN()函数"></a>12.1.4 MIN()函数</h3><p>&nbsp; &nbsp;&nbsp; &nbsp;MIN()的功能正好与MAX()功能相反，它返回指定列的最小值。</p>
<h3 id="12-1-5-SUM-函数"><a href="#12-1-5-SUM-函数" class="headerlink" title="12.1.5 SUM()函数"></a>12.1.5 SUM()函数</h3><p>&nbsp; &nbsp;&nbsp; &nbsp;SUM()用来返回指定列值得和（总计）。<br>&nbsp; &nbsp;&nbsp; &nbsp;下面举一个例子，orderitems表包含订单中实际的物品，每个物品有相应的数量（quantity）。可如下检索所订购物品的总数（所有quantity值之和）：</p>
<blockquote>
<p>输入：SELECT SUM(quantity) AS items_ordered FROM orderitems WHERE order_num =20005;</p>
</blockquote>
<p>输出：</p>
<table>
<thead>
<tr>
<th align="left">items_ordered</th>
</tr>
</thead>
<tbody><tr>
<td align="left">19</td>
</tr>
</tbody></table>
<blockquote>
<p>分析：函数SUM(quantity)返回订单中所有物品数量之和，WHERE子句保证只统计某个物品订单中的物品。</p>
</blockquote>
<p>&nbsp; &nbsp;&nbsp; &nbsp;SUM()也可以用来合计计算值。在下面的例子中，合计每项物品的<br>item_price*quantity，得出总的订单金额：</p>
<blockquote>
<p>输入：SELECT SUM(item_price*quantity) AS total_price FROM orderitems WHERE order_num =20005;  </p>
</blockquote>
<p>输出：</p>
<table>
<thead>
<tr>
<th align="left">total_price</th>
</tr>
</thead>
<tbody><tr>
<td align="left">149.87</td>
</tr>
</tbody></table>
<blockquote>
<p>分析：函数SUM(item_price*quantity)返回订单中所有物品价钱之和，WHERE子句同样保证只统计某个物品订单中的物品。</p>
</blockquote>
<pre><code>    在多个列上进行计算 如本例所示，利用标准的算术操作符，所有聚集函数都可用来执行多个列上的计算。
    NULL值 SUM()函数忽略列值为NULL的行。</code></pre>
<h2 id="12-2-聚集不同值"><a href="#12-2-聚集不同值" class="headerlink" title="12.2 聚集不同值"></a>12.2 聚集不同值</h2><pre><code>    MySQL 5 及后期版本 下面将要介绍的聚集函数的DISTINCT的使用，已经被添加到MySQL 5.0.3中。下面所述内容在MySQL 4.x中不能正常运行。</code></pre>
<p>&nbsp; &nbsp;&nbsp; &nbsp;以上5个聚集函数都可以如下使用：</p>
<ol>
<li><p>对所有的行执行计算，指定ALL参数或不给参数（因为ALL是默认<br>行为）；  </p>
</li>
<li><p>只包含不同的值，指定DISTINCT参数。</p>
<pre><code> ALL为默认 ALL参数不需要指定，因为它是默认行为。如果不指定DISTINCT，则假定为ALL。</code></pre>
</li>
</ol>
<p>&nbsp; &nbsp;&nbsp; &nbsp;下面的例子使用AVG()函数返回特定供应商提供的产品的平均价格。它与上面的SELECT语句相同，但使用了DISTINCT参数，因此平均值只考虑各个不同的价格：</p>
<blockquote>
<p>输入：SELECT AVG(DISTINCT prod_price) AS avg_price FROM products WHERE end_id=1003;</p>
</blockquote>
<p>输出： </p>
<table>
<thead>
<tr>
<th align="left">avg_price</th>
</tr>
</thead>
<tbody><tr>
<td align="left">15.998000</td>
</tr>
</tbody></table>
<blockquote>
<p>分析：可以看到，在使用了DISTINCT后，此例子中的avg_price比较高，因为有多个物品具有相同的较低价格。排除它们提升了平均价格。</p>
</blockquote>
<pre><code>    注意 如果指定列名，则DISTINCT只能用于COUNT()。DISTINCT不能用于COUNT(*)，因此不允许使用COUNT（DISTINCT），否则会产生错误。类似地，DISTINCT必须使用列名，不能用于计算或表达式。</code></pre>
<h2 id="12-3-组合聚集函数"><a href="#12-3-组合聚集函数" class="headerlink" title="12.3 组合聚集函数"></a>12.3 组合聚集函数</h2><p>&nbsp; &nbsp;&nbsp; &nbsp;SELECT语句可根据需要包含多个聚集函数。请看下面的例子：  </p>
<blockquote>
<p>输入：SELECT COUNT(*) AS num_items,Min(prod_price) AS price_min,MAX(prod_price) AS price_max, AVG(prod_price) AS price_avg FROM products;</p>
</blockquote>
<p>输出：</p>
<table>
<thead>
<tr>
<th align="left">num_items</th>
<th align="left">price_min</th>
<th align="left">price_max</th>
<th align="left">price_avg</th>
</tr>
</thead>
<tbody><tr>
<td align="left">14</td>
<td align="left">2.5</td>
<td align="left">55</td>
<td align="left">16.133571</td>
</tr>
</tbody></table>
<blockquote>
<p>分析：这里用单条SELECT语句执行了4个聚集计算，返回4个值（products表中物品的数目，产品价格的最高、最低以及平均值）。</p>
</blockquote>
<pre><code>    取别名 在指定别名以包含某个聚集函数的结果时，不应该使用表中实际的列名。虽然这样做并非不合法，但使用唯一的名字会使你的SQL更易于理解和使用（以及将来容易排除故障）。</code></pre>

      
    </div>
    <footer class="article-footer">
      <a data-url="http://example/2022/07/17/%E7%AC%AC12%E7%AB%A0%E6%B1%87%E6%80%BB%E6%95%B0%E6%8D%AE/" data-id="clemvoh7q000g7s7eah2p7pue" data-title="第12章汇总数据" class="article-share-link">Share</a>
      
      
  <ul class="article-tag-list" itemprop="keywords"><li class="article-tag-list-item"><a class="article-tag-list-link" href="/tags/MySQL%E5%BF%85%E7%9F%A5%E5%BF%85%E4%BC%9A/" rel="tag">MySQL必知必会</a></li></ul>

    </footer>
  </div>
  
</article>


    <article id="post-第11章使用数据处理函数" class="h-entry article article-type-post" itemprop="blogPost" itemscope itemtype="https://schema.org/BlogPosting">
  <div class="article-meta">
    <a href="/2022/07/16/%E7%AC%AC11%E7%AB%A0%E4%BD%BF%E7%94%A8%E6%95%B0%E6%8D%AE%E5%A4%84%E7%90%86%E5%87%BD%E6%95%B0/" class="article-date">
  <time class="dt-published" datetime="2022-07-16T11:49:42.000Z" itemprop="datePublished">2022-07-16</time>
</a>
    
  </div>
  <div class="article-inner">
    
    
      <header class="article-header">
        
  
    <h1 itemprop="name">
      <a class="p-name article-title" href="/2022/07/16/%E7%AC%AC11%E7%AB%A0%E4%BD%BF%E7%94%A8%E6%95%B0%E6%8D%AE%E5%A4%84%E7%90%86%E5%87%BD%E6%95%B0/">第11章使用数据处理函数</a>
    </h1>
  

      </header>
    
    <div class="e-content article-entry" itemprop="articleBody">
      
        <h1 id="第11章：使用数据处理函数"><a href="#第11章：使用数据处理函数" class="headerlink" title="第11章：使用数据处理函数"></a><center>第11章：使用数据处理函数</center></h1><h2 id="11-1-函数"><a href="#11-1-函数" class="headerlink" title="11.1 函数"></a>11.1 函数</h2><p>&nbsp; &nbsp;&nbsp; &nbsp;与其他大多数计算机语言一样， SQL支持利用函数来处理数据。函数<br>一般是在数据上执行的，它给数据的转换和处理提供了方便。在前一章中用来去掉串尾空格的RTrim()就是一个函数的例子。</p>
<pre><code>    函数没有SQL的可移植性强 能运行在多个系统上的代码称
    为可移植的（portable）。相对来说，多数SQL语句是可移植的，
    在SQL实现之间有差异时，这些差异通常不那么难处理。而函
    数的可移植性却不强。几乎每种主要的DBMS的实现都支持其
    他实现不支持的函数，而且有时差异还很大。

    为了代码的可移植，许多SQL程序员不赞成使用特殊实现的功
    能。虽然这样做很有好处，但不总是利于应用程序的性能。如
    果不使用这些函数，编写某些应用程序代码会很艰难。必须利
    用其他方法来实现DBMS非常有效地完成的工作。

    如果你决定使用函数，应该保证做好代码注释，以便以后你（或
    其他人）能确切地知道所编写SQL代码的含义。</code></pre>
<h2 id="11-2-使用函数"><a href="#11-2-使用函数" class="headerlink" title="11.2 使用函数"></a>11.2 使用函数</h2><p>&nbsp; &nbsp;&nbsp; &nbsp;大多数SQL实现支持以下类型的函数。</p>
<ol>
<li>用于处理文本串（如删除或填充值，转换值为大写或小写）的文本函数。</li>
<li>用于在数值数据上进行算术操作（如返回绝对值，进行代数运算）的数值函数。</li>
<li>用于处理日期和时间值并从这些值中提取特定成分（例如，返回两个日期之差，检查日期有效性等）的日期和时间函数。</li>
<li>返回DBMS正使用的特殊信息（如返回用户登录信息，检查版本细节）的系统函数。</li>
</ol>
<h3 id="11-2-1-文本处理函数"><a href="#11-2-1-文本处理函数" class="headerlink" title="11.2.1 文本处理函数"></a>11.2.1 文本处理函数</h3><p>&nbsp; &nbsp;&nbsp; &nbsp;上一章中我们已经看过一个文本处理函数的例子，其中使用RTrim()函数来去除列值右边的空格。下面是另一个例子，这次使用Upper()函数：</p>
<blockquote>
<p>输入：SELECT vend_name,Upper(vend_name) AS vend_name_upcase FROM vendors ORDER BY vend_name;</p>
</blockquote>
<p>输出：</p>
<table>
<thead>
<tr>
<th align="left">vend_name</th>
<th align="left">vend_name_upcase</th>
</tr>
</thead>
<tbody><tr>
<td align="left">ACME</td>
<td align="left">ACME</td>
</tr>
<tr>
<td align="left">Anvils R Us</td>
<td align="left">ANVILS R US</td>
</tr>
<tr>
<td align="left">Furball Inc.</td>
<td align="left">FURBALL INC.</td>
</tr>
<tr>
<td align="left">Jet Set</td>
<td align="left">JET SET</td>
</tr>
<tr>
<td align="left">Jouets Et Ours</td>
<td align="left">JOUETS ET OURS</td>
</tr>
<tr>
<td align="left">LT Supplies</td>
<td align="left">LT SUPPLIES</td>
</tr>
</tbody></table>
<blockquote>
<p>分析：Upper()将文本转换为大写，因此本例子中每个供应商都列出两次，第一次为vendors表中存储的值，第二次作为列vend_name_upcase转换为大写。</p>
</blockquote>
<p>常用的文本处理函数。<br>|     函数       |   说明            |<br>| :——-      |  :——-         |<br>|  Left()       |   返回串左边的字符 |<br>|  Length()     |   返回串的长度     |<br>|  Locate()     |   找出串的一个子串 |<br>|  Lower()      |   将串转换成小写   |<br>|  LTrim        |   去掉串左边的空格 |<br>|  Right()    |   返回右边的字符   |<br>|  RTrim        |   去掉串右边的空格 |<br>|  Soundex()    |   返回串的SOUNDEX值|<br>|  SubString()  |   返回子串的字符   |<br>|  Upper()      |   将串转换为大写   |</p>
<pre><code>    SOUNDEX需要做进一步的解释。SOUNDEX是一个将任何文本串转换为描述其语音表示的字母数字模式的算法。SOUNDEX考虑了类似的发音字符和音节，使得能对串进行发音比较而不是字母比较。虽然SOUNDEX不是SQL概念，但MySQL（就像多数DBMS一样）都提供对SOUNDEX的支持。</code></pre>
<p>&nbsp; &nbsp;&nbsp; &nbsp;下面给出一个使用Soundex()函数的例子。customers表中有一个顾<br>客Coyote Inc.，其联系名为Y.Lee。但如果这是输入错误，此联系名实<br>际应该是Y.Lie，怎么办？显然，按正确的联系名搜索不会返回数据，如<br>下所示：</p>
<blockquote>
<p>输入：SELECT cust_name,cust_contact FROM customers WHERE cust_contact=’Y.Lie’;</p>
</blockquote>
<p>输出：</p>
<table>
<thead>
<tr>
<th align="center">cust_name</th>
<th align="center">cust_contact</th>
</tr>
</thead>
</table>
<p>&nbsp; &nbsp;&nbsp; &nbsp;现在试一下使用Soundex()函数进行搜索，它匹配所有发音类似于<br>Y.Lie的联系名：</p>
<blockquote>
<p>输入：SELECT cust_name,cust_contact FROM customers WHERE Soundex(cust_contact)=Soundex(‘Y.Lie’);</p>
</blockquote>
<p>输出：</p>
<table>
<thead>
<tr>
<th align="center">cust_name</th>
<th align="center">cust_contact</th>
</tr>
</thead>
<tbody><tr>
<td align="center">200 Maple Lane</td>
<td align="center">Y Lee</td>
</tr>
</tbody></table>
<blockquote>
<p>分析：在这个例子中，WHERE子句使用Soundex()函数来转换cust_ contact列值和搜索串为它们的SOUNDEX值。因为Y.Lee和Y.Lie发音相似，所以它们的SOUNDEX值匹配，因此WHERE子句正确地过滤出了所需的数据。</p>
</blockquote>
<p>&nbsp; &nbsp;&nbsp; &nbsp;正则表达式用正则表达式语言来建立，正则表达式语言是用来完成刚讨论的所有工作以及更多工作的一种特殊语言。与任意语言一样，正则表达式具有你必须学习的特殊的语法和指令。  </p>
<h3 id="11-2-2-日期和时间处理函数"><a href="#11-2-2-日期和时间处理函数" class="headerlink" title="11.2.2 日期和时间处理函数"></a>11.2.2 日期和时间处理函数</h3><p>&nbsp; &nbsp;&nbsp; &nbsp;日期和时间采用相应的数据类型和特殊的格式存储，以便能快速和有效地排序或过滤，并且节省物理存储空间。<br>&nbsp; &nbsp;&nbsp; &nbsp;一般，应用程序不使用用来存储日期和时间的格式，因此日期和时间函数总是被用来读取、统计和处理这些值。由于这个原因，日期和时间函数在MySQL语言中具有重要的作用。</p>
<p>常用时期和时间处理函数<br>|     函数      | 说明          |<br>| :——-     | :——-     |<br>|AddDate()     | 增加一个日期（天、周等）|<br>|AddTime()     | 增加一个时间（时、分等）|<br>|CurDate()     | 返回当前日期           |<br>|CurTime()     | 返回当前时间           |<br>|Date()        | 返回日期时间的日期部分  |<br>|DateDiff()    | 计算两个日期之差       |<br>|Date_Add()    | 高度灵活的日期运算函数  |<br>|Date_Format() | 返回一个格式化的日期或时间串|<br>|Day()         | 返回一个日期的天数部分|<br>|DayOfWeek()   | 对于一个日期，返回对应的星期几|<br>|Hour()        | 返回一个时间的小时部分|<br>|Minute()      | 返回一个时间的分钟部分|<br>|Month()       | 返回一个日期的月份部分|<br>|Now()         | 返回当前日期和时间|<br>|Second()      | 返回一个时间的秒部分 |<br>|Time()        | 返回一个日期时间的时间部分|<br>|Year()        | 返回一个日期的年份部分|</p>
<pre><code>    用日期进行过滤需要注意一些别的问题和使用特殊的MySQL函数。
    首先需要注意的是MySQL使用的日期格式。无论你什么时候指定一个日期，不管是插入或更新表值还是用WHERE子句进行过滤，日期必须为格式yyyy-mm-dd。因此，2005年9月1日，给出为2005-09-01。虽然其他的日期格式可能也行，但这是首选的日期格式，因为它排除了多义性（如，04/05/06是2006年5月4日或2006年4月5日或2004年5月6日或……）。

    应该总是使用4位数字的年份 支持2位数字的年份，MySQL处理00-69为2000-2069，处理70-99为1970-1999。虽然它们可能是打算要的年份，但使用完整的4位数字年份更可靠，因为MySQL不必做出任何假定。</code></pre>
<blockquote>
<p>输入：SLECT cust_id,order_num FROM ordes WHERE order_date=’2005-09-01’;</p>
</blockquote>
<p>输出：</p>
<table>
<thead>
<tr>
<th align="left">cust_id</th>
<th align="left">order_num</th>
</tr>
</thead>
<tbody><tr>
<td align="left">10001</td>
<td align="left">20005</td>
</tr>
</tbody></table>
<blockquote>
<p>分析：此SELECT语句正常运行。它检索出一个订单记录，该订单记录的order_date为2005-09-01。</p>
</blockquote>
<p>&nbsp; &nbsp;&nbsp; &nbsp;但是，使用WHERE order_date = ‘2005-09-01’可靠吗？order_ date的数据类型为datetime。这种类型存储日期及时间值。样例表中的值全都具有时间值00:00:00，但实际中很可能并不总是这样。如果用当前日期和时间存储订单日期（因此你不仅知道订单日期，还知道下订单当天的时间），怎 么 办？ 比 如 ， 存 储 的 order_date 值 为2005-09-01 11:30:05，则WHERE order_date = ‘2005-09-01’失败。即使给出具有该日期的一行，也不会把它检索出来，因为WHERE匹配失败。<br>&nbsp; &nbsp;&nbsp; &nbsp;解决办法是指示MySQL仅将给出的日期与列中的日期部分进行比较，而不是将给出的日期与整个列值进行比较。为此，必须使用Date()函数。Date(order_date)指示MySQL仅提取列的日期部分，更可靠的SELECT语句为：</p>
<blockquote>
<p>输入：SELECT cust_id,order_num FROM orders WHERE Date(order_date)=’2005-09-01’;</p>
</blockquote>
<pre><code>    如果要的是日期，请使用Date() 如果你想要的仅是日期，则使用Date()是一个良好的习惯，即使你知道相应的列只包含日期也是如此。这样，如果由于某种原因表中以后有日期和时间值，你的SQL代码也不用改变。当然，也存在一个Time()函数，在你只想要时间时应该使用它。
    Date()和Time()都是在MySQL 4.1.1中第一次引入的。

    仅为正则表达式的一个子集：如果你熟悉正则表达式，需要注意：MySQL仅支持多数正则表达式实现的一个很小的子集。  </code></pre>
<p>&nbsp; &nbsp;&nbsp; &nbsp;如果你想检索出2005年9月下的所有订单，怎么办？简单的相等测试不行，因为它也要匹配月份中的天数。有几种解决办法，其中之一如下所示：</p>
<blockquote>
<p>输入：SELECT cust_id,order_num FROM orders WHERE Date(order_date) BETWEEN ‘2005-09-01’ AND ‘2005-09-30’;</p>
</blockquote>
<p>输出：</p>
<table>
<thead>
<tr>
<th align="left">cust_id</th>
<th align="left">order_num</th>
</tr>
</thead>
<tbody><tr>
<td align="left">10001</td>
<td align="left">20005</td>
</tr>
<tr>
<td align="left">10003</td>
<td align="left">20006</td>
</tr>
<tr>
<td align="left">10004</td>
<td align="left">20007</td>
</tr>
</tbody></table>
<blockquote>
<p>分析：其中，BETWEEN操作符用来把2005-09-01和2005-09-30定义为一个要匹配的日期范围。</p>
</blockquote>
<p>&nbsp; &nbsp;&nbsp; &nbsp;还有另外一种办法（一种不需要记住每个月中有多少天或不需要操心闰年2月的办法）：</p>
<blockquote>
<p>输入：SELECT custid,order_num FROM orders WHERE YEAR(order_date) = 2005 AND Month(order_date)=9;<br>分析：Year()是一个从日期（或日期时间）中返回年份的函数。类似，Month()从日期中返回月份。因此，WHERE Year(order_date) = 2005 AND Month(order_date) = 9检索出order_date为2005年9月的所有行。</p>
</blockquote>
<h3 id="11-2-3-数值处理函数"><a href="#11-2-3-数值处理函数" class="headerlink" title="11.2.3 数值处理函数"></a>11.2.3 数值处理函数</h3><p>&nbsp; &nbsp;&nbsp; &nbsp;数值处理函数仅处理数值数据。这些函数一般主要用于代数、三角或几何运算，因此没有串或日期—时间处理函数的使用那么频繁。<br>|     函数      | 说明          |<br>| :——-     | :——-     |<br>|   Abs()      |返回一个数的绝对值|<br>|   Cos()      |返回一个角度的余弦|<br>|   Exp()      |返回一个数的指数值|<br>|   Mod()      |返回除操作的余数|<br>|   Pi()       |返回圆周率|<br>|   Rand()     |返回一个随机数|<br>|   Sin()      |返回一个角度的正弦|<br>|   Sqrt()     |返回一个数的平方根|<br>|   Tan()      |返回一个角度的正切|</p>

      
    </div>
    <footer class="article-footer">
      <a data-url="http://example/2022/07/16/%E7%AC%AC11%E7%AB%A0%E4%BD%BF%E7%94%A8%E6%95%B0%E6%8D%AE%E5%A4%84%E7%90%86%E5%87%BD%E6%95%B0/" data-id="clemvoh7n000d7s7eg93x84cx" data-title="第11章使用数据处理函数" class="article-share-link">Share</a>
      
      
  <ul class="article-tag-list" itemprop="keywords"><li class="article-tag-list-item"><a class="article-tag-list-link" href="/tags/MySQL%E5%BF%85%E7%9F%A5%E5%BF%85%E4%BC%9A/" rel="tag">MySQL必知必会</a></li></ul>

    </footer>
  </div>
  
</article>


    <article id="post-第10章创建计算字段" class="h-entry article article-type-post" itemprop="blogPost" itemscope itemtype="https://schema.org/BlogPosting">
  <div class="article-meta">
    <a href="/2022/07/16/%E7%AC%AC10%E7%AB%A0%E5%88%9B%E5%BB%BA%E8%AE%A1%E7%AE%97%E5%AD%97%E6%AE%B5/" class="article-date">
  <time class="dt-published" datetime="2022-07-16T10:41:16.000Z" itemprop="datePublished">2022-07-16</time>
</a>
    
  </div>
  <div class="article-inner">
    
    
      <header class="article-header">
        
  
    <h1 itemprop="name">
      <a class="p-name article-title" href="/2022/07/16/%E7%AC%AC10%E7%AB%A0%E5%88%9B%E5%BB%BA%E8%AE%A1%E7%AE%97%E5%AD%97%E6%AE%B5/">第10章创建计算字段</a>
    </h1>
  

      </header>
    
    <div class="e-content article-entry" itemprop="articleBody">
      
        <h1 id="第10章：创建计算字段"><a href="#第10章：创建计算字段" class="headerlink" title="第10章：创建计算字段"></a><center>第10章：创建计算字段</center></h1><h2 id="10-1-计算字段"><a href="#10-1-计算字段" class="headerlink" title="10.1 计算字段"></a>10.1 计算字段</h2><p>&nbsp; &nbsp;&nbsp; &nbsp;与前面各章介绍过的列不同，计算字段并不实际存在于数据库表中。计算字段是运行时在SELECT语句内创建的。</p>
<pre><code>    字段（field）:基本上与列（column）的意思相同，经常互换使用，不过数据库列一般称为列，而术语字段通常用在计算字段的连接上。

    客户机与服务器的格式：可在SQL语句内完成的许多转换和格式工作都可以直接在客户机应用程序内完成。但一般来说，在数据库服务器上完成这些操作比在客户机中完成要快的多，因为DBMS是设计来快速有效地完成这种处理的。</code></pre>
<h2 id="10-2-拼接字段"><a href="#10-2-拼接字段" class="headerlink" title="10.2 拼接字段"></a>10.2 拼接字段</h2><pre><code>    拼接（concatenate）：将值联结到一起构成单个值。在MySQL的SELECT语句中，可使用COncat()函数来拼接两个列。

    MySQL的不同之处：多数DBMS使用+或||来实现拼接，MySQL则使用Concat()函数来实现。当把SQL语句转换成MySQL语句时一定要把这个区别铭记在心。</code></pre>
<blockquote>
<p>输入： SELECT Contcat(vend_name,’ (‘,vend_country,’)’) FROM vendors ORDER BY vend_name;</p>
</blockquote>
<p>输入：  </p>
<table>
<thead>
<tr>
<th align="left">Concat(vend_name,’ (‘,vend_country,’)’)</th>
</tr>
</thead>
<tbody><tr>
<td align="left">ACME (USA)</td>
</tr>
<tr>
<td align="left">Anvils R Us (USA)</td>
</tr>
<tr>
<td align="left">Furball Inc. (USA)</td>
</tr>
<tr>
<td align="left">Jet Set (England)</td>
</tr>
<tr>
<td align="left">Jouets Et Ours (France)</td>
</tr>
<tr>
<td align="left">LT Supplies (USA)</td>
</tr>
</tbody></table>
<blockquote>
<p>分析：Concat()拼接串，即把多个串连接起来形成一个比较长的串。Concat()需要一个或多个指定的串，各个串之间用逗号分隔。</p>
</blockquote>
<p>&nbsp; &nbsp;&nbsp; &nbsp;在第8章曾提到通过删除数据右侧多余的空格来整理数据，这可以使用MySQL的RTrim()函数来完成，如下所示:</p>
<blockquote>
<p>输入：SELECT Contcat(RTrim(vend_name),’ (‘,RTrim(vend_country),’)’) FROM vendors ORDER BY vend_name;<br>分析：RTrim()函数去掉右边的所有空格。通过使用RTrim(),各个列都进行了整理。</p>
</blockquote>
<pre><code>    Trim()函数:MySQL除了支持RTrim(),还有LTrim()去掉串左边的空格以及Trim去掉左右两边的空格。</code></pre>
<h4 id="使用别名"><a href="#使用别名" class="headerlink" title="使用别名"></a>使用别名</h4><p>&nbsp; &nbsp;&nbsp; &nbsp;如前所示，SELECT语句的拼接工作做得很好。但此新计算列没有名字，它只是一个值。如果仅在SQl查询工具中查看一下结果，这样没有什么不好。但是，一个未命名的列不能用于客户机应用中，因为客户机没有办法引用它。<br>&nbsp; &nbsp;&nbsp; &nbsp;别名（alias）是一个字段或值得替换名。别名用AS关键字赋予。</p>
<blockquote>
<p>输入：SELECT Contcat(RTrim(vend_name),’ (‘,RTrim(vend_country),’)’) AS vend_title FROM vendors ORDER BY vend_name;  </p>
</blockquote>
<p>输出：<br>| vend_title |<br>| :——- |<br>|ACME (USA)|<br>|Anvils R Us (USA)|<br>|Furball Inc. (USA)|<br>|Jet Set (England)|<br>|Jouets Et Ours (France)|<br>|LT Supplies (USA)|</p>
<blockquote>
<p>分析：SELECT语句本身与以前使用的相同。只不过这里的语句中计算字段之后跟了文本AS vend_title.它指示SQL创建一个包含指定计算的名为vend_title的计算字段。从输出中可以看到，结果与以前的相同，但现在列名为vend_title。</p>
</blockquote>
<pre><code>    别名还有其他用途：别名还有其他用途。常见的用途包括在实际的表列名中包含不符合规定的字符（如空格）时重新命名它，在原来的名字含或容易误解时扩充它，等等。

    导出列：别名有时也称为导出列（derived column），不管称为什么，它们所代表的的都是相同的东西。</code></pre>
<h2 id="10-3-执行算术计算"><a href="#10-3-执行算术计算" class="headerlink" title="10.3 执行算术计算"></a>10.3 执行算术计算</h2><p>&nbsp; &nbsp;&nbsp; &nbsp;计算字段的另一个用途就是对检索出的数据进行算术计算。如下汇总物品的价格（单价乘以订购数量）：</p>
<blockquote>
<p>输入： SELECT prod_id,quantity,item_price,quantity*item_price AS expanded_price FROm orderitems WHERE order_num=20005;</p>
</blockquote>
<p>输出：</p>
<table>
<thead>
<tr>
<th align="left">prod_id</th>
<th align="left">quantity</th>
<th align="left">item_price</th>
<th align="left">expanded_price</th>
</tr>
</thead>
<tbody><tr>
<td align="left">ANV01</td>
<td align="left">10</td>
<td align="left">5.99</td>
<td align="left">59.90</td>
</tr>
<tr>
<td align="left">ANV02</td>
<td align="left">3</td>
<td align="left">9.99</td>
<td align="left">29.97</td>
</tr>
<tr>
<td align="left">TNT2</td>
<td align="left">5</td>
<td align="left">10</td>
<td align="left">50.00</td>
</tr>
<tr>
<td align="left">FB</td>
<td align="left">1</td>
<td align="left">10</td>
<td align="left">10.00</td>
</tr>
</tbody></table>
<blockquote>
<p>分析：输出中显示的expanded_price列为一个计算字段，此计算为quantity*item_price。客户机应用现在可以使用这个新计算列，就像使用其他列一样。</p>
</blockquote>
<pre><code>    MySQL支持基本算术操作符（+、-、*、/）,此外，圆括号可用来区分有限顺序。

    如何测试计算：SELECT提供了测试和实验函数与计算的一个很好的办法。虽然SELECT通常用来从表中检索数据，但可以省略FROm子句一遍简单地访问和处理表达式。例如如，SELECT 3*2;将返回6，SELECT Trim(&#39;abc&#39;);将返回abc，而SELECT Now()利用Now()函数返回当前日期和时间。通过这些例子，可以明白如何根据需要使用SELECT进行试验</code></pre>

      
    </div>
    <footer class="article-footer">
      <a data-url="http://example/2022/07/16/%E7%AC%AC10%E7%AB%A0%E5%88%9B%E5%BB%BA%E8%AE%A1%E7%AE%97%E5%AD%97%E6%AE%B5/" data-id="clemvoh7l000c7s7eacuhbtp5" data-title="第10章创建计算字段" class="article-share-link">Share</a>
      
      
  <ul class="article-tag-list" itemprop="keywords"><li class="article-tag-list-item"><a class="article-tag-list-link" href="/tags/MySQL%E5%BF%85%E7%9F%A5%E5%BF%85%E4%BC%9A/" rel="tag">MySQL必知必会</a></li></ul>

    </footer>
  </div>
  
</article>


    <article id="post-第9章正则表达式进行搜索" class="h-entry article article-type-post" itemprop="blogPost" itemscope itemtype="https://schema.org/BlogPosting">
  <div class="article-meta">
    <a href="/2022/07/14/%E7%AC%AC9%E7%AB%A0%E6%AD%A3%E5%88%99%E8%A1%A8%E8%BE%BE%E5%BC%8F%E8%BF%9B%E8%A1%8C%E6%90%9C%E7%B4%A2/" class="article-date">
  <time class="dt-published" datetime="2022-07-14T12:25:29.000Z" itemprop="datePublished">2022-07-14</time>
</a>
    
  </div>
  <div class="article-inner">
    
    
      <header class="article-header">
        
  
    <h1 itemprop="name">
      <a class="p-name article-title" href="/2022/07/14/%E7%AC%AC9%E7%AB%A0%E6%AD%A3%E5%88%99%E8%A1%A8%E8%BE%BE%E5%BC%8F%E8%BF%9B%E8%A1%8C%E6%90%9C%E7%B4%A2/">第9章正则表达式进行搜索</a>
    </h1>
  

      </header>
    
    <div class="e-content article-entry" itemprop="articleBody">
      
        <h1 id="第9章：用正则表达式进行搜索"><a href="#第9章：用正则表达式进行搜索" class="headerlink" title="第9章：用正则表达式进行搜索"></a><center>第9章：用正则表达式进行搜索</center></h1><h2 id="9-1-正则表达式介绍"><a href="#9-1-正则表达式介绍" class="headerlink" title="9.1 正则表达式介绍"></a>9.1 正则表达式介绍</h2><p>&nbsp; &nbsp;&nbsp; &nbsp;前两张中的过滤例子允许用匹配、比较和通配符操作符寻找数据。对基本的过滤（或者甚至是某些不那么基本的过滤），这样就足够了。但随着过滤条件的复杂性的增加，WHERE子句本身的复杂性也有必要增加。<br>&nbsp; &nbsp;&nbsp; &nbsp;这就是正则表达式变得有用的地方。正则表达式是用来匹配文本的特殊的串（字符集合）。如果你想从一个表达式中提取电话号码，可以使用正则表达式。如果你需要查找名字中间有数字的所有文件，可以使用正则表达式。如果你想在一个文本块中找到所有重复的单词，可以使用一个正则表达式。如果你想替换一个页面中的所有URL为这些URL的实际HTML链接，也可以使用一个正则表达式（对于最后这个例子，或者是两个正则表达式）。<br>&nbsp; &nbsp;&nbsp; &nbsp;所有种类的程序设计语言、文本编辑器、操作系统等都支持正则表达式。<br>&nbsp; &nbsp;&nbsp; &nbsp;正则表达式用正则表达式语言来建立，正则表达式语言是用来完成刚讨论的所有工作以及更多工作的一种特殊语言。与任意语言一样，正则表达式具有你必须学习的特殊的语法和指令。  </p>
<h2 id="9-2-使用MySQL正则表达式"><a href="#9-2-使用MySQL正则表达式" class="headerlink" title="9.2 使用MySQL正则表达式"></a>9.2 使用MySQL正则表达式</h2><p>&nbsp; &nbsp;&nbsp; &nbsp;正则表达式的作用是匹配文本，将一个模式（正则表达式）与一个文本串进行比较。MySQL用WHERE子句对正则表达式提供了初步的支持，允许你指定正则表达式过滤SELECT检索出的数据。  </p>
<pre><code>    仅为正则表达式的一个子集：如果你熟悉正则表达式，需要注意：MySQL仅支持多数正则表达式实现的一个很小的子集。  </code></pre>
<h3 id="9-2-1-基本字符匹配"><a href="#9-2-1-基本字符匹配" class="headerlink" title="9.2.1 基本字符匹配"></a>9.2.1 基本字符匹配</h3><p>&nbsp; &nbsp;&nbsp; &nbsp;下面语句检索列prod_name包含文本1000的所有行：  </p>
<blockquote>
<p>输入：SELECt prod_name FROM products WHERE prod_name REGEXP ‘1000’ ORDER BY prod_name;<br>分析：出关键字LIKE被REGEXP替代外，这条语句看上去非常像使用LIKE的语句。它告诉MySQL：REGEXP后所跟的东西作为正则表达式（与文字正文1000匹配的一个正则表达式）处理。</p>
</blockquote>
<p>&nbsp; &nbsp;&nbsp; &nbsp;再来看下面的例子：  </p>
<blockquote>
<p>输入： SELECT prod_name FROM products WHERE prod_name REGEXP ‘.000’ ORDER BY prod_name;  </p>
</blockquote>
<p>输出： </p>
<table>
<thead>
<tr>
<th align="center">prod_name</th>
</tr>
</thead>
<tbody><tr>
<td align="center">JetPack 1000</td>
</tr>
<tr>
<td align="center">JetPack 2000</td>
</tr>
</tbody></table>
<blockquote>
<p>分析： 这里使用了正则表达式.000。其中.是正则表达式语言中一个特殊的字符。它表示匹配任意一个字符，因此，1000和2000都匹配且返回。  </p>
</blockquote>
<pre><code>    LIKE和REGEXP：在LIKE和REGEXP之间有一个重要的差别。请看一下两条语句：  

    SELECT prod_name
    FROM products
    WHERE prod_name LIKE &#39;1000&#39;
    ORDER BY prod_name;

    SELECt prod_name
    FROM products
    WHERE prod_name REGEXP &#39;1000&#39;
    ORDER BY prod_name;

    如果执行上述两条语，会发现第一条语句不返回数据，而第二条语句返回一行。为什么？  

    正如第8章所述，LIKE匹配整个列。如果被匹配的文本在列值中出现，LIKE将不会找到它，相应的行也不会被返回（除非使用通配符）。而REGEXP在列值内进行匹配，如果被匹配的文本在列值中出现，REGEXP在列值内进行匹配，如果被匹配的文本在列值中出现，REGEXP将会找到它，相应的行将被返回。这是一个非常重要的差别。那么，REGEXP能不能用来匹配整个列值（从而起与LIKE相同的作用）？答案是肯定的，用^和$定位符（anchor）即可。

    匹配不区分大小写 MySQL中的正则表达式匹配不区分大小写。为区分大小写，可使用BINARY关键字，如WHERE prod_name REGEXP BINARY &#39;JetPack .000&#39;。</code></pre>
<h3 id="9-2-2-进行OR匹配"><a href="#9-2-2-进行OR匹配" class="headerlink" title="9.2.2 进行OR匹配"></a>9.2.2 进行OR匹配</h3><p>&nbsp; &nbsp;&nbsp; &nbsp;为搜索两个串之一（或者为这个串，或者为另一个串），使用|，如下所示：  </p>
<blockquote>
<p>输入：SELECT prod_name FROm products WHERE prod_Name REGEXP ‘1000|2000’ ORDER BY prod_name;  </p>
</blockquote>
<p>输出：  </p>
<table>
<thead>
<tr>
<th align="center">prod_name</th>
</tr>
</thead>
<tbody><tr>
<td align="center">JetPack 1000</td>
</tr>
<tr>
<td align="center">JetPack 2000</td>
</tr>
</tbody></table>
<blockquote>
<p>分析：语句中使用了正则表达式1000|2000。|为正则表达式的OR操作符。它表示匹配其中之一，因此1000和2000都匹配并返回。  </p>
</blockquote>
<p>&nbsp; &nbsp;&nbsp; &nbsp;使用|从功能上类似于在SELECT语句中使用OR语句，多个OR条件可并入单个正则表达式。  </p>
<pre><code>    两个以上的OR条件：可以给出两个以上的OR条件。例如，&#39;1000 | 2000 | 3000&#39;将匹配1000或2000或3000。</code></pre>
<h3 id="9-2-3-匹配几个字符之一"><a href="#9-2-3-匹配几个字符之一" class="headerlink" title="9.2.3 匹配几个字符之一"></a>9.2.3 匹配几个字符之一</h3><p>&nbsp; &nbsp;&nbsp; &nbsp;匹配任何单一字符。但是如果你只想匹配特定的字符，怎么办？可通过指定一组用[和]括起来的字符来完成，如下所示：</p>
<blockquote>
<p>输入：SELECT prod_name FROm products WHERE prod_name REGEXP ‘[123] Ton’ ORDER BY prod_name;  </p>
</blockquote>
<p>输出：</p>
<table>
<thead>
<tr>
<th align="center">prod_name</th>
</tr>
</thead>
<tbody><tr>
<td align="center">1 ton anvil</td>
</tr>
<tr>
<td align="center">2 ton anvil</td>
</tr>
</tbody></table>
<blockquote>
<p>分析：这里，使用了正则表达式[123] Ton。[123]定义一组字符，它的意思式匹配1或2或3，因此，1 ton和2 ton都匹配且返回(没有3 ton)。  </p>
</blockquote>
<p>&nbsp; &nbsp;&nbsp; &nbsp;正如所见,[]是另一种形式的OR语句。事实上，正则表达式[123]Ton为[1|2|3]Ton的缩写，也可以使用后者。但是，需要用[]来定义OR语句查找什么。为更好地理解这一点，请看下面地的例子：  </p>
<blockquote>
<p>输入：SELECT prod_name FROM products WHERE prod_name REGEXP ‘1|2|3 Ton’ ORDER BY prod_name;  </p>
</blockquote>
<p>输出： </p>
<table>
<thead>
<tr>
<th align="center">prod_name</th>
</tr>
</thead>
<tbody><tr>
<td align="center">1 ton anvil</td>
</tr>
<tr>
<td align="center">2 ton anvil</td>
</tr>
<tr>
<td align="center">JetPack 1000</td>
</tr>
<tr>
<td align="center">JetPack 2000</td>
</tr>
<tr>
<td align="center">TNT(1 stick)</td>
</tr>
</tbody></table>
<blockquote>
<p>分析：这并不是期望的输出。两个要求的行被检索出来，但还检索出了另外3行。之所以这样是由于MySQL假定你的意思是’1’或’2’或’3 ton’。除非把字符|括在一个集合中，否则它将应用于整个串。<br>  字符串集合也可以被否定，即，它们将匹配除指定字符外的任何东西。为否定一个字符集，在集合的开始处放置一个^即可。因此，尽管[123]匹配字符1、2或3，但[^123]却匹配除这些字符外的任何东西。</p>
</blockquote>
<h3 id="9-2-4-匹配范围"><a href="#9-2-4-匹配范围" class="headerlink" title="9.2.4 匹配范围"></a>9.2.4 匹配范围</h3><p>&nbsp; &nbsp;&nbsp; &nbsp;集合可用来定义要匹配的一个或多个字符。例如，下面的集合将匹配数字0到9：[0123456789]<br>&nbsp; &nbsp;&nbsp; &nbsp;为简化这种类型的集合，可使用-来定义一个范围。下面的式子功能上等同于上述数字列表：[0-9]<br>&nbsp; &nbsp;&nbsp; &nbsp;范围不限于完整的集合，[1-3]和[6-9]也是合法的范围。此外，范围不一定只是数值的，[a-z]匹配任意字母字符。例如：  </p>
<blockquote>
<p>输入：SELECT prod_name FROM products WHERE prod_name REGEXP ‘[1-5] Ton’ ORDER BY prod_name;  </p>
</blockquote>
<p>输出：  </p>
<table>
<thead>
<tr>
<th align="center">prod_name</th>
</tr>
</thead>
<tbody><tr>
<td align="center">.5 ton anvil</td>
</tr>
<tr>
<td align="center">1 ton anvil</td>
</tr>
<tr>
<td align="center">2 ton anvil</td>
</tr>
</tbody></table>
<blockquote>
<p>分析：这里使用正则表达式[1-5] Ton。[1-5]定义了一个范围，这个范围表达式意思是匹配1到5，因此返回3个匹配行。由于5 ton匹配，所以返回.5 ton。</p>
</blockquote>
<h3 id="9-2-5-匹配特殊字符"><a href="#9-2-5-匹配特殊字符" class="headerlink" title="9.2.5 匹配特殊字符"></a>9.2.5 匹配特殊字符</h3><p>&nbsp; &nbsp;&nbsp; &nbsp;正则表达式语言具有特定含义的特殊字符构成。我们已经看到.、[]、|和-等，还有一些字符。请问，如果你需要匹配这些字符，应该怎么办呢？例如，如果要找出包含.字符的值，怎样搜索？请看下面的例子：  </p>
<blockquote>
<p>输入：SELECT vend_name FROM vendors WHERE vend_name REGEXP ‘.’ ORDER BY vend_name;  </p>
</blockquote>
<p>输出:</p>
<table>
<thead>
<tr>
<th align="center">vend_name</th>
</tr>
</thead>
<tbody><tr>
<td align="center">ACME</td>
</tr>
<tr>
<td align="center">ANVIL R Us</td>
</tr>
<tr>
<td align="center">Furball Inc.</td>
</tr>
<tr>
<td align="center">Jet Set</td>
</tr>
<tr>
<td align="center">Jouets Et Ours</td>
</tr>
<tr>
<td align="center">LT Supplies</td>
</tr>
</tbody></table>
<blockquote>
<p>分析：这并不是期望的输出，.匹配任意字符，因此每个行都被检索出来。  </p>
</blockquote>
<pre><code>    为了匹配特殊字符，必须用\\为前导。\\-表示查找-，用\\.表示查找.。</code></pre>
<blockquote>
<p>输入:SELECT vend_name FROM vendors WHERE vend_name REGEXP ‘\.’ ORDER BY vend_name;</p>
</blockquote>
<p>输出：  </p>
<table>
<thead>
<tr>
<th align="center">vend_name</th>
</tr>
</thead>
<tbody><tr>
<td align="center">Furball Inc.</td>
</tr>
</tbody></table>
<blockquote>
<p>分析：这才是期望的输出。\.匹配.,所以只检索出一行。这种处理就是所谓的转移（escaping），正则表达式内具有特殊意义的所有字符都必须以这种方式转义。这包括.、|、[]以及迄今为止使用过的其他特殊字符。  </p>
</blockquote>
<pre><code>    \\也用来引用元字符（具有特殊含义的字符），如表所示。</code></pre>
<p>空白元字符：<br>| 元字符 | 说明 |<br>| :—-:| :—-:|<br>| \f   |  换页 |<br>| \n   |  换行 |<br>| \r   |  回车 |<br>| \t   |  制表 |<br>| \v   | 纵向制表 |</p>
<pre><code>    匹配\：为了匹配反斜杠（\）字符本身，需要使用\\\。
    \或\\?：多数正则表达式实现使用单个反斜杠转义特殊字符，一边能使用这些字符本身。但MySQL要求两个反斜杠（MySQL自己解析一个，正则表达式库解释另外一个）。</code></pre>
<h3 id="9-2-6-匹配字符类"><a href="#9-2-6-匹配字符类" class="headerlink" title="9.2.6 匹配字符类"></a>9.2.6 匹配字符类</h3><p>&nbsp; &nbsp;&nbsp; &nbsp;存在找出你自己经常使用的数字、所有字母字符或所有数字字母字符等的匹配。可以使用预定义的字符集，称为字符类（character class）。<br>|     类    |             说明           |<br>| :——-: |    :—-                |<br>| [:alnum:] |   任意字母和数字（同[a-zA-Z0-9]） |<br>| [:alpha:] |   任意字符（同[a-zA-Z]）          |<br>| [:blank:] |   空格和制表（同[\t]）           |<br>| [:cntrl:] |   ASCII控制字符（ASCII 0到31和127）|<br>| [:digit:] |   任意数字（同[0-9]）              |<br>| [:graph:] |   与[:print:]相同，但不包括空格     |<br>| [:lower:] |   任意小写字母（同[a-z]）           |<br>| [:print:] |   任意可打印字符                  |<br>| [:punct:] |   既不在[:alnum:]又不在[:cntrl:]中的任意字符   |<br>| [:space:] |   包括空格在内的任意空白字符（同[\f\n\r\t\v]） |<br>| [:upper:] |   任意大写字母（同[A-Z]）           |<br>| [:xdigit:] |   任意十六进制数字（同[a-fA-F0-9]）  |</p>
<h3 id="9-2-7-匹配多个实例"><a href="#9-2-7-匹配多个实例" class="headerlink" title="9.2.7 匹配多个实例"></a>9.2.7 匹配多个实例</h3><p>&nbsp; &nbsp;&nbsp; &nbsp;目前为止使用的所有正则表达式都试图匹配单次出现。如果出现一个匹配，该行被检索出来，如果不存在，检索不出任何行。但有时需要对匹配的数目进行更强的控制。例如，你可能需要寻找所有的数，不管书中包含多少数字，或者你可能想寻找一个单词并且还能够适应一个尾随s（如果存在），等等。<br>&nbsp; &nbsp;&nbsp; &nbsp;者可以用正则表达式重复元字符来完成。<br>重复元字符：<br>| 元字符 | 说明          |<br>| :—-:| :————-|<br>|   *   |  0个或多个匹配 |<br>|   +   |  1个或多个匹配（等于{1,}） |<br>|   ?   |  0个或1个匹配（等于{0，1}） |<br>|  {n}  |  指定数目的匹配 |<br>| {n,}  | 不少于指定数目的匹配 |<br>| {n,m} | 匹配数目的范围（m不超过255） |</p>
<p>下面举几个例子。</p>
<blockquote>
<p>输入：SELECT prod_name FROM products WHERE prod-Name REGEXP ‘\([0-9] sticks?\)’;</p>
</blockquote>
<p>输出：  </p>
<table>
<thead>
<tr>
<th align="center">prod_name</th>
</tr>
</thead>
<tbody><tr>
<td align="center">TNT（1 stick）</td>
</tr>
<tr>
<td align="center">TNT（5 sticks）</td>
</tr>
</tbody></table>
<blockquote>
<p>分析：正则表达式\([0-9] sticks\)需要解说一下。\(匹配(，[0-9]匹配任意数字（这个例子中为1和5），sticks？匹配stick和sticks（s后的？使s可选，因为？匹配它前面的任何字符的0次或1次出现），\)匹配)。没有？，匹配stick和sticks会非常困难。  </p>
</blockquote>
<p>以下例子匹配连在一起的4位数字：  </p>
<blockquote>
<p>输入：SELECT prod_name FROM products WHERE prod_name REGEXP ‘[[:digit:]]{4}’ ORDER BY prod_name;  </p>
</blockquote>
<p>输出：  </p>
<table>
<thead>
<tr>
<th align="center">prod_name</th>
</tr>
</thead>
<tbody><tr>
<td align="center">JetPack 1000</td>
</tr>
<tr>
<td align="center">JetPack 2000</td>
</tr>
</tbody></table>
<blockquote>
<p>分析：如前所述，[:digit:]匹配任意数字，因为它为数字的一个集合。{4}确切地要求它前面地字符（任意数字）出现4次，所以[[:digit:]]{4}匹配连在一起地任意4位数字。  </p>
</blockquote>
<p>&nbsp; &nbsp;&nbsp; &nbsp;需要注意的是，在使用正则表达式时，编写某个特殊的表达式几乎总有不止一种方法。上面的例子也可以如下编写：  </p>
<blockquote>
<p>输入：SELECT prod_name FROM products WHERE prod_name REGEXP ‘[0-9][0-9][0-9][0-9]’ ORDER BY prod_name;  </p>
</blockquote>
<h3 id="9-2-8-定位符"><a href="#9-2-8-定位符" class="headerlink" title="9.2.8 定位符"></a>9.2.8 定位符</h3><p>&nbsp; &nbsp;&nbsp; &nbsp;目前为止的所有例子都是匹配一个传中任意的文本。为了匹配特定位置的文本，需要使用下表列出的定位符。<br>定位元字符<br>| 元字符   | 说明       |<br>| :—-:  | :——— |<br>|    ^    |  文本的开始 |<br>|    $    |  文本的末尾 |<br>| [[:&lt;:]] |    词的开始 |<br>| [[:&gt;:]] |    词的末尾 |</p>
<p>&nbsp; &nbsp;&nbsp; &nbsp;例如，如果你想找出以一个数（包括以小数点开始的数）开始的所有产品，怎么办？简单搜索[0-9\.]（或[[:digit:]\.]）不行，因为它将文本内任意位置查找匹配。解决办法是使用^定位符，如下所示：  </p>
<blockquote>
<p>输入： SELECT prod_name FROM products WHERE prod_name REGEXP ‘^[0-9\.]’  ORDER BY prod_name;</p>
</blockquote>
<p>输出：  </p>
<table>
<thead>
<tr>
<th align="center">prod_name</th>
</tr>
</thead>
<tbody><tr>
<td align="center">.5 ton anvil</td>
</tr>
<tr>
<td align="center">1 ton anvil</td>
</tr>
<tr>
<td align="center">2 ton anvil</td>
</tr>
</tbody></table>
<blockquote>
<p>分析：匹配串的开始。因此，^[0-9\.]只在.或任意数字为串中第一个字符时才匹配它们。没有^,则还要多检索4个别的行（那些中间有数字的行）。</p>
</blockquote>
<pre><code>    ^的双重用途：^有两种用法。在集合中（用[和]定义），用它来否定该集合，否则，用来指串的开始处。  

    使REGEXP起类似LIKE的作用 本章前面说过，LIKE和REGEXP的不同在于，LIKE匹配整个串而REGEXP匹配子串，利用定位符，通过用^开始每个表达式，用$结束每个表达式，可以使REGEXP的作用的作用与LIKE一样。

    简单的正则表达式测试：
    可以在不使用数据库表的情况下用
    SELECT来测试正则表达式。REGEXP检查总是返回0（没有匹配）
    或1（匹配）。可以用带文字串的REGEXP来测试表达式，并试
    验它们。相应的语法如下：

    SELECt &#39;hello&#39; REGEXP &#39;[0-9]&#39;;

    这个例子显然将返回0（因为文本hello中没有数字）。</code></pre>

      
    </div>
    <footer class="article-footer">
      <a data-url="http://example/2022/07/14/%E7%AC%AC9%E7%AB%A0%E6%AD%A3%E5%88%99%E8%A1%A8%E8%BE%BE%E5%BC%8F%E8%BF%9B%E8%A1%8C%E6%90%9C%E7%B4%A2/" data-id="clemvoh8400197s7e7lj1g3yh" data-title="第9章正则表达式进行搜索" class="article-share-link">Share</a>
      
      
  <ul class="article-tag-list" itemprop="keywords"><li class="article-tag-list-item"><a class="article-tag-list-link" href="/tags/MySQL%E5%BF%85%E7%9F%A5%E5%BF%85%E4%BC%9A/" rel="tag">MySQL必知必会</a></li></ul>

    </footer>
  </div>
  
</article>


  <nav id="page-nav">
    
    <span class="page-number current">1</span><a class="page-number" href="/page/2/">2</a><a class="page-number" href="/page/3/">3</a><a class="extend next" rel="next" href="/page/2/">Next &raquo;</a>
  </nav>

</section>
        
          <aside id="sidebar">
  
    
  <div class="widget-wrap">
    <h3 class="widget-title">Tags</h3>
    <div class="widget">
      <ul class="tag-list" itemprop="keywords"><li class="tag-list-item"><a class="tag-list-link" href="/tags/MyBatis%E4%BB%8E%E5%85%A5%E9%97%A8%E5%88%B0%E7%B2%BE%E9%80%9A/" rel="tag">MyBatis从入门到精通</a></li><li class="tag-list-item"><a class="tag-list-link" href="/tags/MySQL%E5%BF%85%E7%9F%A5%E5%BF%85%E4%BC%9A/" rel="tag">MySQL必知必会</a></li><li class="tag-list-item"><a class="tag-list-link" href="/tags/%E7%9C%8B%E6%96%87%E7%8C%AE/" rel="tag">看文献</a></li><li class="tag-list-item"><a class="tag-list-link" href="/tags/%E7%AE%97%E6%B3%95/" rel="tag">算法</a></li></ul>
    </div>
  </div>


  <div class="widget-wrap">
    <h3 class="widget-title">Tag Cloud</h3>
    <div class="widget tagcloud">
      <a href="/tags/MyBatis%E4%BB%8E%E5%85%A5%E9%97%A8%E5%88%B0%E7%B2%BE%E9%80%9A/" style="font-size: 10px;">MyBatis从入门到精通</a> <a href="/tags/MySQL%E5%BF%85%E7%9F%A5%E5%BF%85%E4%BC%9A/" style="font-size: 20px;">MySQL必知必会</a> <a href="/tags/%E7%9C%8B%E6%96%87%E7%8C%AE/" style="font-size: 16.67px;">看文献</a> <a href="/tags/%E7%AE%97%E6%B3%95/" style="font-size: 13.33px;">算法</a>
    </div>
  </div>

  
  <div class="widget-wrap">
    <h3 class="widget-title">Archives</h3>
    <div class="widget">
      <ul class="archive-list"><li class="archive-list-item"><a class="archive-list-link" href="/archives/2023/02/">February 2023</a></li><li class="archive-list-item"><a class="archive-list-link" href="/archives/2022/10/">October 2022</a></li><li class="archive-list-item"><a class="archive-list-link" href="/archives/2022/09/">September 2022</a></li><li class="archive-list-item"><a class="archive-list-link" href="/archives/2022/07/">July 2022</a></li><li class="archive-list-item"><a class="archive-list-link" href="/archives/2022/06/">June 2022</a></li><li class="archive-list-item"><a class="archive-list-link" href="/archives/2022/03/">March 2022</a></li><li class="archive-list-item"><a class="archive-list-link" href="/archives/2022/02/">February 2022</a></li><li class="archive-list-item"><a class="archive-list-link" href="/archives/2021/03/">March 2021</a></li><li class="archive-list-item"><a class="archive-list-link" href="/archives/2021/02/">February 2021</a></li></ul>
    </div>
  </div>


  <div class="widget-wrap">
    <h3 class="widget-title">Recent Posts</h3>
    <div class="widget">
      <ul>
        
          <li>
            <a href="/2023/02/06/MyBatis%E4%BB%8E%E5%85%A5%E9%97%A8%E5%88%B0%E7%B2%BE%E9%80%9A%E7%AC%AC1%E7%AB%A0/">第1章：MyBatis入门</a>
          </li>
        
          <li>
            <a href="/2022/10/03/%E5%9F%BA%E4%BA%8E%E7%AC%94%E7%94%BB%E8%AF%86%E5%88%AB%E7%9A%84%E6%89%8B%E5%86%99%E6%B1%89%E5%AD%97%E7%BE%8E%E5%8C%96%E6%96%B9%E6%B3%95%E7%A0%94%E7%A9%B6%E5%8D%8E%E7%A7%912020/">基于笔画识别的手写汉字美化方法研究华科2020</a>
          </li>
        
          <li>
            <a href="/2022/09/29/%E5%9F%BA%E4%BA%8E-%E7%9B%B8%E4%BC%BC%E5%BA%A6-%E7%9A%84%E6%89%8B%E5%86%99%E6%B1%89%E5%AD%97%E8%AF%86%E5%88%AB%E4%B8%8E%E7%BE%8E%E6%84%9F%E8%AF%84%E5%88%86%E5%8C%97%E9%82%AE2019/">基于_相似度_的手写汉字识别与美感评分北邮2019</a>
          </li>
        
          <li>
            <a href="/2022/09/29/%E7%9C%8B%E6%96%87%E7%8C%AE%E5%BA%94%E8%AF%A5%E5%81%9A%E4%BB%80%E4%B9%88/">看文献应该做什么</a>
          </li>
        
          <li>
            <a href="/2022/09/11/morris%E9%81%8D%E5%8E%86/">morris遍历</a>
          </li>
        
      </ul>
    </div>
  </div>

  
</aside>
        
      </div>
      <footer id="footer">
  
  <div class="outer">
    <div id="footer-info" class="inner">
      
      &copy; 2023 mawan<br>
      Powered by <a href="https://hexo.io/" target="_blank">Hexo</a>
    </div>
  </div>
</footer>

    </div>
    <nav id="mobile-nav">
  
    <a href="/" class="mobile-nav-link">Home</a>
  
    <a href="/archives" class="mobile-nav-link">Archives</a>
  
</nav>
    

<script src="/js/jquery-3.4.1.min.js"></script>


<script src="/fancybox/jquery.fancybox.min.js"></script>


<script src="/js/script.js"></script>


  </div>
</body>
</html>