【MyBatis系列7】原来SqlSession只是个甩手掌柜,真正干活的却是Executor等四大对象

   日期:2020-09-28     浏览:91    评论:0    
核心提示:Execute前言总结前言Execute总结Execute请关注我,和孤狼一起学习进步。

Executor原理分析

  • 前言
  • MyBatis架构分层
  • Executor
    • BaseExecutor
      • SimpleExecutor
      • ReuseExecutor
      • BatchExecutor
        • 三种常用批量插入方式
          • 直接代码循环
          • 利用MyBatis中批量标签foreach处理
          • BatchExecutor插入
      • ClosedExecutor
    • CachingExecutor
  • StatementHandler
    • BaseStatementHandler
      • SimpleStatementHandler
      • PreparedStatementHandler
      • CallableStatementHandler
    • RoutingStatementHandler
  • ParameterHandler
  • ResultSetHandler
  • 总结

前言

上一篇我们从整体上讲述了MyBatis的整个工作流程,也知道了我们在执行Sql之前,需要先获取SqlSession对象,但是我们也提到了SqlSession下面还有四大对象,所以SqlSession只是个甩手掌柜,真正干活的却是Executor等四大对象:Executor,StatementHandler,ParameterHandler,ResultSetHandler。那么本篇文章就让我们来仔细分析一下这四大对象。

MyBatis架构分层

首先我们先来建立一个MyBatis的整体认知,下面就是MyBatis的一个整体分层架构图:

  • 接口层
    接口层的核心对象就是SqlSession,SqlSession是应用和MyBatis打交道的桥梁,SqlSession上定义了一系列数据库操作方法,然后在收到请求的时候再去调用核心处理层模块来完成具体操作。
  • 核心处理层
    真正和数据库相关操作都是在核心层完成的,核心层主要做了以下4件事:
    1、将接口中传入的参数解析并且映射成为JDBC
    2、解析xml文件中的SQL语句,包括参数的插入和动态SQL的生成
    3、执行SQL语句
    4、处理结果集,并且映射成Java对象
    PS:插件也属于核心层,因为插件就是拦截核心处理层对象
  • 基础支持层
    基础支持层就是封装一些底层操作用来处理核心层的功能

我们今天要讲解的四大天王对象就是核心处理层的四大对象,接下来就让我们逐一进行分析

Executor

Executor就是真正用来执行Sql语句的对象,我们调用SqlSession中的方法,最终实际上都是通过Executor来完成的。我们先来看一下Executor的类图关系:

这里面其实用到了模板方法模式。顶层接口Executor定义了一系列规范,而在抽象类BaseExecutor中将一些固定不变的方法进行了封装,并定义了一下抽象方法待子类实现。

BaseExecutor

BaseExecutor是一个抽象类,除了下面的四个方法是抽象方法,其余所有方法都是一些如获取缓存,事务提交,获取事务等公共操作,所以就直接被实现了。
如下图所示,红框之内的四个方法就是抽象方法:

  • doFlushStatements():刷新Statement对象
  • doQuery():执行查询语句并返回List
  • doQueryCursor():执行查询语句并返回Cursor对象
  • doUpdate():执行更新操作

我们在讲述MyBatis核心配置的文章中提到,配置文件中的setting标签内有一个属性defaultExecutorType,有三种执行类型:SIMPLEREUSEBATCH。如果不配置则默认就是SIMPLE。这三种类型就是对应了BaseExecutor的三个子类:
SimpleExecutorReuseExecutorBatchExecutor

SimpleExecutor

SimpleExecutor是最简单的一个执行器,没有任何特殊的,就是实现了BaseExecutor中的四个抽象方法。
我们来看其中一个doQuery()方法,可以看到没有任何特殊逻辑,就是很常规的流程操作:

其中初始化Statement对象我们为了对比,也进去看一下:

我们再来看一个doFlushStatements()方法

这里什么都没做,直接返回了一个空List

ReuseExecutor

ReuseExecutor相比较于SimpleExecutor做了一点优化,那就是将Statement对象进行了缓存处理,不会每次都创建Statement对象,这样做的话减少了SQL预编译和创建对象的开销。

ReuseExecutor中的查询和更新方法和SimpleExecutor完全一样,而其中的差别就在于创建Statement对象上,我们进去ReuseExecutor的prepareStatement方法:

我们可以看到区别就是多了一个从缓存中获取Statement对象的逻辑,用来达到复用Statement对象的目的。
其中getStatement是通过ReuseExecutor内的一个HashMap属性来获取Statement对象,其中key值就是我们执行的sql语句:

我们再来看看doFlushStatements方法,可以看到,这里面会遍历map将Statement关闭,并清空map,看到这里,大家应该就明白了为什么SimpleExecutor内这个方法直接返回的是空,因为SimpleExecutor方法没有Statement需要关闭。

PS:doFlushStatements方法在BaseExecutor中的commit(),rollback(),close()方法中会被调用(即:事务提交,事务回滚,事务关闭三个方法)。

BatchExecutor

BatchExecutor从名字上也可以看出来,这是一个支持批量操作的执行器。

如果说大家都用过jdbc就知道,jdbc是支持批量操作的,有一个executeBatch()方法用来执行批量操作,但是有一个前提就是执行批量操作的sql除了参数不同,其他都应该是相同的(关于这一点,下面我们会举例来说明)。
需要注意的是,批量操作只支持insert,update,delete语句,select语句是不支持的,所以BatchExecutor内的doQuery方法和其他执行器并没有很大不同,区别就是在查询之前会先调用flushStatements(),我们不做过多讨论,主要看一下doUpdate方法:

下面是一些成员属性:

这个方法的逻辑就是判断相同模式的sql会共用同一个Statement对象,然后缓存到list内,需要注意的是它只会和前一个进行比对,也就是说假如你有相同模式的2条sql,但是你中间先执行了一条其他sql,那么就会产生3个Statement对象,从而无法共用了。

PS:上面的doUpdate中返回了一个数:BATCH_UPDATE_RETURN_VALUE,这个数其实没有什么特别含义,只需要返回一个没有意义的负数就可以,表示代码不知道执行成功多少条。比如说直接返回-1,或者干脆直接返回Integer.MIN_VALUE都是没有问题的,全凭个人喜好了。

接下来我们再看看doFlushStatements()方法:

这个方法就是去遍历上面存储好的Statement,依次调用Statement中的executeBatch方法。

三种常用批量插入方式

讲到这里,我们就干脆扯开一点,聊一聊MyBatis编程中常用的三种批量操作方式。

直接代码循环

这是最简单的一种,但也是效率最低的一种,如下简单示例:

UserAddressMapper userAddressMapper = session.getMapper(UserAddressMapper.class);
for (UserAddress userAddress : userAddressList){ 
     userAddressMapper.insert(userAddress);
 }

这种方式会把大部分时间消耗在网络连接通信上,一般不建议使用。

利用MyBatis中批量标签foreach处理

新建测试类:

package com.lonelyWolf.mybatis.batch;

import com.lonelyWolf.mybatis.mapper.UserAddressMapper;
import com.lonelyWolf.mybatis.model.UserAddress;
import org.apache.ibatis.io.Resources;
import org.apache.ibatis.session.SqlSession;
import org.apache.ibatis.session.SqlSessionFactory;
import org.apache.ibatis.session.SqlSessionFactoryBuilder;
import java.io.IOException;
import java.io.InputStream;
import java.util.ArrayList;
import java.util.List;

public class TestBatchInsert { 
    public static void main(String[] args) throws IOException { 
        String resource = "mybatis-config.xml";
        //读取mybatis-config配置文件
        InputStream inputStream = Resources.getResourceAsStream(resource);
        //创建SqlSessionFactory对象
        SqlSessionFactory sqlSessionFactory = new SqlSessionFactoryBuilder().build(inputStream);
        //创建SqlSession对象
        SqlSession session = sqlSessionFactory.openSession();
        try { 
            List<UserAddress> userAddressList = new ArrayList<>();
            
            UserAddress userAddr = new UserAddress();
            userAddr.setAddress("广东深圳");
            userAddressList.add(userAddr);
            
            UserAddress userAddr2 = new UserAddress();
            userAddr2.setAddress("广东广州");
            userAddressList.add(userAddr2);

            UserAddressMapper userAddressMapper = session.getMapper(UserAddressMapper.class);

            userAddressMapper.batchInsert(userAddressList);
            session.commit();
        }finally { 
            session.close();
        }
    }
}

Mapper接口新增如下方法:

int batchInsert(List<UserAddress> userAddresses);

XML文件如下:

 <insert id="batchInsert">
        insert into lw_user_address (address) values
       <foreach collection="list" item="item" separator=",">
           (#{item.address})
       </foreach>
    </insert>

执行之后输出如下语句:

顺便我们介绍一下foreach标签的用法:

  • collection
    表示待循环的对象。当参数为List时,默认"list",参数为数组时,默认"array"。但是当我们在Mapper接口中使用@Param(“xxx”)时,默认的list,array将会失效,必须使用我们自己设置的参数名。 还有一种特殊情况就是假如集合里面有集合或者对象里面有集合,那么可以使用collection=“xxx.属性名”。
  • item
    表示当前循环中的元素。
  • open/close,表示循环体开始和结束位置插入的符号,一般成对出现,in语句使用较多,如:
<select id="test">
       select * from xxx where id in 
     <foreach collection="list" item="item" open="(" close=")" separator=",">
         #{item.xxx}
     </foreach>
   </select>
  • separator:表示每个循环之后的分割符号,可参考上面的例子
  • index:当前元素在集合的下标,如果是map则是map的key值,这个参数一般用的相对较少。
BatchExecutor插入

我们把上面的普通例子中获取Session的例子改写一下:

SqlSession session = sqlSessionFactory.openSession(ExecutorType.BATCH);

如果想详细了解openSession方法参数的,可以点击这里。然后执行之后输出sql如下:

可以看到,这两条语句就是相同模式的sql,只是参数不同,所以直接执行一次。

我们把上面的例子改写一下:

UserAddress userAddr = new UserAddress();
userAddr.setAddress("广东深圳");
userAddr.setId(1);
userAddressList.add(userAddr);

UserAddress userAddr2 = new UserAddress();
userAddr2.setAddress("广东广州");
userAddr2.setId(2);
userAddressList.add(userAddr2);

UserAddressMapper userAddressMapper = session.getMapper(UserAddressMapper.class);

userAddressMapper.insert(userAddr);//sql-1
userAddressMapper.insert10(userAddr2);//sql-10
userAddressMapper.insert(userAddr);//sql-1

insert和insert10分别对应如下语句(一条是1个参数,一条是2个参数):

<insert id="insert" parameterType="com.lonelyWolf.mybatis.model.UserAddress" useGeneratedKeys="true" keyProperty="address">
       insert into lw_user_address (address) values (#{address})
   </insert>

    <insert id="insert10" parameterType="com.lonelyWolf.mybatis.model.UserAddress" useGeneratedKeys="true" keyProperty="address">
        insert into lw_user_address (id,address) values (#{id},#{address})
    </insert>

上面就是有两种sql模型,理论上应该执行2次,但是我们根据源码知道,因为insert语句中间被insert10隔开了,所以实际上sql-1也是不能复用的,也就是会执行3次:

PS:这三种批量执行的效率有兴趣的可以自己去测试一下,效率最高的应该是foreach标签的形式,网上有其他

ClosedExecutor

ClosedExecutor是ResultLoaderMap(懒加载时会使用)内的一个内部类,没有任何具体实现,一般我们不会主动去使用。

CachingExecutor

这个执行器和缓存有关,在这里我们先不展开,下一篇讲述缓存实现原理的时候再来分析

StatementHandler

StatementHandler是数据库会话器,专门用来处理数据库会话的。StatementHandler内运用了适配器模式和策略模式的思想
类图结构和Executor非常相似,如下图所示:


这个接口中的方法也相对较少,prepare方法是用来初始化具体Statement对象的:

BaseStatementHandler

BaseStatementHandler是一个抽象类,实现了StatementHandler中的所有方法,只留下了一个初始化Statement对象方法留给子类实现。

SimpleStatementHandler

SimpleStatementHandler对应JDBC的Statement,是一种非预编译语句,所以参数中是没有占位符的,相当于参数中会用$符号

PreparedStatementHandler

PreparedStatementHandler对应JDBC的PrepareStatement语句,是一种预编译,参数会有占位符,预编译可以防止SQL注入

CallableStatementHandler

CallableStatementHandler依赖于JDBC的Callablement,用来调用存储过程语句

RoutingStatementHandler

RoutingStatementHandler这个从名字上可以看出来,只是起到了一个路由作用,会根据statement类型来生成相对应的Statement对象:

ParameterHandler

ParameterHandler是一个参数处理器,主要是用来对预编译语句进行参数设置额,只有一个默认实现类DefaultParameterHandler。ParameterHandler中只定义了两个方法,一个获取参数,一个设置参数:

ResultSetHandler

ResultHandler是一个结果处理器,StatementHandler完成了查询之后,最终就是通过ResultHandler来实现结果集映射,ResultSetHandler接口中只定义了3个方法用来处理结果,而这三个方法对应了三种返回结果:
ResultHandler也默认提供了一个实现类:DefaultResultSetHandler。一般我们平常用的最多的就是通过handleResultSets来实现结果集转换,这个方法的大致思路我们上一篇文章已经分析过了,在这里就不重复展开。

总结

经过这篇文章的分析,我想大家可以体会到SqlSession只是个甩手掌柜的意思,因为SqlSession只是一个对外接口,实际真正干活的却是Executor等四大对象:Executor,StatementHandler,ParameterHandler,ResultSetHandler。本文的重点讲述了Executor对象,并对比了三种常用批量操作的使用方法,相信通过这篇文章的学习大家对MyBatis的执行流程可以有更深一步的了解,掌握了这四大对象,后面就会更容易理解MyBatis的插件实现原理。

请持续关注我后续文章,MyBatis后续文章系列计划中至少还有三篇,分别会分析缓存实现原理,插件实现原理,和日志管理相关知识。

请关注我,和孤狼一起学习进步

 
打赏
 本文转载自:网络 
所有权利归属于原作者,如文章来源标示错误或侵犯了您的权利请联系微信13520258486
更多>最近资讯中心
更多>最新资讯中心
0相关评论

推荐图文
推荐资讯中心
点击排行
最新信息
新手指南
采购商服务
供应商服务
交易安全
关注我们
手机网站:
新浪微博:
微信关注:

13520258486

周一至周五 9:00-18:00
(其他时间联系在线客服)

24小时在线客服