MyCat中的概念
1.切分
逻辑上的切分,在物理层面使用多库(database)、多表(table)实现切分。
1.1 纵向切分/垂直切分
就是把原来存储在一个库的数据存储在多个库上
由于数据库的读写都是对同一个库进行操作,所以单库并不能解决大规模并发写入的问题。
例如:我们会建立定义数据库 workDB、商品数据库 payDB、用户数据库 userDB、日志数据库 logDB 等。
优点:
减少增量数据写入时的锁对查询的影响。
由于单表数量下降,常见的查询操作由于减少了需要扫描的记录,使得单表单次查询所需检索的行数变少,减少了磁盘IO、时延变短。
缺点:
无法解决单表数据量太大的问题。
1.2 横向切分/水平切分
把原本存储于一个表的数据分块存储到多个表上
当一个表中的数据量过大时,我们可以把该表的数据按照某种规则,进行划分,然后存储到多个结构相同的表上。
例如:我们 userDB 中的 userTable 中数据量很大,那么可以把 userDB 切分为结构相同的多个 userDB:part0DB、part1DB 等,再将 userDB 上的 userTable,切分为很多 userTable:userTable0、userTable1 等,然后将这些表按照一定的规则存储到多个 userDB 上。
优点:
单表的并发能力提高了,磁盘的I/O性能也提高了
如果出现高并发的话,总表可以根据不同的查询,将并发压力发到不同的小表里。
缺点:
无法实现表连接查询
2.逻辑库-Schema
MyCat中定义的database是逻辑上存在的,但物理上是不存在的。
主要是针对纵向切分提供的概念。
3.逻辑表-Table
MyCat中定义的table,是逻辑上存在,物理上不存在的
主要是针对横向切分提供的概念
4.默认端口
MySql:3306
MyCat:8066
Tomcat:8080
Oracle:1521
nginx:80
http:协议默认端口80
redis:6379
5.数据主机-DataHost
物理MySql存放的主机地址,可以使用主机名,IP,域名定义。
6.数据节点-DataNode
配置物理的database。数据保存的物理节点就是database
7.分片规则
当控制数据的时候,如何访问物理database和table?
就是访问dataHost和dataNode的算法
在Mysql处理CRUD时,如何访问datahost和datanode的算法?如:哈希算法,crc32算法等。
下载
github太慢直接网盘下就行,版本是1.6
链接: https://pan.baidu.com/s/1QQyIUj_Y03Ctpo22yIuNxA 密码: 3arv
安装
解压
tar -zxvf Mycat-server-1.6.7.1-linux.tar.gz
移动到/usr/local目录下
mv mycat /usr/local
进入/usr/local/mycat 目录
cd /usr/local/mycat
ll
查看目录内容
bin:命令文件
catlet:空的,扩展
conf:配置文件(server.xml,schema.xml,rule.xml等)
schema.xml:定义逻辑库,表、分片节点等内容
rule.xml:定义分片规则
server.xml:定义用户以及系统相关变量,如端口等
lib:依赖的jar包
配置
进入conf目录
cd /usr/local/mycat/conf
- 以下建议可以进行vim的基本操作。
- 以下配置为演示,注意看配置信息和标签根据自己的需求进行修改
- 修改配置文件server.xml (经常修改)
<?xml version="1.0"?>
<!DOCTYPE mycat:schema SYSTEM "schema.dtd">
<mycat:schema xmlns:mycat="http://io.mycat/">
<!-- name:为mycat逻辑库的名字,对应server<property name="schemas">mydatabase</property>, 建议设置跟数据库一样的名称 checkSQLschema:自动检查逻辑库名称并拼接,true会在sql语句中的表名前拼接逻辑库名, 例如select * from mydatabase.t_user; sqlMaxLimit:查询保护、如果没有写limit条件,会自动拼接。只查询100条。 -->
<schema name="mydatabase" checkSQLschema="true" sqlMaxLimit="100">
<!-- name:为物理数据库的表名,命名与物理数据库的一致 dataNode:为dataNode标签(<dataNode name="dn1" dataHost="dtHost1" database="db1" />)里面的name值 dataNode里面填写的节点数量必须和rule里面的规则数量一致 例如rule里面只定义了两个0-1M=0 1M-2M=1那么此处只可以指定两个节点,1M=10000,M为单位万 primaryKey:为表的ID字段,建议和rule.xml里面指定的ID和物理库的ID一致 rule:分片规则,对应rule.xml中<tableRule name="student_id">的name type:表格类型,默认非global,用于全局表定义 -->
<table name="t_user" dataNode="dn1,dn2,dn3" primaryKey="id" rule="auto-sharding-long">
<!--ER分片注意childTable 标签需要放到table标签内,是主外键关联关系, name:为物理数据库的表名,命名与物理数据库的一致 primaryKey:为表t_loginlog的ID字段,建议和rule.xml里面指定的ID和物理库的ID一致. joinKey:从表t_loginlog的外键字段,需要和物理库的字段名称一致 parentKey:为主表t_user的字段名,依据此字段做关联,进行ER分片 -->
<childTable name="t_loginlog" primaryKey="id" joinKey="user_id" parentKey="id"></childTable>
</table>
<table name="t_student" dataNode="dn1,dn3" primaryKey="id" rule="student_id" />
<table name="t_dictionaries" dataNode="dn1,dn2,dn3" type="global" />
<table name="t_teacher" dataNode="dn1" />
</schema>
<!-- name:节点名称,用于在table标签里面调用 dataHost:dataHost标签name值(<dataHost name="dtHost1">) database:物理数据库名,需要提前创建好实际存在的-->
<dataNode name="dn1" dataHost="dtHost1" database="db1" />
<dataNode name="dn2" dataHost="dtHost1" database="db2" />
<dataNode name="dn3" dataHost="dtHost2" database="db3" />
<!-- name:节点名称,在上方dataNode标签中调用 maxCon:底层数据库的链接最大数 minCon:底层数据库的链接最小数 【balance】重要:值可以为0,1,2,3,分别表示对当前datahost中维护的数据库们的读操作逻辑 0:不开启读写分离,所有的读写操作都在最小的索引号的writeHost(第一个writeHost标签) 1:全部的readHost和备用writeHost都参与读数据的平衡,如果读的请求过多,负责写的第一个writeHost也分担一部分 2 :所有的读操作,都随机的在所有的writeHost和readHost中进行 3 :所有的读操作,都到writeHost对应的readHost上进行(备用writeHost不参加了),在集群中没有配置ReadHost的情况下,读都到第 一个writeHost完成 writeType:控制当前datahost维护的数据库集群的写操作 0:所有的写操作都在第一个writeHost标签的数据库进行 1:所有的写操作,都随机分配到所有的writeHost(mycat1.5完全不建议配置了) dbtype:数据库类型(不同数据库配置不同名称,mysql) dbDriver:数据库驱动,native,动态获取 switchType:切换的逻辑 -1:故障不切换 1:故障切换,当前写操作的writeHost故障,进行切换,切换到下一个writeHost; slaveThreshold:标签中的<heartbeat>用来检测后端数据库的心跳sql语句;本属性检查从节点与主节点的同步情况(延迟时间数),配合心 跳语句show slave status; 读写分离时,所有的readHost的数据都可靠 -->
<dataHost name="dtHost1" maxCon="1000" minCon="10" balance="1" writeType="0" dbType="mysql" dbDriver="native" switchType="1" slaveThreshold="100">
<!--用于验证心跳,这个是mysql主库的配置-->
<heartbeat>select user()</heartbeat>
<writeHost host="127.0.0.1" url="192.168.199.11:3306" user="root" password="123456">
<readHost host="127.0.0.1" url="192.168.199.12:3306" user="root" password="123456" />
</writeHost>
</dataHost>
<dataHost name="dtHost2" maxCon="1000" minCon="10" balance="1" writeType="0" dbType="mysql" dbDriver="native" switchType="1" slaveThreshold="100">
<!--用于验证心跳,这个是mysql主库的配置-->
<heartbeat>select user()</heartbeat>
<writeHost host="127.0.0.1" url="192.168.199.13:3306" user="root" password="123456">
<readHost host="127.0.0.1" url="192.168.199.13:3306" user="root" password="123456" />
</writeHost>
</dataHost>
</mycat:schema>
- 配置schema.xml
<?xml version="1.0" encoding="UTF-8"?>
<!-- - - Licensed under the Apache License, Version 2.0 (the "License"); - you may not use this file except in compliance with the License. - You may obtain a copy of the License at - - http://www.apache.org/licenses/LICENSE-2.0 - - Unless required by applicable law or agreed to in writing, software - distributed under the License is distributed on an "AS IS" BASIS, - WITHOUT WARRANTIES OR CONDITIONS OF ANY KIND, either express or implied. - See the License for the specific language governing permissions and - limitations under the License. -->
<!DOCTYPE mycat:server SYSTEM "server.dtd">
<mycat:server xmlns:mycat="http://io.mycat/">
<system>
<!--配置的端口号-->
<property name="serverPort">8066</property>
<property name="nonePasswordLogin">0</property> <!-- 0为需要密码登陆、1为不需要密码登陆 ,默认为0,设置为1则需要指定默认账户-->
<property name="useHandshakeV10">1</property>
<property name="useSqlStat">0</property> <!-- 1为开启实时统计、0为关闭 -->
<property name="useGlobleTableCheck">0</property> <!-- 1为开启全加班一致性检测、0为关闭 -->
<property name="sequnceHandlerType">2</property>
<property name="subqueryRelationshipCheck">false</property> <!-- 子查询中存在关联查询的情况下,检查关联字段中是否有分片字段 .默认 false -->
<!-- <property name="useCompression">1</property>--> <!--1为开启mysql压缩协议-->
<!-- <property name="fakeMySQLVersion">5.6.20</property>--> <!--设置模拟的MySQL版本号-->
<!-- <property name="processorBufferChunk">40960</property> -->
<!-- <property name="processors">1</property> <property name="processorExecutor">32</property> -->
<!--默认为type 0: DirectByteBufferPool | type 1 ByteBufferArena | type 2 NettyBufferPool -->
<property name="processorBufferPoolType">0</property>
<!--默认是65535 64K 用于sql解析时最大文本长度 -->
<!--<property name="maxStringLiteralLength">65535</property>-->
<!--<property name="sequnceHandlerType">0</property>-->
<!--<property name="backSocketNoDelay">1</property>-->
<!--<property name="frontSocketNoDelay">1</property>-->
<!--<property name="processorExecutor">16</property>-->
<!-- <property name="serverPort">8066</property> <property name="managerPort">9066</property> <property name="idleTimeout">300000</property> <property name="bindIp">0.0.0.0</property> <property name="frontWriteQueueSize">4096</property> <property name="processors">32</property> -->
<!--分布式事务开关,0为不过滤分布式事务,1为过滤分布式事务(如果分布式事务内只涉及全局表,则不过滤),2为不过滤分布式事务,但是记录分布式事务日志-->
<property name="handleDistributedTransactions">0</property>
<!-- off heap for merge/order/group/limit 1开启 0关闭 -->
<property name="useOffHeapForMerge">1</property>
<!-- 单位为m -->
<property name="memoryPageSize">64k</property>
<!-- 单位为k -->
<property name="spillsFileBufferSize">1k</property>
<property name="useStreamOutput">0</property>
<!-- 单位为m -->
<property name="systemReserveMemorySize">384m</property>
<!--是否采用zookeeper协调切换 -->
<property name="useZKSwitch">false</property>
<!-- XA Recovery Log日志路径 -->
<!--<property name="XARecoveryLogBaseDir">./</property>-->
<!-- XA Recovery Log日志名称 -->
<!--<property name="XARecoveryLogBaseName">tmlog</property>-->
<!--如果为 true的话 严格遵守隔离级别,不会在仅仅只有select语句的时候在事务中切换连接-->
<property name="strictTxIsolation">false</property>
<property name="useZKSwitch">true</property>
</system>
<!-- 全局SQL防火墙设置 -->
<!--白名单可以使用通配符%或着*-->
<!--例如<host host="127.0.0.*" user="root"/>-->
<!--例如<host host="127.0.*" user="root"/>-->
<!--例如<host host="127.*" user="root"/>-->
<!--例如<host host="1*7.*" user="root"/>-->
<!--这些配置情况下对于127.0.0.1都能以root账户登录-->
<!-- 此处是开放了本机和外网的请求链接,因为我的mycat安装在虚拟机上,所以本机是通过ip链接 192.*是为了让navicat可以连接使用(配置完整的虚拟机IP也可以) 127.*是为了让虚拟机本身可以通过命令连接-->
<firewall>
<whitehost>
<host host="192.*" user="mycat"/>
<host host="127.*" user="mycat"/>
</whitehost>
<blacklist check="false">
</blacklist>
</firewall>
<!-- 此处定义了一个mycat用户,可以管理的逻辑库为mydatabase,对应schema.xml中的<schema name="mydatabase" > -->
<user name="mycat" defaultAccount="true">
<property name="password">123456</property>
<property name="schemas">mydatabase</property>
<!-- 表级 DML 权限设置 -->
<!-- <privileges check="false"> <schema name="TESTDB" dml="0110" > <table name="tb01" dml="0000"></table> <table name="tb02" dml="1111"></table> </schema> </privileges> -->
</user>
<!--<user name="user"> <property name="password">123456</property> <property name="schemas">mycat1,test3</property> <property name="readOnly">true</property> </user>-->
</mycat:server>
启动
安装java-jdk:https://blog.csdn.net/qq_42094345/article/details/106954139
- 控制台启动 :去 mycat/bin 目录下执行 ./mycat console
- 后台启动 :去 mycat/bin 目录下 ./mycat start
为了能第一时间看到启动日志,方便定位问题,我们选择1控制台启动。
成功会有提示【successfully】
MyCAT Server startup successfully. see logs in logs/mycat.log
登陆mycat
mysql -umycat -p123456 -h 192.168.0.103 -P 8066
使用mysql命令登陆
用户名和密码是schema.xml 的 标签里面配置的用户名和密码
登陆成功
后面将写分库分表,主从啥的。
有用请三连,不胜感激!