整合营销服务商

电脑端+手机端+微信端=数据同步管理

免费咨询热线:

Sql自定义函数去除html标签

们通常用富文本框编辑内容存在数据库中,在做列表显示数据的时候不想显示原来的样式,用自定义函数格式化html标签即可。

自定义函数

alter function [dbo].[dropHtmlTag](@cont varchar(max))

returns varchar(max)

as

begin

--去掉style标签

declare @stylecount int;

set @stylecount = charindex('<style>',@cont);

while @stylecount>0

begin

select @cont=replace(@cont, SUBSTRING(@cont,CHARINDEX('<style>',@cont),CHARINDEX('</style>',@cont)-CHARINDEX('<style>',@cont)+8),'');

set @stylecount = charindex('<style>',@cont);

end



我们执行 alter table 语句后,经常面临“跑又跑不完,杀又不敢杀”的窘境。

如果能评估 alter table 的进度就幸福多了。


实验

MySQL官方已经给出了文档:https://dev.mysql.com/doc/refman/5.7/en/monitor-alter-table-performance-schema.html,我们来实践一下:

先建个数据库:

我们设置了一些跟 performance_schema 相关的参数,开启了查看进度必要的功能。

还是按照之前实验 11的技巧,快速造一些数据:

重复执行 insert,让表中有足够数据:

我们来跑一个alter table:

在另一个 session 中,执行 SQL 查看进度:

看起来 SQL 比较复杂,我们先来看看效果:

这里列出了正在执行的 DDL SQL,进度评估,当前运行语句的时间,和估算的剩余时间。

不断获取进度:

可以看到,估算的剩余时间不是完全精确,在整个过程中,进度在不停被评估。不过这种精确度对于我们也足够用了。

我们来看看评估的主要原理:

在这张表里,MySQL 提供了如下信息:

  • DDL 语句运行的当前阶段
  • 当前阶段的开始时间和结束时间,当前阶段未结束时,结束时间为当前时间
  • 父事件 ID,语句运行的各个阶段,会具有相同的父事件 ID
  • 工作量评估,MySQL 将 DDL 的运行过程拆成一个一个任务包,这里提供了已经完成的任务包数量和估算的任务包总数量,两者的比值即为当前进度

(注意:这里的时间是当前阶段的时间,而工作量评估是整个语句的工作量)

这下我们使用的评估 SQL 就不难看懂了:

附上评估语句的文字版:

select    stmt.SQL_TEXT as sql_text,    concat(WORK_COMPLETED, '/' , WORK_ESTIMATED) as progress,    (stage.TIMER_END - stmt.TIMER_START) / 1e12 as current_seconds,    (stage.TIMER_END - stmt.TIMER_START) / 1e12 * (WORK_ESTIMATED-WORK_COMPLETED) / WORK_COMPLETED as remaining_seconds    from events_stages_current stage, events_statements_current stmt    where stage.THREAD_ID = stmt.THREAD_ID      and stage.NESTING_EVENT_ID = stmt.EVENT_ID;

小贴士

肯定会有同学问:那开启 performance_schema 会不会影响性能呢?

答:在美好的生活面前,不要因噎废食,多用 1% 的 CPU,不会耗太多电的。


关于 MySQL 的技术内容,你们还有什么想知道的吗?赶紧留言告诉小编吧!

作为DBA,我们也常常会碰到这样的需求:需要在不影响线上业务的情况下给表添加一个字段或索引。如果是一张只有几百或几千条记录的小表,这样的需求是非常容易解决的。但如果所管理的表数据量已经上亿、而且应用与数据库交互非常频繁,不允许停机窗口的出现,这样的需求又该如何满足?

大多数的alter table操作都会涉及lock-->copy to new table-->rename-->unlock的过程,锁表时间会很长,而且alter table 的process不可被kill,一旦执行就不可回退。

在MySQL5.5和之前版本,在运行的生产环境对大表(超过数百万纪录)执行Alter操作是一件很困难的事情。因为将重建表和锁表,影响用户者的使用。

从MySQL5.6开始,Online DDL特性被引进。他增强了很多种类的Alter Table操作避免拷贝表和锁表,在运行Alter操作的同时允许运行select,insert,update,delete语句。因此在最新版本,我们可以通过使用ALGORITHM和LOCK选项抑制文件拷贝和加锁。

但是即使在MySQL5.6,仍然有一些Alter操作(增加/删除列,增加/删除主键,改变数据类型等)需要重建表。并不建议直接在线上使用alter table。如果线上有DDL的需求我们建议使用以下两种方式:

1、主从架构轮询修改

2、使用在线修改工具online-schema-change

对于第一种方式,使用的前提是,你的数据库架构是一个集群,如果不是,也就无所谓的轮询修改。修改的原理就是利用主从服务,在应用无感知的情况下,得到停机窗口,进行修改。今天我们着重讲第二种方式,利用第三方工具实现在线大表的DDL操作。这种方式在alter操作更改表结构的时候不用锁定表,也就是说执行alter的时候不会阻塞写和读取操作。

参考官网:https://www.percona.com/doc/percona-toolkit/LATEST/pt-online-schema-change.html


1、用法

pt-online-schema-change [OPTIONS] DSN

pt-online-schema-change alters a table’s structure without blocking reads or writes. Specify the database and table in the DSN. Do not use this tool before reading its documentation and checking your backups carefully.


2、参数

pt-online-schema-change --help 可以查看参数的使用,如果只是要修改个表结构,只需要知道几个简单的参数就可以了

  • --user= 连接mysql的用户名
  • --password= 连接mysql的密码
  • --host= 连接mysql的地址
  • P=3306 连接mysql的端口号
  • D= 连接mysql的库名
  • t= 连接mysql的表名
  • --alter 修改表结构的语句
  • --execute 执行修改表结构
  • --charset=utf8 使用utf8编码,避免中文乱码
  • --no-version-check 不检查版本,在阿里云服务器中一般加入此参数,否则会报错

截图如下:


3、脚本复用

为避免每次都要输入一堆参数,写个脚本复用一下。

#!/bin/bash
#copyright by hwb 
table=$1
alter_conment=$2
cnn_host='172.16.xx'
cnn_user='root'
cnn_pwd='xxxx'
cnn_db='lcpdb'
echo "$table"
echo "$alter_conment"
pt-online-schema-change --charset=utf8 --no-version-check --user=${cnn_user} --password=${cnn_pwd} --host=${cnn_host} P=3306,D=${cnn_db},t=$table --alter "${alter_conment}" --execute --no-check-alter

下面用例子来说明下。


4、添加表字段

如添加表字段SQL语句为:

ALTER TABLE tb_test ADD COLUMN column1 tinyint(4) DEFAULT NULL;

那么使用pt-online-schema-change则可以这样写

sh pt_epms.sh tb_test "ADD COLUMN column1 tinyint(4) DEFAULT NULL"

执行如下:

查看表结构已经修改完成:


5、修改表字段

SQL语句:

ALTER TABLE tb_test MODIFY COLUMN id int(11) unsigned NOT NULL DEFAULT '0';

pt-online-schema-change工具:

sh pt_epms.sh tb_test "MODIFY COLUMN id int(11) unsigned NOT NULL DEFAULT '0'"

执行如下:

查看表结构:


6、修改表字段名

SQL语句:

ALTER TABLE tb_test CHANGE COLUMN name adress varchar(30);

pt-online-schema-change工具:

sh pt_epms.sh tb_test "CHANGE COLUMN name address varchar(30)"


7、添加索引

SQL语句:

ALTER TABLE tb_test ADD INDEX idx_address(address);

pt-online-schema-change工具:

sh pt_epms.sh tb_test "ADD INDEX idx_address(address)"


总结

pt-online-schema-change工具还有很多其他的参数,可以有很多限制,比如限制CPU、线程数量、从库状态等等,不过我做过一个超过1000W表的结构修改,发现几乎不影响性能,很稳定很流畅的就修改了表结构,所以,对以上常规参数的使用基本能满足业务。

注意一定要在业务低峰期做,这样才能确保万无一失。

后面会分享更多devops和DBA方面的内容,感兴趣的朋友可以关注一下~