- 处理器
- Processor(_Total)
- %Procerssor Time 处理器繁忙的百分比 80%
- %Priveileged Time 处理器花费在特权模式的时间百分比(如处理io的花费) 10%
- System
- Processor Queue Length 处理器上未处理的请求数(/每个处理器) 2
- Contex Switches/sec 处理器上下文切换速率(内存短缺会引起 /每个处理器) 5000
- 内存
- Memory
- Pages/sec 硬页面错误(一个进程在其他内存中找不到读取硬盘) 50
- Page Faults/sec 总页面错误(软+硬)
- SQLServer:Buffer Manager
- Buffer Cache Hit Ratio 缓冲命中率(过低可能内存不够) 99%
- Page Life Expectancy 页面平均寿命(过低可能内存不够) >300
- Checkpoint Pages/sec 检查点写入磁盘,从缓存中移出(过高预示过多内容被改变写入高) <30
- SQLServer:Memory Manager
- Memory Grants Pending 等待授予内存进程数量(>0内存短缺) 0
- 磁盘
- PhysicalDisk
- %Dsik Time 硬盘繁忙时间 85%
- Current Disk Queue Length 磁盘列队 每个<2
- Avg.Disk Queue Length 平均列队长度 基线对比
- Avg.Disk sec/Read 平均每秒读取耗时 10ms
- Avg.Disk Bytes/Read 平局每秒读取
- Disk Read Bytes/sec 当前每秒读取
- Avg.Disk sec/Write 平均每秒写入耗时 10ms
- Avg.Disk Bytes/Write 平局每秒写入
- Disk Write Bytes/sec 当前每秒写入
- Disk Transfers/sec 每秒磁盘io处理 (视磁盘性能)顺序200 乱序100
- Disk Bytes/sec 当前总写入读取字节
- 总体
- Sql Server:SQL Statistics
- Batch Requests/sec 每秒sql请求
- SQLServer:General Statistics
- User Connections 用户连接数
- SQLServer:Access Methods
- FreeSpace Scans/sec 每秒空间扫描(堆表)
- Full Scans/sec 每秒全扫描(无索引or大数据量)
- SQLServer:Locks(_Total)
- Lock Timeouts/sec 每秒超时锁 (够高为阻塞) 0
- Lock Wait Time(ms) 锁等待时间 (够高为阻塞) 0
- Number od Deadlocks/sec 每秒死锁数
- CPU监视:
- processor:%processor time 即CUP处理非闲置线程所用时间的百分比。如果该值一直大于70% 就代表CUP存在瓶颈
- Process: %processor time (sqlservr) 即 总的处理时间中有多少是由SQLSERVER占用的。
- System :Processor queue Length 即等待由CPU处理的线程的数量。如果平均队列长度大于处理器数量的两倍,即可能出现CUP瓶颈
- 磁盘监测:
- PhysicalDisk: Avg.Disk Queue Length 即 返回等待访问一个独立磁盘或所用磁盘的读写操作的平均数。
- 本值应小于物理磁盘数*2的结果。如果超过则磁盘存在瓶颈
- PhysicalDisk:%Disk time 即 监测磁盘或磁盘阵列的繁忙程度。该值不应超过 60%,如果超过,需要
- 监测 %Disk Read 和 %Disk Write 来判断主要执行的是什么操作。
- 内存监测:
- Memory:Pages/sec 即 测量每秒从内存分页到磁盘或从磁盘分页到内存的页数。该计数器应小于 0,不能一直大于0。
- Memory:Available Bytes 即 指示服务器还有多少内存供进程使用。应至少为100M
- Process:Working Set(sqlservr) 即 显示SQLSERVER使用了多少内存。如果该值总是低于最小服务器内存设置或者显著低于最大服务器内存,
- 则,表明SQLSERVER被分配使用内存过多。
- SQL SERVER:Buffer Manager:Buffer Cache Hit Ratio 即 监测在缓冲区中找到数据,而不用再去读磁盘的时间百分比。该值越高越好。最好为90%以上。
- SQLServer:Cache Hit Ratio
- 该值越高越好。如果持续低于80%,应考虑增加内存。
- SQL SERVER:Buffer Manager: Page Life Expectancy 即 返回一个单位为秒的时间值,显示数据页在缓冲区中停留而不会被数据操作引用的是时间.其最小值约300秒.
- Buffer Cache Hit Ratio 和 Page Life Expectancy 的值越高越好,是SQLSERVER 内存状况的最佳指示器。
- 缓冲区高速缓存命中率 (Buffer CacheHit Ratio %)
- 指在缓冲区高速缓存中找到而不需要从磁盘中读取的页的百分比。该比率是缓存命中总次数与缓存查找总次数之比。经过很长时间后,该比率的变化很小。由于从缓存中读取数据比从磁盘中读取数据的开销小得多,一般希望该比率高一些。 该指标的值最好为90% 或更高。通常可以通过增加 SQL Server
- 可用的内存数量来提高该指标的值。增加内存直到这指标的值持续高于90%,表示90%
- 以上的数据请求可以从数据缓冲区中获得所需数据。
- 高速缓存命中率 (Cache Hit Ratio %)
- 指高速缓存命中次数和查找次数的比率。在SQL Server中,Cache包括Log Cache,Buffer
- Cache以及Procedure Cache,该指标是指所有Cache的命中率,是一个总体的比率。 该指标的值越高越好。如果该指标的值持续低于80%,就需要增加更多的内存。
- SQL SERVER 监测
- SQL SERVER:General Statistics:User Connections 即 显示当前连接到SQLSERVER的用户连接数。
- SQL SERVER:Locks:Average Wait Time 即 监视和跟踪由于并发数据阻塞造成的用户对于数据资源的请求需要等待的平均时间。
- SQL SERVER:Locks:Deadlock/Sec 即 每秒有多少死锁产生。
- SQL SERVER Access Methods:Page Splits/Sec 即 监控对页拆分活动来确定表索引的碎片化速度。(向聚集或非聚集索引页中插入数据时,如果没有足够的空间,则就会产生拆页)