Мониторинг темературы ubuntu
$ watch sensors
https://www.cyberciti.biz/faq/how-to-check-cpu-temperature-on-ubuntu-linux/
Характеристики системы
# lshw
# lshw -short
cat /proc/cpuinfo — отобразит информацию о процессоре
cat /proc/meminfo — отобразит информацию об оперативной памяти
cat /proc/partitions — отобразит информацию о разделах жесткого диска
free -m – объем занятой и свободной памяти в мегабайтах
lspci | grep Ethernet – сетевые адаптеры
df -H – Информация о разделах жестких дисках
sudo fdisk -l – Разделы, имена устройств и расположение на дисках
lsusb – Информация о шинах USB и подключенных к ним устройствах
lspci – Информация о шинах PCI и подключенных к ним устройствах
cat /etc/issue – Имя и версия дистрибутива Linux
lsb_release -a – название дистрибутива, релиз и кодовое имя, при наличии
uname -r – версия ядра Linux
uname -a – Подробная информация о ядре Linux
uname -m – архитектура систем
uptime – Время работы системы
who
w
История включения и перезагрузок
last reboot
last shutdown
Проверьте скорость жесткого диска в Ubuntu Linux
На консоли Linux используйте следующие команды для установки необходимых пакетов.
# apt-get update # apt-get install ioping
Используйте следующую команду для проверки скорости записи на жесткий диск.
# ioping -S64M -L -s4k -W -c 10 . 4 KiB >>> . (ext4 /dev/sda3): request=1 time=8.12 ms (warmup) 4 KiB >>> . (ext4 /dev/sda3): request=2 time=203.4 us 4 KiB >>> . (ext4 /dev/sda3): request=3 time=202.5 us 4 KiB >>> . (ext4 /dev/sda3): request=4 time=212.8 us 4 KiB >>> . (ext4 /dev/sda3): request=5 time=299.3 us 4 KiB >>> . (ext4 /dev/sda3): request=6 time=261.1 us 4 KiB >>> . (ext4 /dev/sda3): request=7 time=286.2 us 4 KiB >>> . (ext4 /dev/sda3): request=8 time=287.8 us 4 KiB >>> . (ext4 /dev/sda3): request=9 time=238.3 us 4 KiB >>> . (ext4 /dev/sda3): request=10 time=247.5 us --- . (ext4 /dev/sda3) ioping statistics --- 9 requests completed in 2.24 ms, 36 KiB written, 4.02 k iops, 15.7 MiB/s generated 10 requests in 9.00 s, 40 KiB, 1 iops, 4.44 KiB/s min/avg/max/mdev = 202.5 us / 248.8 us / 299.3 us / 35.3 us
В нашем примере обнаруженная скорость записи жесткого диска IOPING составила 15,7 МБ / с.
Используйте следующую команду для проверки скорости чтения жесткого диска.
# ioping -A -D -s16k -c 10 . 16 KiB <<< . (ext4 /dev/sda3): request=1 time=8.11 ms (warmup) 16 KiB <<< . (ext4 /dev/sda3): request=2 time=187.0 us 16 KiB <<< . (ext4 /dev/sda3): request=3 time=259.2 us 16 KiB <<< . (ext4 /dev/sda3): request=4 time=230.8 us 16 KiB <<< . (ext4 /dev/sda3): request=5 time=245.8 us 16 KiB <<< . (ext4 /dev/sda3): request=6 time=180.1 us 16 KiB <<< . (ext4 /dev/sda3): request=7 time=208.3 us 16 KiB <<< . (ext4 /dev/sda3): request=8 time=178.5 us (fast) 16 KiB <<< . (ext4 /dev/sda3): request=9 time=251.0 us 16 KiB <<< . (ext4 /dev/sda3): request=10 time=198.1 us --- . (ext4 /dev/sda3) ioping statistics --- 9 requests completed in 1.94 ms, 144 KiB read, 4.64 k iops, 72.5 MiB/s generated 10 requests in 9.00 s, 160 KiB, 1 iops, 17.8 KiB/s min/avg/max/mdev = 178.5 us / 215.4 us / 259.2 us / 30.0 us
В нашем примере обнаруженная скорость чтения жесткого диска IOPING составила: 72,5 МБ / с.
Информация об используемой файловой системе
file -s /dev/sdb2 /dev/sdb2: Linux rev 1.0 ext4 filesystem data, UUID=4aba9c91-b1c7-4a29-92fe-b11587fc7c68 (needs journal recovery) (extents) (64bit) (large files) (huge files) tune2fs -l /dev/sdb2
Скорость привода измеряется с точки зрения того, сколько данных он может читать или записывать за единицу времени. Команда dd — это простой инструмент командной строки, который может использоваться для чтения и записи произвольных блоков данных на диск и измерения скорости передачи данных. В этом посте мы будем использовать команду dd для проверки скорости чтения SSD и USB-накопителей.
Скорость передачи данных зависит не только от диска, но и от интерфейса, к которому он подключен. Например, порт USB 2.0 имеет максимальную скорость работы 35 Мбайт / с, поэтому, даже если вы подключите высокоскоростной накопитель USB 3 к порту USB 2, скорость будет ограничена нижним пределом.
То же самое касается SSD. SSD подключаются через порты SATA, которые имеют разные версии. Sata 2.0 имеет максимальный теоретический предел скорости 3Gbits / s, который составляет примерно 375 Мбайт / с. В то время как Sata 3.0 поддерживает вдвое большую скорость.
Выполните следующую команду, чтобы очистить кэш памяти, чтобы убедиться, что файл действительно считывается с диска.
# sh -c “sync && echo 3 > /proc/sys/vm/drop_caches”
Выбираем нужный раздел и проверяем скорость чтения:
# hdparm -t /dev/sda2
Измеряем скорость записи на диск:
# sync; dd if=/dev/zero of=./tempfile bs=1M count=1024; sync
Измеряем скорость чтения:
# sync; dd if=./tempfile of=/dev/null bs=8k; sync
Другой способ — прямо указать dd дождаться окончания синхронизации данных (т.е. после фактического завершения операций записи/чтения данных на диск):
# dd if=/dev/sdb3 of=./tempfile bs=1M count=1000 conv=fdatasync
Запустите hdparm следующим образом, чтобы измерить скорость чтения жесткого диска /dev/sda:
sudo hdparm -Tt /dev/sda
Просмотр информации по всем USB контроллерам компьютера:
lspci | grep -i usb
Следующая утилита — iozone, которая фактически умеет выполнять все тесты, описанные выше
iozone -a /dev/sda1
Ключ -a запускает iozone в автоматическом режиме, в котором утилита будет использовать для тестирования block size от 4k до 16384k (16M), и размер файлов от 64k до 524288k (512M).
Все результаты скорости указаны в KB/Sec.
Первая колонка — KB отображает размер файла.
Вторая колонка — reclen — отображает используемый размер блока (block size).
Третья колнка — write — отображает время, затраченное на создание/запись нового файла. Это всегда более сложная задача для диска и файловой системы, так как связана с назначением inode, созданием новой записи в журнале событий (для Journaled File System) и т.п.
Четвёртая колонка — rewrite — указывается скорость перезаписи уже существующего файла.
Пятая колонка — read — скорость чтения существующего файла.
Шестая колонка — reread — скорость чтения файла, который уже был прочитан (reread file).
Седьмая колонка — random read — показывает скорость доступа к случайной части (!) файла.
В целом, этих данных хватит для получения необходимых данных о быстродействии жесткого диска. Более подробные данные можно еполучить на сайте разработчика
Сохранить результаты можно с ключём -b (файл должен быть совсемстим с форматом эл. таблиц):
iozone -a -b ioresults.xls
Проверьте скорость ОЗУ в Ubuntu Linux
На консоли Linux используйте следующие команды для установки необходимых пакетов.
# apt-get update
# apt-get install ioping
# mkdir -p /tmp/ram
# mount -t tmpfs -o size=512M tmpfs /tmp/ram/ # cd /tmp/ram/ # ioping -S64M -L -s4k -W -c 10 .
4 KiB >>> . (tmpfs tmpfs): request=1 time=5.67 us (warmup)
4 KiB >>> . (tmpfs tmpfs): request=2 time=10.1 us
4 KiB >>> . (tmpfs tmpfs): request=3 time=9.89 us
4 KiB >>> . (tmpfs tmpfs): request=4 time=11.3 us
4 KiB >>> . (tmpfs tmpfs): request=5 time=10.2 us
4 KiB >>> . (tmpfs tmpfs): request=6 time=9.79 us
4 KiB >>> . (tmpfs tmpfs): request=7 time=10.1 us
4 KiB >>> . (tmpfs tmpfs): request=8 time=10.1 us
4 KiB >>> . (tmpfs tmpfs): request=9 time=9.99 us
4 KiB >>> . (tmpfs tmpfs): request=10 time=9.20 us (fast)
— . (tmpfs tmpfs) ioping statistics —
9 requests completed in 90.6 us, 36 KiB written, 99.3 k iops, 388.1 MiB/s
generated 10 requests in 9.00 s, 40 KiB, 1 iops, 4.44 KiB/s
min/avg/max/mdev = 9.20 us / 10.1 us / 11.3 us / 510 ns
Используйте следующую команду для проверки скорости чтения из оперативной памяти.
# mkdir -p /tmp/ram
# mount -t tmpfs -o size=512M tmpfs /tmp/ram/ # cd /tmp/ram/ # ioping -A -s16k -c 10 .
16 KiB <<< . (tmpfs tmpfs): request=1 time=16.8 us (warmup)
16 KiB <<< . (tmpfs tmpfs): request=2 time=16.4 us
16 KiB <<< . (tmpfs tmpfs): request=3 time=15.3 us
16 KiB <<< . (tmpfs tmpfs): request=4 time=21.6 us
16 KiB <<< . (tmpfs tmpfs): request=5 time=15.9 us
16 KiB <<< . (tmpfs tmpfs): request=6 time=16.9 us
16 KiB <<< . (tmpfs tmpfs): request=7 time=21.2 us
16 KiB <<< . (tmpfs tmpfs): request=8 time=16.4 us
16 KiB <<< . (tmpfs tmpfs): request=9 time=17.7 us
16 KiB <<< . (tmpfs tmpfs): request=10 time=17.5 us
— . (tmpfs tmpfs) ioping statistics —
9 requests completed in 158.9 us, 144 KiB read, 56.6 k iops, 884.9 MiB/s
generated 10 requests in 9.00 s, 160 KiB, 1 iops, 17.8 KiB/s
min/avg/max/mdev = 15.3 us / 17.7 us / 21.6 us / 2.13 us
Процессоры
Чтобы показать частоту для каждого ядра центрального процессора, выполните команду:
cat /proc/cpuinfo | grep "MHz"
Если вы хотите, чтобы информация о текущей частоте постоянно обновлялась, то запустите команду:
watch -n1 "cat /proc/cpuinfo | grep \"MHz\""
Используя команду lscpu, можно вывести информацию о поддерживаемом процессоре диапазоне частот, а также о том, какая частота у процессора в данный момент:
lscpu | grep MHz
Чтобы показать только текущую частоту CPU:
lscpu | grep 'CPU MHz' | awk '{ print $3; }'
Чтобы постоянно обновлять данные о текущей частоте процессора:
watch -n1 "lscpu | grep 'CPU MHz' | awk '{print $1}'"
Информация о процессорах
sudo lshw -c cpu sudo dmidecode -t processor
ОЗУ и swap
free -h free -hs 3
-s [секунды]. Как аргумент к данному флагу указывается время в секундах, через которое следует обновлять информацию о состоянии памяти Для того, чтобы узнать тип и частоту оперативной памяти используется следующая команда:
sudo dmidecode --type memory
Проверка оперативной памяти на наличие ошибок Иногда можно столкнуться с поломкой полупроводников оперативной памяти. Обычно это выражается в нестабильной работе программ, зависаниях и т.п. Такие поломки способны повлиять на производительность оперативной памяти. Такую поломку устранить не получится, можно только заменить модуль на новый. Поэтому при зависаниях ПК или отдельных программ необходимо убедиться в целостности ОЗУ, чтобы не потратить деньги впустую, приобретя новые модули памяти взамен рабочим. Для проверки оперативной памяти можно использовать программу MemTester. Чтобы ее установить нужно выполнить следующую команду в терминале:
sudo apt install memtester
Для примера запустим проверку блока ОЗУ, размером в 100 мегабайт состоящую из двух циклов:
sudo memtester 100M 2
Для более тщательного тестирования памяти можно воспользоваться утилитой memtest86+ из меню загрузчика Grub. Для того, чтобы попасть в меню Grub при запуске ПК следует держать нажатой клавишу Shift или, в некоторых случаях, ESC. Если загрузилось не меню, а консоль, то нужно выполнить команду normal. После выбора пункта меню «Memory Test (memtest86+)» начнется проверка памяти: По окончанию первого цикла проверки снизу экрана будет отображена информация с результатами проверки: Для получения более расширенной информации об оперативной памяти запустите команду следующим образом:
sudo dmidecode -t memory
Для более сжатой информации, выполните команду:
sudo dmidecode -t 16 udo dmidecode --type 17
Пример вывода:
# sudo dmidecode -t 16 # dmidecode 3.2 Getting SMBIOS data from sysfs. SMBIOS 2.7 present. Handle 0x002D, DMI type 16, 23 bytes Physical Memory Array Location: System Board Or Motherboard Use: System Memory Error Correction Type: Multi-bit ECC Maximum Capacity: 96 GB Error Information Handle: Not Provided Number Of Devices: 4 Handle 0x0037, DMI type 16, 23 bytes Physical Memory Array Location: System Board Or Motherboard Use: System Memory Error Correction Type: Multi-bit ECC Maximum Capacity: 96 GB Error Information Handle: Not Provided Number Of Devices: 4
В этом выводе значение строк следующее: Maximum Capacity — максимально поддерживаемое системой количество оперативной памяти Number Of Devices — количество устройств, то есть сколько слотов памяти имеется. Будьте осторожны с этими значениями, особенно на ноутбуках, поскольку это значение берётся как количество слотов, которое может поддерживать материнская плата. Но производители могут принять решение, что вместо 4 возможных слотов RAM, они паяют только 2 слота. То есть в реальности слотов может быть меньшше. Size — объём оперативной памяти Form Factor — тип модуля, например, SODIMM — это оперативная память для ноутбуков (уменьшенный размер) Type — тип памяти, например, DDR4 Speed — скорость, например, 2667 MT/s Manufacturer — производитель, например, Samsung Part Number — точное название модели оперативной памяти, например, M471A2K43CB1-CTD Minimum Voltage — минимальный вольтаж, например, 1.2 V Maximum Voltage — максимальный вольтаж, например, 1.2 V Configured Voltag — настроенный вольтаж, например, 1.2 V Чтобы показать модель, производителя и характеристики ОЗУ в Linux выполните команду:
sudo lshw -class memory
size — это общий размер оперативной памяти в системе, либо размер данного модуля product — это точная модель ОЗУ, установленной в Linux vendor — производитель clock — частота
Дополнительно
https://zalinux.ru/?p=2060
https://losst.ru/ispolzovanie-operativnoj-pamyati-linux
Получение информации о hardware — HDD
Что бы узнать какой жесткий диск установлен в вашем сервере/ПК, его производителя и технические характеристики, воспользуемся следующими утилитами:
# smartctl -i /dev/sda
Требуется установленный набор утилит smartmontools и для диска должны быть разрешено выполнение операцция со SMART-контроллером. Подробнее — в статье S.M.A.R.T: проверка HDD — описание атрибутов, значение атрибутов, утилиты, параметры.
Другой способ — утилита hdparm, позволяющая получать информацию напрямую из ядра системы. Например:
# hdparm -I /dev/sda
Ещё один вариант — утилита lshw, используемая для получения информации о любой hardware-части машины. Что бы получить информацию непосредственно о HDD — добавьте такие ключи:
# lshw -class disk -class storage
S.M.A.R.T: проверка HDD — описание атрибутов, значение атрибутов, утилиты, параметры
S.M.A.R.T. (от англ. self-monitoring, analysis and reporting technology — технология самоконтроля, анализа и отчётности) — технология оценки состояния жёсткого диска встроенной аппаратурой самодиагностики, а также механизм предсказания времени выхода его из строя.
smartctl — утилита для чтения информации SMART;
smartd — демон SMART, постоянно работающий в системе (UNIX-системы) и отслеживающий изменения параметров, умеет отправлять письмо в случае проблем. Про её установку и настройку — в другой статье.
Узнать все возможности:
# smartctl -h | less
Если система сообщает, что:
SMART Disabled. Use option -s with argument ‘on’ to enable it.
значит SMART на этом устройстве отключен. Что бы активировать его — выполните:
# smartctl -s on /dev/sda
А если надо наоборот выключить SMART — укажите:
# smartctl -s off /dev/sda
Утилита smartctl умеет проводить собственное тестирование диска, для получения более точных данных. Тесты бывают 3-х видов:
- Short
- Extended (Long)
- Conveyance
Что бы узнать, сколько времени займёт каждый из них — выполните:
# smartctl -c /dev/sda | less
В выводе будет информация такого плана:
Short self-test routine
recommended polling time: ( 2) minutes.
Extended self-test routine
recommended polling time: ( 78) minutes.
Conveyance self-test routine
recommended polling time: ( 5) minutes.
Что бы запустить проверку определённого типа — выполните:
# smartctl -t short /dev/sda
Проверка запускается в фоне, а нам сообщается что:
Testing has begun.
Please wait 2 minutes for test to complete.
Test will complete after Wed Feb 13 12:24:14 2013
Через две минуты можно посмотреть лог выполнения теста командой:
# smartctl -l selftest /dev/sda
smartctl 5.41 2011-06-09 r3365 [x86_64-linux-3.2.0-29-generic] (local build)
Copyright (C) 2002-11 by Bruce Allen, http://smartmontools.sourceforge.net
=== START OF READ SMART DATA SECTION ===
SMART Self-test log structure revision number 1
Num Test_Description Status Remaining LifeTime(hours) LBA_of_first_error
# 1 Short offline Completed without error 00% 0 —
Что бы остановить выполнение проверки — выполняем:
# smartctl -X
Узнать модель жесткого диска и другую информацию о нём:
# smartctl -i /dev/sda
Быстро получить общую информацию о здоровье диска можно с ключём -H:
# smartctl -H /dev/sda
Очень полезный ключ -x, который выводит всю имеющуюся информацию, в том числе — о возможных проблемах:
Так же, полезно использовать ключ -a, который выводит всю имеющуюся в SMART-контроллере информацию, среди прочего в ней имеются такие данные, которые помогут определить состояние диска:
Так же, имеется информация об ошибках на старом диске, с которого взяты примеры (кстати, он вскоре умер):
ATA Error Count: 2
Error 2 occurred at disk power-on lifetime: 9578 hours (399 days + 2 hours)
When the command that caused the error occurred, the device was active or idle.
After command completion occurred, registers were:
ER ST SC SN CL CH DH
— — — — — — —
40 51 00 da e4 3a 07 Error: UNC at LBA = 0x073ae4da = 121300186
Commands leading to the command that caused the error were:
CR FR SC SN CL CH DH DC Powered_Up_Time Command/Feature_Name
— — — — — — — — —————- ———————
25 00 08 d8 e4 3a e7 00 00:00:42.136 READ DMA EXT
25 00 08 d8 e4 3a e7 00 00:00:39.524 READ DMA EXT
25 00 08 d0 f9 0a e0 00 00:00:39.511 READ DMA EXT
25 00 08 a8 d5 60 e0 00 00:00:39.511 READ DMA EXT
25 00 08 c0 17 92 e0 00 00:00:39.505 READ DMA EXT
Error 1 occurred at disk power-on lifetime: 9578 hours (399 days + 2 hours)
When the command that caused the error occurred, the device was active or idle.
After command completion occurred, registers were:
ER ST SC SN CL CH DH
— — — — — — —
40 51 00 da e4 3a 07 Error: UNC at LBA = 0x073ae4da = 121300186
Commands leading to the command that caused the error were:
CR FR SC SN CL CH DH DC Powered_Up_Time Command/Feature_Name
— — — — — — — — —————- ———————
25 00 08 d8 e4 3a e7 00 00:00:39.524 READ DMA EXT
25 00 08 d0 f9 0a e0 00 00:00:39.511 READ DMA EXT
25 00 08 a8 d5 60 e0 00 00:00:39.511 READ DMA EXT
25 00 08 c0 17 92 e0 00 00:00:39.505 READ DMA EXT
25 00 08 a0 d5 60 e0 00 00:00:39.505 READ DMA EXT
Налицо проблемы с LBA:
LBA (англ. Logical block addressing) — механизм адресации и доступа к блоку данных на жёстком диске, при котором системному контроллеру нет необходимости учитывать геометрию самого жесткого диска (количество цилиндров, сторон, секторов на цилиндре). Контроллеры современных IDE-дисков в качестве основного режима трансляции адреса используют LBA.
Далее этот диск пошёл под тестирование Victoria — но это уже тема другой статьи, хотя лог Victoria можете оценить тут>>>.
Вернёмся к SMART.
Результаты SMART представлены в виде атрибутов (первая часть таблицы SMART Attributes Data Structure) и их значений — колонки VALUE, WORST, THRESH, TYPE и других.
Последние две колонки — WHEN_FAILED и RAW_VALUE обозначают «Когда выйдет из строя» и «Текущее значение«.
Наиболее важным для нас являются колонки «VALUE» («Normalized Value»), «RAW» («Raw Value») и «THRESH» («Threshold»).
Если значение атрибута Normalized Value меньше или равно значения Threshold — то у диска уже есть или скоро будут большие проблемы в работе и использовать его нежелательно. Максимальное значение (от 1 до 100) атрибута означает максимальную стабильность. Чем значение ниже, тем быстрее текущий параметр деградирует.
Threshold — значение, которого должен достигнуть Normalized Value этого же атрибута, чтобы состояние атрибута было признано критическим. Проще говоря, Threshold — это порог: если Normalized Value больше Threshold — атрибут в порядке; если меньше либо равен — с атрибутом проблемы. Именно по такому критерию утилиты, читающие SMART, выдают отчёт о состоянии диска либо отдельного атрибута вроде «Good» или «Bad». При этом они не учитывают, что даже при Normalized Value, большем Threshold, диск на самом деле уже может быть умирающим с точки зрения пользователя, а то и вовсе ходячим мертвецом, поэтому при оценке здоровья диска смотреть стоит всё-таки на другой класс атрибута, а именно — RAW. Однако именно значение Value, опустившееся ниже Threshold, может стать легитимным поводом для замены диска по гарантии. Т. е. при значении Normalized Value, большем Threshold, сам диск считает, что атрибут здоров, а при меньшем либо равном — что болен. Threshold — постоянный параметр, зашитый производителем в диске.
Каждый производитель использует собственные алгоритмы для вычисления параметра Normalized Value исходя из значения Raw Value.
Это относится и к другим атрибутам. К примеру, производитель Hitachi выводит информацию атрибута Power-on hours в минутах, а не часах.
Параметр «WORST» — наименьшее (наиболее близкое к показателю выхода из строя) значение. Можно использовать просто для ознакомления.
Колонка «TYPE» содержит, как правило, два параметра — Pre-fail или Old-age. Ни тот, ни другой не означают что диск скоро «умрёт. Когда параметры действительно опасны — значение колонки «WHEN_FAILED» изменится на «FAILING_NOW».
Если значение «WHEN_FAILED» тире (‘-‘) это означает что с данным атрибутом всё в порядке.
Параметр Raw Value — это текущее значение атрибута. Например, значение Raw Value 365 для Power-cycled значит, что диск включался каждый день в течении последнего года. Вообще — это самый интересный, важный и нужный для оценки показатель. В большинстве случаев он содержит в себе реальные значения, выражаемые в различных единицах измерения, напрямую говорящие о текущем состоянии диска. Основываясь именно на этом показателе, формируется значение Normalized Value. Именно умение читать и анализировать поле Raw Value даёт возможность объективно оценить состояние винчестера.
Значения атрибутов:
Примечание: БМГ — блок магнитных головок, которые производят непосредственно чтение информации с поверхности «блинов» жесткого диска.
Raw Read Error Rate — частота появления ошибок при чтении данных с диска. Данный параметр показывает частоту появления ошибок при операциях чтения с поверхности диска по вине аппаратной части накопителя;
Spin Up Time — время раскрутки шпинделя. Среднее время раскрутки шпинделя диска от 0 до рабочей скорости (как правило — 7200 об/мин, RPM — Revolution Per Minute). Предположительно, в поле Raw Value содержится время в миллисекундах/секундах;
Reallocated Sector Count — количество переназначенных секторов. Когда жесткий диск встречает ошибку чтения/записи/верификации — он пытается переместить данные из него в специальную резервную область (Spare Area) и, в случае успеха, помечает сектор как «переназначенный». Также, этот процесс называют Remapping, а переназначенный сектор — Remap. Благодаря этой возможности, на современных жестких дисках очень редко видны (при тестировании поверхности) так называемые Bad Block. Однако, при большом количестве Remaps, на графике чтения с поверхности будут заметны «провалы» — резкое падение скорости чтения (до 10% и более). Поле Raw Value содержит общее количество переназначенных секторов;
Throughput Performance — средняя производительность (пропускная способность) диска. Уменьшение значения Normalized Value этого атрибута с большой вероятностью указывает на проблемы в накопителе;
Start/Stop Count — количество циклов запуск/останов шпинделя. Поле Raw Value хранит общее количество включений/выключений диска;
Read Channel Margin — запас канала чтения. Назначение этого атрибута не документировано и в современных накопителях не используется;
Seek Error Rate — частота появления ошибок позиционирования БМГ. В случае сбоя в механической системе позиционирования, повреждения сервометок (Servo), сильного термического расширения дисков и т.п. возникают ошибки позиционирования. Чем их больше — тем хуже механика и/или поверхности жесткого диска;
Seek Time Performance — средняя производительность операций позиционирования БМГ. Данный параметр показывает среднюю скорость позиционирования привода БМГ на указанный сектор. Снижение значения этого атрибута говорит о неполадках в механике привода;
Power-On Hours — количество отработанных часов во включенном состоянии. Поле Raw Value этого атрибута показывает количество часов (минут, секунд — в зависимости от производителя), отработанных жестким диском. Снижение значения (Normalized Value) атрибута до критического уровня (Threshold) указывает на выработку диском ресурса (MTBF — Mean Time Between Failures). На практике, даже падение этого атрибута до нулевого значения не всегда указывает на реальное исчерпывание ресурса и накопитель может продолжать нормально функционировать;
Spin Retry Count — количество повторов попыток старта шпинделя диска. Данный атрибут фиксирует общее количество попыток раскрутки шпинделя и его выхода на рабочую скорость, при условии, что первая попытка была неудачной. Снижение значения этого атрибута говорит о неполадках в механике привода;
Recalibration Retries — количество повторов попыток рекалибровки накопителя. Данный атрибут фиксирует общее количество попыток сброса состояния накопителя и установки головок на нулевую дорожку, при условии, что первая попытка была неудачной. Снижение значения этого атрибута говорит о неполадках в механике привода;
Device Power Cycle Count — количество полных циклов запуска/остановки жесткого диска;
Soft Read Error Rate — частота появления «программных» ошибок при чтении данных с диска. Данный параметр показывает частоту появления ошибок при операциях чтения с поверхности диска по вине программного обеспечения, а не аппаратной части накопителя;
End-to-End error — данный атрибут-часть технологии HP SMART IV, это означает, что после передачи через кэш памяти буфера данных паритет данных между хостом и жестким диском не совпадают;
Reported UNC Errors — ошибки, которые не могли быть восстановлены, используя методы устранения ошибки аппаратными средствами;
Load/Unload cycle count — количество циклов вывода БМГ в специальную парковочную зону/в рабочее положение. Подробнее — см. описание технологии Head Load/Unload Technology тут>>>;
Drive Temperature — температура. Данный параметр отражает в поле Raw Value показание встроенного температурного сенсора в градусах Цельсия;
Reallocation Event Count — количество операций переназначения (Remapping). Поле Raw Value этого атрибута показывает общее количество попыток переназначения сбойных секторов в резервную область, предпринятых накопителем. При этом, учитываются как успешные, так и неудачные операции;
Current Pending Sector Count — текущее количество нестабильных секторов. Поле Raw Value этого атрибута показывает общее количество секторов, которые накопитель в данный момент считает претендентами на переназначение в резервную область (Remap). Если в дальнейшем какой-то из этих секторов будет прочитан успешно, то он исключается из списка претендентов. Если же чтение сектора будет сопровождаться ошибками, то накопитель попытается восстановить данные и перенести их в резервную область, а сам сектор пометить как переназначенный (Remapped). Постоянно ненулевое значение Raw Value этого атрибута говорит о низком качестве (отдельной зоны) поверхности диска;
Uncorrectable Sector Count — количество нескорректированных ошибок. Атрибут показывает общее количество ошибок, возникших при чтении/записи сектора и которые не удалось скорректировать. Рост значения в поле Raw Value этого атрибута указывает на явные дефекты поверхности и/или проблемы в работе механики накопителя;
UltraDMA CRC Error Count — общее количество ошибок CRC в режиме UltraDMA. Поле Raw Value содержит количество ошибок, возникших в режиме передачи данных UltraDMA в контрольной сумме (ICRC — Interface CRC). Практика, собранная статистика и изучение журналов ошибок SMART показывают: в большинстве случаев ошибки CRC возникают при сильном завышении частоты PCI (больше номинальных 33.6 MHz), сильно перекрученом кабеле, а также — по вине драйверов ОС, которые не соблюдают требований к передачи/приему данных в режимах UltraDMA;
Write Error Rate (Multi Zone Error Rate)— частота появления ошибок при записи данных. Показывает общее количество ошибок, обнаруженных во время записи сектора. Чем больше значение в поле Raw Value (и ниже значение Normalized Value), тем хуже состояние поверхности диска и/или механики привода;
Disk Shift — сдвиг пакета дисков относительно оси шпинделя. Актуальное значение атрибута содержится в поле Raw Value. Единицы измерения — не известны. Подробности — см. в описании технологии G-Force Protection, например — тут>>>. Сдвиг пакета дисков возможен в результате сильной ударной нагрузки на накопитель в результате его падения или по иным причинам;
G-Sense Error Rate — частота появления ошибок в результате ударных нагрузок. Данный атрибут хранит показания ударочувствительного сенсора — общее количество ошибок, возникших в результате полученных накопителем внешних ударных нагрузок (при падении, неправильной установки, и т.п.). Подробнее — см. описание технологии G-Force Protection;
Loaded Hours — нагрузка на привод БМГ, вызванная общей наработкой часов накопителем. Учитывается только период, в течении которого головки находились в рабочем положении;
Load/Unload Retry Count — нагрузка на привод БМГ, вызванная многочисленными повторениями операций чтения, записи, позиционирования головок и т.п. Учитывается только период, в течении которого головки находились в рабочем положении;
Load Friction — нагрузка на привод БМГ, вызванная трением в механических частях накопителя. Учитывается только период, в течении которого головки находились в рабочем положении;
Load/Unload Cycle Count — общее количество циклов нагрузки на привод БМГ. Учитывается только период, в течении которого головки находились в рабочем положении;
Load-in Time — общее время нагрузки на привод БМГ. Предположительно — данный атрибут показывает общее время работы накопителя под нагрузкой, при условии, что головки находятся в рабочем состоянии (вне парковочной зоны);
Torque Amplification Count — количество усилий вращающего момента привода;
Power-Off Retract Count — количество зафиксированных повторов включения/выключения питания накопителя;
GMR Head Amplitude — амплитуда дрожания GMR-головок (GMR-Head) в рабочем состоянии.
ВАЖНО: для всех атрибутов лучше меньшее (или уменьшающееся) значение, что можно определить периодически проводя проверки. Исключение — следующие атрибуты:
Throughput Performance — общая производительность диска. Если значение атрибута уменьшается, то велика вероятность, что с диском есть проблемы.
и:
Seek Time Performance — средняя производительность операции позиционирования магнитными головками. Если значение атрибута уменьшается (замедление позиционирования), то велика вероятность проблем с механической частью привода головок.
Критичные атрибуты, на которые необходимо обращать особое внимание:
* Raw Read Error Rate
* Spin Up Time
* Spin Up Retry Count
* Seek Error Rate
* Reallocated Sector Coun
Для сравнения с результатами SMART, приведёнными в статье выше — результат с диска, который был только что распечатан:
SMART Attributes Data Structure revision number: 16
Vendor Specific SMART Attributes with Thresholds:
ID# ATTRIBUTE_NAME FLAG VALUE WORST THRESH TYPE UPDATED WHEN_FAILED RAW_VALUE
1 Raw_Read_Error_Rate 0x002f 100 253 051 Pre-fail Always — 0
3 Spin_Up_Time 0x0027 100 253 021 Pre-fail Always — 0
4 Start_Stop_Count 0x0032 100 100 000 Old_age Always — 1
5 Reallocated_Sector_Ct 0x0033 200 200 140 Pre-fail Always — 0
7 Seek_Error_Rate 0x002e 100 253 000 Old_age Always — 0
9 Power_On_Hours 0x0032 100 100 000 Old_age Always — 0
10 Spin_Retry_Count 0x0032 100 253 000 Old_age Always — 0
11 Calibration_Retry_Count 0x0032 100 253 000 Old_age Always — 0
12 Power_Cycle_Count 0x0032 100 100 000 Old_age Always — 1
192 Power-Off_Retract_Count 0x0032 200 200 000 Old_age Always — 1
193 Load_Cycle_Count 0x0032 200 200 000 Old_age Always — 3
194 Temperature_Celsius 0x0022 118 116 000 Old_age Always — 25
196 Reallocated_Event_Count 0x0032 200 200 000 Old_age Always — 0
197 Current_Pending_Sector 0x0032 200 200 000 Old_age Always — 0
198 Offline_Uncorrectable 0x0030 100 253 000 Old_age Offline — 0
199 UDMA_CRC_Error_Count 0x0032 200 253 000 Old_age Always — 0
200 Multi_Zone_Error_Rate 0x0008 100 253 000 Old_age Offline — 0
SMART Error Log Version: 1
No Errors Logged
И пара полезных примеров работы утилиты dd.
Иногда требуется удалить все данные с диска, для этого — «забьём» диск нулями — например, во время выполнения тестов на нём, или — что бы скрыть информацию:
# dd if=/dev/zero of=/dev/sda
Быстрый способ проверить HDD на наличие Bad-Blocks («битых» блоков):
# dd if=/dev/sda of=/dev/null bs=512
Сброс пароля IPMI на серверах Supermicro
Утилита IPMICFG предназанчена для работы со встроенным контроллером BMC. Утилита позволяет вносить изменения в настройки работы контроллера, например, изменить параметры сети, режим работы вентиляторов, внести изменения в список пользователей и их роли, итд. Утилита бывает для разных платформ, Linux, Windows и DOS.
Если у Вас установлена и работает ОС семейства Linux, то надо скачать и разархивировать IPMICFG_1.32.0_build.200910.zip в /home/agis
$ cd $ unzip IPMICFG_1.32.0_build.200910.zip $ sudo -i
Получить IP контроллера BMC
$ sudo /home/agis/IPMICFG_1.32.0_build.200910/Linux/64bit/IPMICFG-Linux.x86_64 -m
IP=192.168.0.101
MAC=1C:EC:EF:85:44:25
Список пользователей
# /home/agis/IPMICFG_1.32.0_build.200910/Linux/64bit/IPMICFG-Linux.x86_64 -user list Maximum number of Users : 10 Count of currently enabled Users : 2 User ID | User Name | Privilege Level | Enable ------- | --------- | --------------- | ------ 2 | agis | Administrator | Yes
Установить для пользователя ID=2 пароль 12345678
# /home/agis/IPMICFG_1.32.0_build.200910/Linux/64bit/IPMICFG-Linux.x86_64 -user setpwd 2 12345678
Добавить пользователя id пользователя=3, пользователь newuser, пароль 12345678, уровня Administrator (4)
# /home/agis/IPMICFG_1.32.0_build.200910/Linux/64bit/IPMICFG-Linux.x86_64 -user add 3 newuser 12345678 4 # /home/agis/IPMICFG_1.32.0_build.200910/Linux/64bit/IPMICFG-Linux.x86_64 -user list Maximum number of Users : 10 Count of currently enabled Users : 3 User ID | User Name | Privilege Level | Enable ------- | --------- | --------------- | ------ 2 | agis | Administrator | Yes 3 | newuser | Administrator | Yes
Удалить пользователя ID=3
# /home/agis/IPMICFG_1.32.0_build.200910/Linux/64bit/IPMICFG-Linux.x86_64 -user del 3
Список уровня привелегий
# /home/agis/IPMICFG_1.32.0_build.200910/Linux/64bit/IPMICFG-Linux.x86_64 -user help For privilege level: Administrator : 4 Operator : 3 User : 2 Callback : 1 No Access : 15
Если на сервер не установлена ОС, то можно создать USB DOS boot flash, например воспользуйтесь утилитой Rufus
Разархивируем и копируем на флешку PMICFG_1.32.0_build.200910\DOS. Загружаемся с флешки и переходим в каталог с нашей утилитой. Далее запускаем команды описанные выше, но использовать команду IPMICFG.exe вместо IPMICFG-Linux.x86_64
Скачать утилиты IPMICFG можно на сайте https://www.supermicro.com/SwDownload/SwSelect_Free.aspx?cat=IPMI или в конце данной страницы.
Управление swap
Если вам необходимо добавить swap на сервер Linux, используйте данную инструкцию. Переходим в режим sudo:
Теперь создаем файл следующей командой:
# dd if=/dev/zero of=/swapfile bs=1G count=4
Вывод этой команды:
2+0 records in
2+0 records out
2147483648 bytes (2.1 GB) copied, 20.2256 s, 106 MB/s
Просмотрим что файл создался:
# ls -lh /swapfile
-rw-r—r— 1 root root 2.0G Oct 29 14:07 /swapfile
Можно так же использовать команду fallocate, которая
# fallocate -l 1G /swapfile-1
# ls -lh /swapfile-1
-rw-r—r— 1 root root 1.0G Oct 29 14:11 /swapfile-1
Назначаем права на папки:
# chown root:root /swapfile
# chmod 0600 /swapfile
# ls -lh /swapfile
-rw——- 1 root root 2.0G Oct 29 14:07 /swapfile
Включаем swap следующей командой:
# mkswap /swapfile
Вывод команды:
Setting up swapspace version 1, size = 2097148 KiB
no label, UUID=10231c61-6e55-4dd3-8324-9e2a892e7137
Активируем swap:
# swapon /swapfile
Проверяем подключился ли swap:
# swapon -s
Вывод команды:
FilenameTypeSizeUsedPriority
/dev/sda5 partition3998716704-1
/swapfile file20971480-2
как выключить swap файл:
# swapoff /swapfile
# swapon -s
для автоматического подключения файла swap, используем fstab:
# vi /etc/fstab
/swapfile none swap sw 0 0
Параметр ядра Linux vm.swappiness.
Узнать его текущее значение на вашей системе можно так:
$ cat /proc/sys/vm/swappiness
Ответ будет 60 почти наверняка. Это значит, что ядро Linux начинает свопить редко используемые страницы оперативной памяти, когда использование свободной оперативной памяти достигает 100%-60%=40%. Часто встречаются рекомендации поставить, например, vm.swappiness=10, чтобы своп не начинал использоваться, пока загрузка ОЗу не достигнет 90%.
Настроим производительность swap файла на сервере:
$ sudo sysctl vm.swappiness=10
Добавить в /etc/sysctl.conf
vm.swappiness=10
Supermciro. Настройка IPMI из операционной системы
Linux 64bit: Execute /Linux/64bit/IPMICFG-Linux.x86_64# -m # Shows IP and MAC. $ sudo ./IPMICFG-Linux.x86_64 -m IP=192.168.0.147 MAC=00:25:90:A1:22:0A # -user list # Lists user privilege $ sudo ./IPMICFG-Linux.x86_64 -user list Maximum number of Users : 10 Count of currently enabled Users : 3 User ID | User Name | Privilege Level | Enable ------- | --------- | --------------- | ------ 2 | agis | Administrator | Yes 3 | fwupd | Administrator | Yes # -user setpwd # Updates a user password. $ sudo ./IPMICFG-Linux.x86_64 -user setpwd 2 somePassword # Добавить пользователя с id=3 и уровнем администратор=4 $ sudo ./IPMICFG-Linux.x86_64 -user add 3 agis newpassword 4