Работа с сервером

Мониторинг темературы ubuntu

$ watch sensors

https://www.cyberciti.biz/faq/how-to-check-cpu-temperature-on-ubuntu-linux/

Характеристики системы

# lshw
# lshw -short
cat /proc/cpuinfo — отобразит информацию о процессоре
cat /proc/meminfo — отобразит информацию об оперативной памяти
cat /proc/partitions — отобразит информацию о разделах жесткого диска
free -m – объем занятой и свободной памяти в мегабайтах
lspci | grep Ethernet – сетевые адаптеры
df -H – Информация о разделах жестких дисках
sudo fdisk -l – Разделы, имена устройств и расположение на дисках
lsusb – Информация о шинах USB и подключенных к ним устройствах
lspci – Информация о шинах PCI и подключенных к ним устройствах
cat /etc/issue – Имя и версия дистрибутива Linux
lsb_release -a – название дистрибутива, релиз и кодовое имя, при наличии
uname -r – версия ядра Linux
uname -a – Подробная информация о ядре Linux
uname -m – архитектура систем
uptime – Время работы системы
who
w
История включения и перезагрузок
last reboot
last shutdown

Проверьте скорость жесткого диска в Ubuntu Linux

На консоли Linux используйте следующие команды для установки необходимых пакетов.

# apt-get update
# apt-get install ioping

Используйте следующую команду для проверки скорости записи на жесткий диск.

# ioping -S64M -L -s4k -W -c 10 .
4 KiB >>> . (ext4 /dev/sda3): request=1 time=8.12 ms (warmup)
4 KiB >>> . (ext4 /dev/sda3): request=2 time=203.4 us
4 KiB >>> . (ext4 /dev/sda3): request=3 time=202.5 us
4 KiB >>> . (ext4 /dev/sda3): request=4 time=212.8 us
4 KiB >>> . (ext4 /dev/sda3): request=5 time=299.3 us
4 KiB >>> . (ext4 /dev/sda3): request=6 time=261.1 us
4 KiB >>> . (ext4 /dev/sda3): request=7 time=286.2 us
4 KiB >>> . (ext4 /dev/sda3): request=8 time=287.8 us
4 KiB >>> . (ext4 /dev/sda3): request=9 time=238.3 us
4 KiB >>> . (ext4 /dev/sda3): request=10 time=247.5 us
--- . (ext4 /dev/sda3) ioping statistics ---
9 requests completed in 2.24 ms, 36 KiB written, 4.02 k iops, 15.7 MiB/s
generated 10 requests in 9.00 s, 40 KiB, 1 iops, 4.44 KiB/s
min/avg/max/mdev = 202.5 us / 248.8 us / 299.3 us / 35.3 us

В нашем примере обнаруженная скорость записи жесткого диска IOPING составила 15,7 МБ / с.

Используйте следующую команду для проверки скорости чтения жесткого диска.

# ioping -A -D -s16k -c 10 .
16 KiB <<< . (ext4 /dev/sda3): request=1 time=8.11 ms (warmup)
16 KiB <<< . (ext4 /dev/sda3): request=2 time=187.0 us
16 KiB <<< . (ext4 /dev/sda3): request=3 time=259.2 us
16 KiB <<< . (ext4 /dev/sda3): request=4 time=230.8 us
16 KiB <<< . (ext4 /dev/sda3): request=5 time=245.8 us
16 KiB <<< . (ext4 /dev/sda3): request=6 time=180.1 us
16 KiB <<< . (ext4 /dev/sda3): request=7 time=208.3 us
16 KiB <<< . (ext4 /dev/sda3): request=8 time=178.5 us (fast)
16 KiB <<< . (ext4 /dev/sda3): request=9 time=251.0 us
16 KiB <<< . (ext4 /dev/sda3): request=10 time=198.1 us
--- . (ext4 /dev/sda3) ioping statistics ---
9 requests completed in 1.94 ms, 144 KiB read, 4.64 k iops, 72.5 MiB/s
generated 10 requests in 9.00 s, 160 KiB, 1 iops, 17.8 KiB/s
min/avg/max/mdev = 178.5 us / 215.4 us / 259.2 us / 30.0 us

В нашем примере обнаруженная скорость чтения жесткого диска IOPING составила: 72,5 МБ / с.
Информация об используемой файловой системе

file -s /dev/sdb2
/dev/sdb2: Linux rev 1.0 ext4 filesystem data, UUID=4aba9c91-b1c7-4a29-92fe-b11587fc7c68 (needs journal recovery) (extents) (64bit) (large files) (huge files)
tune2fs -l /dev/sdb2

Скорость привода измеряется с точки зрения того, сколько данных он может читать или записывать за единицу времени. Команда dd — это простой инструмент командной строки, который может использоваться для чтения и записи произвольных блоков данных на диск и измерения скорости передачи данных. В этом посте мы будем использовать команду dd для проверки скорости чтения SSD и USB-накопителей.

Скорость передачи данных зависит не только от диска, но и от интерфейса, к которому он подключен. Например, порт USB 2.0 имеет максимальную скорость работы 35 Мбайт / с, поэтому, даже если вы подключите высокоскоростной накопитель USB 3 к порту USB 2, скорость будет ограничена нижним пределом.

То же самое касается SSD. SSD подключаются через порты SATA, которые имеют разные версии. Sata 2.0 имеет максимальный теоретический предел скорости 3Gbits / s, который составляет примерно 375 Мбайт / с. В то время как Sata 3.0 поддерживает вдвое большую скорость.

Выполните следующую команду, чтобы очистить кэш памяти, чтобы убедиться, что файл действительно считывается с диска.
# sh -c “sync && echo 3 > /proc/sys/vm/drop_caches”

Выбираем нужный раздел и проверяем скорость чтения:
# hdparm -t /dev/sda2

Измеряем скорость записи на диск:
# sync; dd if=/dev/zero of=./tempfile bs=1M count=1024; sync

Измеряем скорость чтения:
# sync; dd if=./tempfile of=/dev/null bs=8k; sync

Другой способ — прямо указать dd дождаться окончания синхронизации данных (т.е. после фактического завершения операций записи/чтения данных на диск):

# dd if=/dev/sdb3 of=./tempfile bs=1M count=1000 conv=fdatasync

Запустите hdparm следующим образом, чтобы измерить скорость чтения жесткого диска /dev/sda:
sudo hdparm -Tt /dev/sda

Просмотр информации по всем USB контроллерам компьютера:
lspci | grep -i usb

Следующая утилита — iozone, которая фактически умеет выполнять все тесты, описанные выше
iozone -a /dev/sda1

Ключ -a запускает iozone в автоматическом режиме, в котором утилита будет использовать для тестирования block size от 4k до 16384k (16M), и размер файлов от 64k до 524288k (512M).

Все результаты скорости указаны в KB/Sec.

Первая колонка — KB отображает размер файла.
Вторая колонка — reclen — отображает используемый размер блока (block size).
Третья колнка — write — отображает время, затраченное на создание/запись нового файла. Это всегда более сложная задача для диска и файловой системы, так как связана с назначением inode, созданием новой записи в журнале событий (для Journaled File System) и т.п.
Четвёртая колонка — rewrite — указывается скорость перезаписи уже существующего файла.
Пятая колонка — read — скорость чтения существующего файла.
Шестая колонка — reread — скорость чтения файла, который уже был прочитан (reread file).
Седьмая колонка — random read — показывает скорость доступа к случайной части (!) файла.

В целом, этих данных хватит для получения необходимых данных о быстродействии жесткого диска. Более подробные данные можно еполучить на сайте разработчика

Сохранить результаты можно с ключём -b (файл должен быть совсемстим с форматом эл. таблиц):

iozone -a -b ioresults.xls

Дополнительно

https://habr.com/ru/post/154235/

Проверьте скорость ОЗУ в Ubuntu Linux

На консоли Linux используйте следующие команды для установки необходимых пакетов.

# apt-get update

# apt-get install ioping

Используйте следующую команду для проверки скорости записи в ОЗУ.

# mkdir -p /tmp/ram

# mount -t tmpfs -o size=512M tmpfs /tmp/ram/
# cd /tmp/ram/
# ioping -S64M -L -s4k -W -c 10 .

4 KiB >>> . (tmpfs tmpfs): request=1 time=5.67 us (warmup)
4 KiB >>> . (tmpfs tmpfs): request=2 time=10.1 us
4 KiB >>> . (tmpfs tmpfs): request=3 time=9.89 us
4 KiB >>> . (tmpfs tmpfs): request=4 time=11.3 us
4 KiB >>> . (tmpfs tmpfs): request=5 time=10.2 us
4 KiB >>> . (tmpfs tmpfs): request=6 time=9.79 us
4 KiB >>> . (tmpfs tmpfs): request=7 time=10.1 us
4 KiB >>> . (tmpfs tmpfs): request=8 time=10.1 us
4 KiB >>> . (tmpfs tmpfs): request=9 time=9.99 us
4 KiB >>> . (tmpfs tmpfs): request=10 time=9.20 us (fast)

— . (tmpfs tmpfs) ioping statistics —
9 requests completed in 90.6 us, 36 KiB written, 99.3 k iops, 388.1 MiB/s
generated 10 requests in 9.00 s, 40 KiB, 1 iops, 4.44 KiB/s
min/avg/max/mdev = 9.20 us / 10.1 us / 11.3 us / 510 ns

В нашем примере обнаруженная скорость записи в IOPING RAM составила: 388,1 МБ / с.

Используйте следующую команду для проверки скорости чтения из оперативной памяти.

# mkdir -p /tmp/ram

# mount -t tmpfs -o size=512M tmpfs /tmp/ram/
# cd /tmp/ram/
# ioping -A -s16k -c 10 .

16 KiB <<< . (tmpfs tmpfs): request=1 time=16.8 us (warmup)
16 KiB <<< . (tmpfs tmpfs): request=2 time=16.4 us
16 KiB <<< . (tmpfs tmpfs): request=3 time=15.3 us
16 KiB <<< . (tmpfs tmpfs): request=4 time=21.6 us
16 KiB <<< . (tmpfs tmpfs): request=5 time=15.9 us
16 KiB <<< . (tmpfs tmpfs): request=6 time=16.9 us
16 KiB <<< . (tmpfs tmpfs): request=7 time=21.2 us
16 KiB <<< . (tmpfs tmpfs): request=8 time=16.4 us
16 KiB <<< . (tmpfs tmpfs): request=9 time=17.7 us
16 KiB <<< . (tmpfs tmpfs): request=10 time=17.5 us

— . (tmpfs tmpfs) ioping statistics —
9 requests completed in 158.9 us, 144 KiB read, 56.6 k iops, 884.9 MiB/s
generated 10 requests in 9.00 s, 160 KiB, 1 iops, 17.8 KiB/s
min/avg/max/mdev = 15.3 us / 17.7 us / 21.6 us / 2.13 us

В нашем примере обнаруженная скорость чтения ОЗУ IOPING составила 884,9 МБ / с.

Процессоры

Чтобы показать частоту для каждого ядра центрального процессора, выполните команду:

cat /proc/cpuinfo | grep "MHz"

Если вы хотите, чтобы информация о текущей частоте постоянно обновлялась, то запустите команду:

watch -n1 "cat /proc/cpuinfo | grep \"MHz\""

Используя команду lscpu, можно вывести информацию о поддерживаемом процессоре диапазоне частот, а также о том, какая частота у процессора в данный момент:

lscpu | grep MHz

Чтобы показать только текущую частоту CPU:

lscpu | grep 'CPU MHz' | awk '{ print $3; }'

Чтобы постоянно обновлять данные о текущей частоте процессора:

watch -n1 "lscpu | grep 'CPU MHz' | awk '{print $1}'"

Информация о процессорах

sudo lshw -c cpu
sudo dmidecode -t processor

ОЗУ и swap

free -h
free -hs 3

-s [секунды]. Как аргумент к данному флагу указывается время в секундах, через которое следует обновлять информацию о состоянии памяти Для того, чтобы узнать тип и частоту оперативной памяти используется следующая команда:

sudo dmidecode --type memory

Проверка оперативной памяти на наличие ошибок Иногда можно столкнуться с поломкой полупроводников оперативной памяти. Обычно это выражается в нестабильной работе программ, зависаниях и т.п. Такие поломки способны повлиять на производительность оперативной памяти. Такую поломку устранить не получится, можно только заменить модуль на новый. Поэтому при зависаниях ПК или отдельных программ необходимо убедиться в целостности ОЗУ, чтобы не потратить деньги впустую, приобретя новые модули памяти взамен рабочим. Для проверки оперативной памяти можно использовать программу MemTester. Чтобы ее установить нужно выполнить следующую команду в терминале:

sudo apt install memtester

Для примера запустим проверку блока ОЗУ, размером в 100 мегабайт состоящую из двух циклов:

sudo memtester 100M 2

Для более тщательного тестирования памяти можно воспользоваться утилитой memtest86+ из меню загрузчика Grub. Для того, чтобы попасть в меню Grub при запуске ПК следует держать нажатой клавишу Shift или, в некоторых случаях, ESC. Если загрузилось не меню, а консоль, то нужно выполнить команду normal. После выбора пункта меню «Memory Test (memtest86+)» начнется проверка памяти: По окончанию первого цикла проверки снизу экрана будет отображена информация с результатами проверки: Для получения более расширенной информации об оперативной памяти запустите команду следующим образом:

sudo dmidecode -t memory

Для более сжатой информации, выполните команду:

sudo dmidecode -t 16
udo dmidecode --type 17

Пример вывода:

# sudo dmidecode -t 16
# dmidecode 3.2
Getting SMBIOS data from sysfs.
SMBIOS 2.7 present.

Handle 0x002D, DMI type 16, 23 bytes
Physical Memory Array
Location: System Board Or Motherboard
Use: System Memory
Error Correction Type: Multi-bit ECC
Maximum Capacity: 96 GB
Error Information Handle: Not Provided
Number Of Devices: 4

Handle 0x0037, DMI type 16, 23 bytes
Physical Memory Array
Location: System Board Or Motherboard
Use: System Memory
Error Correction Type: Multi-bit ECC
Maximum Capacity: 96 GB
Error Information Handle: Not Provided
Number Of Devices: 4

В этом выводе значение строк следующее: Maximum Capacity — максимально поддерживаемое системой количество оперативной памяти Number Of Devices — количество устройств, то есть сколько слотов памяти имеется. Будьте осторожны с этими значениями, особенно на ноутбуках, поскольку это значение берётся как количество слотов, которое может поддерживать материнская плата. Но производители могут принять решение, что вместо 4 возможных слотов RAM, они паяют только 2 слота. То есть в реальности слотов может быть меньшше. Size — объём оперативной памяти Form Factor — тип модуля, например, SODIMM — это оперативная память для ноутбуков (уменьшенный размер) Type — тип памяти, например, DDR4 Speed — скорость, например, 2667 MT/s Manufacturer — производитель, например, Samsung Part Number — точное название модели оперативной памяти, например, M471A2K43CB1-CTD Minimum Voltage — минимальный вольтаж, например, 1.2 V Maximum Voltage — максимальный вольтаж, например, 1.2 V Configured Voltag — настроенный вольтаж, например, 1.2 V Чтобы показать модель, производителя и характеристики ОЗУ в Linux выполните команду:

sudo lshw -class memory

size — это общий размер оперативной памяти в системе, либо размер данного модуля product — это точная модель ОЗУ, установленной в Linux vendor — производитель clock — частота

Дополнительно

https://zalinux.ru/?p=2060
https://losst.ru/ispolzovanie-operativnoj-pamyati-linux

Получение информации о hardware — HDD

Что бы узнать какой жесткий диск установлен в вашем сервере/ПК, его производителя и технические характеристики, воспользуемся следующими утилитами:

# smartctl -i /dev/sda

Требуется установленный набор утилит smartmontools и для диска должны быть разрешено выполнение операцция со SMART-контроллером. Подробнее — в статье S.M.A.R.T: проверка HDD — описание атрибутов, значение атрибутов, утилиты, параметры.

Другой способ — утилита hdparm, позволяющая получать информацию напрямую из ядра системы. Например:

# hdparm -I /dev/sda

Ещё один вариант — утилита lshw, используемая для получения информации о любой hardware-части машины. Что бы получить информацию непосредственно о HDD — добавьте такие ключи:

# lshw -class disk -class storage

S.M.A.R.T: проверка HDD — описание атрибутов, значение атрибутов, утилиты, параметры

S.M.A.R.T. (от англ. self-monitoring, analysis and reporting technology — технология самоконтроля, анализа и отчётности) — технология оценки состояния жёсткого диска встроенной аппаратурой самодиагностики, а также механизм предсказания времени выхода его из строя.

smartctl — утилита для чтения информации SMART;

smartd — демон SMART, постоянно работающий в системе (UNIX-системы) и отслеживающий изменения параметров, умеет отправлять письмо в случае проблем. Про её установку и настройку — в другой статье.

Узнать все возможности:

# smartctl -h | less

Если система сообщает, что:

SMART Disabled. Use option -s with argument ‘on’ to enable it.

значит SMART на этом устройстве отключен. Что бы активировать его — выполните:

# smartctl -s on /dev/sda

А если надо наоборот выключить SMART — укажите:

# smartctl -s off /dev/sda

Утилита smartctl умеет проводить собственное тестирование диска, для получения более точных данных. Тесты бывают 3-х видов:

Short
Extended (Long)
Conveyance

Что бы узнать, сколько времени займёт каждый из них — выполните:

# smartctl -c /dev/sda | less

В выводе будет информация такого плана:

Short self-test routine
recommended polling time:        (   2) minutes.
Extended self-test routine
recommended polling time:        ( 78) minutes.
Conveyance self-test routine
recommended polling time:        (   5) minutes.

Что бы запустить проверку определённого типа — выполните:

# smartctl -t short /dev/sda

Проверка запускается в фоне, а нам сообщается что:

Testing has begun.
Please wait 2 minutes for test to complete.
Test will complete after Wed Feb 13 12:24:14 2013

Через две минуты можно посмотреть лог выполнения теста командой:

# smartctl -l selftest /dev/sda
smartctl 5.41 2011-06-09 r3365 [x86_64-linux-3.2.0-29-generic] (local build)
Copyright (C) 2002-11 by Bruce Allen, http://smartmontools.sourceforge.net

=== START OF READ SMART DATA SECTION ===
SMART Self-test log structure revision number 1
Num Test_Description Status Remaining LifeTime(hours) LBA_of_first_error
# 1 Short offline Completed without error 00% 0 —

Что бы остановить выполнение проверки — выполняем:

# smartctl -X

Узнать модель жесткого диска и другую информацию о нём:

# smartctl -i /dev/sda

Быстро получить общую информацию о здоровье диска можно с ключём -H:

# smartctl -H /dev/sda

Очень полезный ключ -x, который выводит всю имеющуюся информацию, в том числе — о возможных проблемах:

Так же, полезно использовать ключ -a, который выводит всю имеющуюся в SMART-контроллере информацию, среди прочего в ней имеются такие данные, которые помогут определить состояние диска:

Так же, имеется информация об ошибках на старом диске, с которого взяты примеры (кстати, он вскоре умер):

ATA Error Count: 2
Error 2 occurred at disk power-on lifetime: 9578 hours (399 days + 2 hours)
When the command that caused the error occurred, the device was active or idle.
After command completion occurred, registers were:
ER ST SC SN CL CH DH
— — — — — — —
40 51 00 da e4 3a 07 Error: UNC at LBA = 0x073ae4da = 121300186
Commands leading to the command that caused the error were:
CR FR SC SN CL CH DH DC Powered_Up_Time Command/Feature_Name
— — — — — — — — —————- ———————
25 00 08 d8 e4 3a e7 00 00:00:42.136 READ DMA EXT
25 00 08 d8 e4 3a e7 00 00:00:39.524 READ DMA EXT
25 00 08 d0 f9 0a e0 00 00:00:39.511 READ DMA EXT
25 00 08 a8 d5 60 e0 00 00:00:39.511 READ DMA EXT
25 00 08 c0 17 92 e0 00 00:00:39.505 READ DMA EXT

Error 1 occurred at disk power-on lifetime: 9578 hours (399 days + 2 hours)
When the command that caused the error occurred, the device was active or idle.
After command completion occurred, registers were:
ER ST SC SN CL CH DH
— — — — — — —
40 51 00 da e4 3a 07 Error: UNC at LBA = 0x073ae4da = 121300186
Commands leading to the command that caused the error were:
CR FR SC SN CL CH DH DC Powered_Up_Time Command/Feature_Name
— — — — — — — — —————- ———————
25 00 08 d8 e4 3a e7 00 00:00:39.524 READ DMA EXT
25 00 08 d0 f9 0a e0 00 00:00:39.511 READ DMA EXT
25 00 08 a8 d5 60 e0 00 00:00:39.511 READ DMA EXT
25 00 08 c0 17 92 e0 00 00:00:39.505 READ DMA EXT
25 00 08 a0 d5 60 e0 00 00:00:39.505 READ DMA EXT

Налицо проблемы с LBA:

LBA (англ. Logical block addressing) — механизм адресации и доступа к блоку данных на жёстком диске, при котором системному контроллеру нет необходимости учитывать геометрию самого жесткого диска (количество цилиндров, сторон, секторов на цилиндре). Контроллеры современных IDE-дисков в качестве основного режима трансляции адреса используют LBA.

Далее этот диск пошёл под тестирование Victoria — но это уже тема другой статьи, хотя лог Victoria можете оценить тут>>>.

Вернёмся к SMART.

Результаты SMART представлены в виде атрибутов (первая часть таблицы SMART Attributes Data Structure) и их значений — колонки VALUE, WORST, THRESH, TYPE и других.

Последние две колонки — WHEN_FAILED и RAW_VALUE обозначают «Когда выйдет из строя» и «Текущее значение«.

Наиболее важным для нас являются колонки «VALUE» («Normalized Value»), «RAW» («Raw Value») и «THRESH» («Threshold»).

Если значение атрибута Normalized Value меньше или равно значения Threshold — то у диска уже есть или скоро будут большие проблемы в работе и использовать его нежелательно. Максимальное значение (от 1 до 100) атрибута означает максимальную стабильность. Чем значение ниже, тем быстрее текущий параметр деградирует.

Threshold — значение, которого должен достигнуть Normalized Value этого же атрибута, чтобы состояние атрибута было признано критическим. Проще говоря, Threshold — это порог: если Normalized Value больше Threshold — атрибут в порядке; если меньше либо равен — с атрибутом проблемы. Именно по такому критерию утилиты, читающие SMART, выдают отчёт о состоянии диска либо отдельного атрибута вроде «Good» или «Bad». При этом они не учитывают, что даже при Normalized Value, большем Threshold, диск на самом деле уже может быть умирающим с точки зрения пользователя, а то и вовсе ходячим мертвецом, поэтому при оценке здоровья диска смотреть стоит всё-таки на другой класс атрибута, а именно — RAW. Однако именно значение Value, опустившееся ниже Threshold, может стать легитимным поводом для замены диска по гарантии. Т. е. при значении Normalized Value, большем Threshold, сам диск считает, что атрибут здоров, а при меньшем либо равном — что болен. Threshold — постоянный параметр, зашитый производителем в диске.

Каждый производитель использует собственные алгоритмы для вычисления параметра Normalized Value исходя из значения Raw Value.

Это относится и к другим атрибутам. К примеру, производитель Hitachi выводит информацию атрибута Power-on hours в минутах, а не часах.

Параметр «WORST» — наименьшее (наиболее близкое к показателю выхода из строя) значение. Можно использовать просто для ознакомления.

Колонка «TYPE» содержит, как правило, два параметра — Pre-fail или Old-age. Ни тот, ни другой не означают что диск скоро «умрёт. Когда параметры действительно опасны — значение колонки «WHEN_FAILED» изменится на «FAILING_NOW».

Если значение «WHEN_FAILED» тире (‘-‘) это означает что с данным атрибутом всё в порядке.

Параметр Raw Value — это текущее значение атрибута. Например, значение Raw Value 365 для Power-cycled значит, что диск включался каждый день в течении последнего года. Вообще — это самый интересный, важный и нужный для оценки показатель. В большинстве случаев он содержит в себе реальные значения, выражаемые в различных единицах измерения, напрямую говорящие о текущем состоянии диска. Основываясь именно на этом показателе, формируется значение Normalized Value. Именно умение читать и анализировать поле Raw Value даёт возможность объективно оценить состояние винчестера.

Значения атрибутов:

Примечание: БМГ — блок магнитных головок, которые производят непосредственно чтение информации с поверхности «блинов» жесткого диска.

Raw Read Error Rate — частота появления ошибок при чтении данных с диска. Данный параметр показывает частоту появления ошибок при операциях чтения с поверхности диска по вине аппаратной части накопителя;

Spin Up Time — время раскрутки шпинделя. Среднее время раскрутки шпинделя диска от 0 до рабочей скорости (как правило — 7200 об/мин, RPM — Revolution Per Minute). Предположительно, в поле Raw Value содержится время в миллисекундах/секундах;

Reallocated Sector Count — количество переназначенных секторов. Когда жесткий диск встречает ошибку чтения/записи/верификации — он пытается переместить данные из него в специальную резервную область (Spare Area) и, в случае успеха, помечает сектор как «переназначенный». Также, этот процесс называют Remapping, а переназначенный сектор — Remap. Благодаря этой возможности, на современных жестких дисках очень редко видны (при тестировании поверхности) так называемые Bad Block. Однако, при большом количестве Remaps, на графике чтения с поверхности будут заметны «провалы» — резкое падение скорости чтения (до 10% и более). Поле Raw Value содержит общее количество переназначенных секторов;

Throughput Performance — средняя производительность (пропускная способность) диска. Уменьшение значения Normalized Value этого атрибута с большой вероятностью указывает на проблемы в накопителе;

Start/Stop Count — количество циклов запуск/останов шпинделя. Поле Raw Value хранит общее количество включений/выключений диска;

Read Channel Margin — запас канала чтения. Назначение этого атрибута не документировано и в современных накопителях не используется;

Seek Error Rate — частота появления ошибок позиционирования БМГ. В случае сбоя в механической системе позиционирования, повреждения сервометок (Servo), сильного термического расширения дисков и т.п. возникают ошибки позиционирования. Чем их больше — тем хуже механика и/или поверхности жесткого диска;

Seek Time Performance — средняя производительность операций позиционирования БМГ. Данный параметр показывает среднюю скорость позиционирования привода БМГ на указанный сектор. Снижение значения этого атрибута говорит о неполадках в механике привода;

Power-On Hours — количество отработанных часов во включенном состоянии. Поле Raw Value этого атрибута показывает количество часов (минут, секунд — в зависимости от производителя), отработанных жестким диском. Снижение значения (Normalized Value) атрибута до критического уровня (Threshold) указывает на выработку диском ресурса (MTBF — Mean Time Between Failures). На практике, даже падение этого атрибута до нулевого значения не всегда указывает на реальное исчерпывание ресурса и накопитель может продолжать нормально функционировать;

Spin Retry Count — количество повторов попыток старта шпинделя диска. Данный атрибут фиксирует общее количество попыток раскрутки шпинделя и его выхода на рабочую скорость, при условии, что первая попытка была неудачной. Снижение значения этого атрибута говорит о неполадках в механике привода;

Recalibration Retries — количество повторов попыток рекалибровки накопителя. Данный атрибут фиксирует общее количество попыток сброса состояния накопителя и установки головок на нулевую дорожку, при условии, что первая попытка была неудачной. Снижение значения этого атрибута говорит о неполадках в механике привода;

Device Power Cycle Count — количество полных циклов запуска/остановки жесткого диска;

Soft Read Error Rate — частота появления «программных» ошибок при чтении данных с диска. Данный параметр показывает частоту появления ошибок при операциях чтения с поверхности диска по вине программного обеспечения, а не аппаратной части накопителя;

End-to-End error — данный атрибут-часть технологии HP SMART IV, это означает, что после передачи через кэш памяти буфера данных паритет данных между хостом и жестким диском не совпадают;

Reported UNC Errors — ошибки, которые не могли быть восстановлены, используя методы устранения ошибки аппаратными средствами;

Load/Unload cycle count — количество циклов вывода БМГ в специальную парковочную зону/в рабочее положение. Подробнее — см. описание технологии Head Load/Unload Technology тут>>>;

Drive Temperature — температура. Данный параметр отражает в поле Raw Value показание встроенного температурного сенсора в градусах Цельсия;

Reallocation Event Count — количество операций переназначения (Remapping). Поле Raw Value этого атрибута показывает общее количество попыток переназначения сбойных секторов в резервную область, предпринятых накопителем. При этом, учитываются как успешные, так и неудачные операции;

Current Pending Sector Count — текущее количество нестабильных секторов. Поле Raw Value этого атрибута показывает общее количество секторов, которые накопитель в данный момент считает претендентами на переназначение в резервную область (Remap). Если в дальнейшем какой-то из этих секторов будет прочитан успешно, то он исключается из списка претендентов. Если же чтение сектора будет сопровождаться ошибками, то накопитель попытается восстановить данные и перенести их в резервную область, а сам сектор пометить как переназначенный (Remapped). Постоянно ненулевое значение Raw Value этого атрибута говорит о низком качестве (отдельной зоны) поверхности диска;

Uncorrectable Sector Count — количество нескорректированных ошибок. Атрибут показывает общее количество ошибок, возникших при чтении/записи сектора и которые не удалось скорректировать. Рост значения в поле Raw Value этого атрибута указывает на явные дефекты поверхности и/или проблемы в работе механики накопителя;

UltraDMA CRC Error Count — общее количество ошибок CRC в режиме UltraDMA. Поле Raw Value содержит количество ошибок, возникших в режиме передачи данных UltraDMA в контрольной сумме (ICRC — Interface CRC). Практика, собранная статистика и изучение журналов ошибок SMART показывают: в большинстве случаев ошибки CRC возникают при сильном завышении частоты PCI (больше номинальных 33.6 MHz), сильно перекрученом кабеле, а также — по вине драйверов ОС, которые не соблюдают требований к передачи/приему данных в режимах UltraDMA;

Write Error Rate (Multi Zone Error Rate)— частота появления ошибок при записи данных. Показывает общее количество ошибок, обнаруженных во время записи сектора. Чем больше значение в поле Raw Value (и ниже значение Normalized Value), тем хуже состояние поверхности диска и/или механики привода;

Disk Shift — сдвиг пакета дисков относительно оси шпинделя. Актуальное значение атрибута содержится в поле Raw Value. Единицы измерения — не известны. Подробности — см. в описании технологии G-Force Protection, например — тут>>>. Сдвиг пакета дисков возможен в результате сильной ударной нагрузки на накопитель в результате его падения или по иным причинам;

G-Sense Error Rate — частота появления ошибок в результате ударных нагрузок. Данный атрибут хранит показания ударочувствительного сенсора — общее количество ошибок, возникших в результате полученных накопителем внешних ударных нагрузок (при падении, неправильной установки, и т.п.). Подробнее — см. описание технологии G-Force Protection;

Loaded Hours — нагрузка на привод БМГ, вызванная общей наработкой часов накопителем. Учитывается только период, в течении которого головки находились в рабочем положении;

Load/Unload Retry Count — нагрузка на привод БМГ, вызванная многочисленными повторениями операций чтения, записи, позиционирования головок и т.п. Учитывается только период, в течении которого головки находились в рабочем положении;

Load Friction — нагрузка на привод БМГ, вызванная трением в механических частях накопителя. Учитывается только период, в течении которого головки находились в рабочем положении;

Load/Unload Cycle Count — общее количество циклов нагрузки на привод БМГ. Учитывается только период, в течении которого головки находились в рабочем положении;

Load-in Time — общее время нагрузки на привод БМГ. Предположительно — данный атрибут показывает общее время работы накопителя под нагрузкой, при условии, что головки находятся в рабочем состоянии (вне парковочной зоны);

Torque Amplification Count — количество усилий вращающего момента привода;

Power-Off Retract Count — количество зафиксированных повторов включения/выключения питания накопителя;

GMR Head Amplitude — амплитуда дрожания GMR-головок (GMR-Head) в рабочем состоянии.

ВАЖНО: для всех атрибутов лучше меньшее (или уменьшающееся) значение, что можно определить периодически проводя проверки. Исключение — следующие атрибуты:

Throughput Performance — общая производительность диска. Если значение атрибута уменьшается, то велика вероятность, что с диском есть проблемы.

и:

Seek Time Performance — средняя производительность операции позиционирования магнитными головками. Если значение атрибута уменьшается (замедление позиционирования), то велика вероятность проблем с механической частью привода головок.

Критичные атрибуты, на которые необходимо обращать особое внимание:

* Raw Read Error Rate
* Spin Up Time
* Spin Up Retry Count
* Seek Error Rate
* Reallocated Sector Coun

Для сравнения с результатами SMART, приведёнными в статье выше — результат с диска, который был только что распечатан:

SMART Attributes Data Structure revision number: 16
Vendor Specific SMART Attributes with Thresholds:
ID# ATTRIBUTE_NAME          FLAG     VALUE WORST THRESH TYPE      UPDATED WHEN_FAILED RAW_VALUE
1 Raw_Read_Error_Rate     0x002f   100   253   051    Pre-fail Always       —       0
3 Spin_Up_Time            0x0027   100   253   021    Pre-fail Always       —       0
4 Start_Stop_Count        0x0032   100   100   000    Old_age   Always       —       1
5 Reallocated_Sector_Ct   0x0033   200   200   140    Pre-fail Always       —       0
7 Seek_Error_Rate         0x002e   100   253   000    Old_age   Always       —       0
9 Power_On_Hours          0x0032   100   100   000    Old_age   Always       —       0
10 Spin_Retry_Count        0x0032   100   253   000    Old_age   Always       —       0
11 Calibration_Retry_Count 0x0032   100   253   000    Old_age   Always       —       0
12 Power_Cycle_Count       0x0032   100   100   000    Old_age   Always       —       1
192 Power-Off_Retract_Count 0x0032   200   200   000    Old_age   Always       —       1
193 Load_Cycle_Count        0x0032   200   200   000    Old_age   Always       —       3
194 Temperature_Celsius     0x0022   118   116   000    Old_age   Always       —       25
196 Reallocated_Event_Count 0x0032   200   200   000    Old_age   Always       —       0
197 Current_Pending_Sector 0x0032   200   200   000    Old_age   Always       —       0
198 Offline_Uncorrectable   0x0030   100   253   000    Old_age   Offline      —       0
199 UDMA_CRC_Error_Count    0x0032   200   253   000    Old_age   Always       —       0
200 Multi_Zone_Error_Rate   0x0008   100   253   000    Old_age   Offline      —       0

SMART Error Log Version: 1
No Errors Logged

И пара полезных примеров работы утилиты dd.

Иногда требуется удалить все данные с диска, для этого — «забьём» диск нулями — например, во время выполнения тестов на нём, или — что бы скрыть информацию:

# dd if=/dev/zero of=/dev/sda

Быстрый способ проверить HDD на наличие Bad-Blocks («битых» блоков):

# dd if=/dev/sda of=/dev/null bs=512

Сброс пароля IPMI на серверах Supermicro

Утилита IPMICFG предназанчена для работы со встроенным контроллером BMC. Утилита позволяет вносить изменения в настройки работы контроллера, например, изменить параметры сети, режим работы вентиляторов, внести изменения в список пользователей и их роли, итд. Утилита бывает для разных платформ, Linux, Windows и DOS.
Если у Вас установлена и работает ОС семейства Linux, то надо скачать и разархивировать IPMICFG_1.32.0_build.200910.zip в /home/agis

$ cd
$ unzip IPMICFG_1.32.0_build.200910.zip
$ sudo -i

Получить IP контроллера BMC

$ sudo /home/agis/IPMICFG_1.32.0_build.200910/Linux/64bit/IPMICFG-Linux.x86_64 -m
IP=192.168.0.101
MAC=1C:EC:EF:85:44:25

Список пользователей

# /home/agis/IPMICFG_1.32.0_build.200910/Linux/64bit/IPMICFG-Linux.x86_64 -user list
Maximum number of Users          : 10
Count of currently enabled Users : 2
User ID | User Name        | Privilege Level | Enable
------- | ---------        | --------------- | ------
      2 | agis             | Administrator   | Yes

Установить для пользователя ID=2 пароль 12345678

# /home/agis/IPMICFG_1.32.0_build.200910/Linux/64bit/IPMICFG-Linux.x86_64 -user setpwd 2 12345678

Добавить пользователя id пользователя=3, пользователь newuser, пароль 12345678, уровня Administrator (4)

# /home/agis/IPMICFG_1.32.0_build.200910/Linux/64bit/IPMICFG-Linux.x86_64 -user add 3 newuser 12345678 4
# /home/agis/IPMICFG_1.32.0_build.200910/Linux/64bit/IPMICFG-Linux.x86_64 -user list
Maximum number of Users          : 10
Count of currently enabled Users : 3
User ID | User Name        | Privilege Level | Enable
------- | ---------        | --------------- | ------
      2 | agis             | Administrator   | Yes
      3 | newuser          | Administrator   | Yes

Удалить пользователя ID=3

# /home/agis/IPMICFG_1.32.0_build.200910/Linux/64bit/IPMICFG-Linux.x86_64 -user del 3

Список уровня привелегий

# /home/agis/IPMICFG_1.32.0_build.200910/Linux/64bit/IPMICFG-Linux.x86_64 -user help
For privilege level:
Administrator : 4
Operator : 3
User : 2
Callback : 1
No Access : 15

Если на сервер не установлена ОС, то можно создать USB DOS boot flash, например воспользуйтесь утилитой Rufus

Разархивируем и копируем на флешку PMICFG_1.32.0_build.200910\DOS. Загружаемся с флешки и переходим в каталог с нашей утилитой. Далее запускаем команды описанные выше, но использовать команду IPMICFG.exe вместо IPMICFG-Linux.x86_64

Скачать утилиты IPMICFG можно на сайте https://www.supermicro.com/SwDownload/SwSelect_Free.aspx?cat=IPMI или в конце данной страницы.

Управление swap

Если вам необходимо добавить swap на сервер Linux, используйте данную инструкцию. Переходим в режим sudo:

Теперь создаем файл следующей командой:

# dd if=/dev/zero of=/swapfile bs=1G count=4

Вывод этой команды:

2+0 records in

2+0 records out

2147483648 bytes (2.1 GB) copied, 20.2256 s, 106 MB/s

Просмотрим что файл создался:

# ls -lh /swapfile

-rw-r—r— 1 root root 2.0G Oct 29 14:07 /swapfile

Можно так же использовать команду fallocate, которая

# fallocate -l 1G /swapfile-1

# ls -lh /swapfile-1

-rw-r—r— 1 root root 1.0G Oct 29 14:11 /swapfile-1

Назначаем права на папки:

# chown root:root /swapfile

# chmod 0600 /swapfile

# ls -lh /swapfile

-rw——- 1 root root 2.0G Oct 29 14:07 /swapfile

Включаем swap следующей командой:

# mkswap /swapfile

Вывод команды:

Setting up swapspace version 1, size = 2097148 KiB

no label, UUID=10231c61-6e55-4dd3-8324-9e2a892e7137

Активируем swap:

# swapon /swapfile

Проверяем подключился ли swap:

# swapon -s

Вывод команды:

FilenameTypeSizeUsedPriority

/dev/sda5 partition3998716704-1

/swapfile file20971480-2

как выключить swap файл:

# swapoff /swapfile

# swapon -s

для автоматического подключения файла swap, используем fstab:

# vi /etc/fstab

/swapfile none swap sw 0 0

Параметр ядра Linux vm.swappiness.

Узнать его текущее значение на вашей системе можно так:

$ cat /proc/sys/vm/swappiness

Ответ будет 60 почти наверняка. Это значит, что ядро Linux начинает свопить редко используемые страницы оперативной памяти, когда использование свободной оперативной памяти достигает 100%-60%=40%. Часто встречаются рекомендации поставить, например, vm.swappiness=10, чтобы своп не начинал использоваться, пока загрузка ОЗу не достигнет 90%.

Настроим производительность swap файла на сервере:

$ sudo sysctl vm.swappiness=10

Добавить в /etc/sysctl.conf
vm.swappiness=10

Supermciro. Настройка IPMI из операционной системы

Linux 64bit: Execute /Linux/64bit/IPMICFG-Linux.x86_64

# -m
# Shows IP and MAC.
$ sudo ./IPMICFG-Linux.x86_64 -m
IP=192.168.0.147
MAC=00:25:90:A1:22:0A

# -user list
# Lists user privilege
$ sudo ./IPMICFG-Linux.x86_64 -user list
Maximum number of Users          : 10
Count of currently enabled Users : 3
User ID | User Name        | Privilege Level | Enable
------- | ---------        | --------------- | ------
      2 | agis             | Administrator   | Yes
      3 | fwupd            | Administrator   | Yes

# -user setpwd  
# Updates a user password.
$ sudo ./IPMICFG-Linux.x86_64 -user setpwd 2 somePassword

# Добавить пользователя с id=3 и уровнем администратор=4
$ sudo ./IPMICFG-Linux.x86_64 -user add 3 agis newpassword 4

#	Тип файл	Размер файла	Скачать
1	.zip	1,74 МБ	IPMICFG_1.32.0_build.200910
2	.zip	108,54 МБ	SMCIPMITool_2.24.0_build.201007_bundleJRE_Windows

АГИС Администрирование

Работа с сервером

Мониторинг темературы ubuntu

Характеристики системы

Проверьте скорость жесткого диска в Ubuntu Linux

Проверьте скорость ОЗУ в Ubuntu Linux

Процессоры

ОЗУ и swap

Дополнительно

Получение информации о hardware — HDD

S.M.A.R.T: проверка HDD — описание атрибутов, значение атрибутов, утилиты, параметры

Сброс пароля IPMI на серверах Supermicro

Управление swap

Параметр ядра Linux vm.swappiness.

Supermciro. Настройка IPMI из операционной системы

Прикрепленные файлы

#

Тип файл

Размер файла

Скачать

Вам может быть интересно