Казалось бы, чего проще, MTBF (Mean Time Between Failure) - «среднее время между возникновениями отказов», измеряется в часах. Любой человек, который поинтересуется значением, которое приводит производитель, и проделав небольшие расчеты, наверняка будет удивлен его странной величиной.
Для многих современных HDD величина MTBF легко может перевалить за миллион часов, а исходя из того, что в году приблизительно 8760 часов, получаем что 1000000/8760=114,155, т.е. более ста лет. Но те, у кого хоть раз выходили из строя жесткие диски, наверняка будут удивлены такой цифрой.
Так что же берутся эти миллионы часов MTBF? И что они означают?
В условиях современного рынка ни один производитель жестких дисков не будет тестировать свою продукцию в течении нескольких десятков лет, оценка производится искусственно, экстраполируя статистические данные.
При испытаниях надежности компьютерных компонентов их надежность определяется по следующей формуле:
MTBF = T*N/No
где: Т - время проведения испытаний, N - количество тестируемых изделий, No - количество изделий, вышедших из строя за время тестирования.
Т.е. получается, что если испытывалось 100 изделий в течении года(8760 часов), и за это время два устройства вышло из строя, то MTBF будет равен 8760*100/2 = 438000 часов. Если «немного» округлить, то получается пол миллиона часов. Или, с тем же успехом, можно протестировать 1200 дисков в течении месяца (730 часов), получить два выхода из строя, и в итоге цифра будет те же 438000 часов (730*1200/2).
Если посмотреть на те сноски, которые пишут в даташитах мелкими буквами, то там будет примерно следующее (в вольном переводе):
MTBF измеряется для всех эксплуатируемых дисков данной модели, оценивается на основе статистического анализа данных измерений при средних условиях эксплуатации и распространяется на период объявленного гарантийного срока.
Т.е. если представить ситуацию, что у нас в компьютере стоит один жесткий диск, у которого MTBF объявлен в миллион часов (114 лет), который отработав положенные два года гарантии будет заменен на новый, который также будет заменен по истечении гарантийного срока, и так далее. таким образом за 114 лет MBTF при гарантии в два года мы заменим 57 винчестеров. И из этих 57 дисков один до конца гарантийного срока не доработает.
Хотя такое приближение не совсем верное, ведь в статистике слишком маленькая выборка снижает качество результатов.
Более верной будет следующая ситуация: в неком датацентре в сервера установлены много тысяч HDD, с гарантийным сроком в два года, и для них производитель декларирует MTBF равный миллиону часов. Т.к. при увеличении количества устройств вероятность отказа растет пропорционально количеству, мы в праве ожидать, что примерно каждый из 57ми установленных НЖМД выйдет из строя до истечения сроков гарантии.
На практике же, гораздо показательнее вместо MTBF использовать другим параметром: AFR (annual failure rate - годовая интенсивность отказов). В простейшем виде вычисляется по формуле
AFR=1/(MTBF/8760)
Т.е. при MTBF в миллион часов получается что AFR равен 0,00876 ( 1/(1000000/8760)), или 0,876% жестких дисков попадает под гарантийные обязательства. Что вполне согласуется с практическими показателями отказов.
Проверим расчеты? Взяв все те же миллион часов MTBF, два года срок гарантии, и AFR в 0,00876 в год, получаем, что за два года суммарный AFR будет 0,01752, 1/0,01752=57,0776, что примерно равно нашим выше рассчитанным «примерно каждый из 57ми».
На практике так же применяется следующая формула расчета AFR:
AFR=12*No/Ns
где: No - количество отказавших устройств, доставленное в сервисный центр в течении месяца Ns - количество проданных устройств в течении месяца. *Обычно рассчитывается по итогам продаж в течении года.
В заключении хотелось бы сказать, что параметр частоты отказов интересен скорее не для частного использования, а для крупных компаний, имеющих в работе несколько десятков-сотен-тысяч устройств, позволяя рассчитать затраты на обслуживание, в том числе, на основе того, как часто будут выходить диски из строя, сколько необходимо персонала для их замены, какое количество дисков необходимо иметь в запасе для быстрой замены вышедших из строя, и т.д.
|
Комментарии
Допишу его до статьи, и выложу на сайт...