Ежедневно / Еженедельно / Ежемесячно / Ежегодно Задачи Сисадмина

8

Вероятно, это должно быть сообщество вики. Я пытаюсь составить список всех задач системного администратора, которые мы должны выполнять на регулярной основе, потому что я считаю, что в нашей компании недостаточно. Ситуация здесь такова, что устранять проблемы неудобно, но у нас нет времени на профилактическое обслуживание или постоянное улучшение.

Ежедневно:

  • замена ночной резервной ленты / диска
  • убедитесь, что обновления антивируса были распространены на все системы

Еженедельно:

  • поменять еженедельную резервную ленту / диск
  • очистить временные файлы со всех систем
  • дефрагментировать все системы

Ежемесячно:

  • план улучшения инфраструктуры
  • доставить / отправить устаревшее оборудование на утилизацию электроники
  • восстановить или заменить устаревшие рабочие станции
  • тестовое восстановление из резервной копии

Годовой:

  • восстановить или заменить устаревшие серверы
  • заменить батареи ИБП
Скотт
источник
Вы правы, это должно быть сообщество вики. Кроме того, не спешите разделять такие задачи. Например, планирование, восстановление машин и т. д. должно выполняться по мере необходимости, а не как еженедельная (или любой другой конкретный период) задача.
Джон Гарденье

Ответы:

7

Если у вас недостаточно времени для профилактического обслуживания и вы проводите большую часть времени в решении проблем, необходимо пересмотреть всю методологию. Вместо того, чтобы говорить вам, что вы должны делать каждый период, я дам вам несколько идей, чтобы вам не приходилось что-то делать.

Во-первых, вам нужна хорошая система мониторинга и как можно больше автоматизации. Эти два элемента должны высвободить больше времени, чем многие администраторы понимают, до тех пор, пока они не настроят его должным образом.

Вот лишь несколько вещей, которые ваша система мониторинга должна делать для вас:

  • Оповещать вас, когда очереди почтовых или спам-фильтров становятся слишком большими или слишком внезапными.
  • Оповещение о том, что дисковое пространство становится слишком низким, загрузка ЦП становится слишком высокой и т. Д.
  • Запишите такие вещи, как использование диска, чтобы вы могли видеть тенденции с течением времени.
  • То же самое с почтовыми ящиками.
  • Оповещать вас, когда брандмауэр регистрирует ненормальное количество обращений.
  • То же самое для всего, что служит внешнему миру. например, DNS и веб-серверы.
  • Оповещать вас, если обновления AV слишком устарели, если программное обеспечение AV отключено или удалено на каком-либо компьютере.

Дефрагментация даже не должна быть в вашем списке задач, потому что это должен быть автоматизированный процесс. Через заданный интервал времени сервер должен выполнить проверку диска и выполнить дефрагментацию после перезагрузки. Подумайте о том, чтобы связать это с системой для установки обновлений и исправлений в очереди (которые ранее были протестированы на непроизводственной машине).

Временные папки также могут быть очищены с помощью автоматизации. Я создаю простое приложение, которое запускается после перезагрузки, которое ждет 10 минут, а затем очищает все временные местоположения. Задержка состоит в том, чтобы гарантировать, что он не удалит файлы, которые могут потребоваться для установки или обновления, которое завершается после перезагрузки (узнал, что трудный путь!).

Одна вещь, которую вы должны сделать вручную в любой подходящий для вас период времени, это контролировать систему мониторинга и автоматизации, просто чтобы быть в безопасности. Я проверяю свою ежедневно, но фактически не сталкивался с проблемой больше года.

Когда у вас все в порядке с вашей системой и автоматизацией, убедитесь, что у вас также есть система контроля версий, чтобы вставить ее. Может быть очень неприятно обнаружить, что последний маленький трюк сломал что-то еще, но вы не можете точно вспомнить, что вы изменили.

Джон Гарденье
источник
Какая единая система мониторинга может сделать все это? Если это существует, я хочу это!
Cypher
@Cypher, ты думаешь слишком узко. Одна система мониторинга обычно включает в себя несколько компонентов, таких как Nagios и MRTG, точно так же, как ОС - это более одного компонента.
Джон Гарденерс
Полагаю, я действительно надеялся, что пропустил какой-то удивительный инструмент, который мог бы заменить дюжину или около того инструментов, которые я сейчас использую для всех этих вещей. :) +1 для средств автоматизации и автоматического мониторинга: если мне нужно что-то делать несколько раз, это автоматизируется.
Cypher
@Cypher, этот удивительный сбор, который ты ищешь, не более чем сам компьютер. Пусть это сработает для вас, а не для вас. ;)
Джон Гарденье
1

В «Daily» я бы проверял журналы событий вручную или с помощью какого-либо сценария.

Возможно, Ежемесячно может включать обновления ОС?

Я бы также сказал, что ежегодно смотрите, где находится обслуживание / гарантия на ваших серверах.

Кристофер
источник
1

Ежемесячно:

  • проверить использование инфраструктуры - это, возможно, смешано с битом «улучшения инфраструктуры плана», но вы не можете строить планы, если не знаете (то есть «имеете надежные данные»), какие биты нуждаются в улучшении.

Ежеквартально:

  • Проверьте отказоустойчивость инфраструктуры - от уровня приложения (веб-сервер, электронная почта) до сетевого уровня (коммутатор, сетевая связь) и физического уровня (питание), если у вас есть избыточность в системе, которую вы можете спасти, это необходимо поддерживать и периодически проверять.
pjz
источник
1

Вот некоторые ежемесячные резервные копии, о которых вы, возможно, и не думали:

1) Даже если автоматизирован, я все равно копирую свою конфигурацию сетевого коммутатора на локальный компьютер
2) Конфигурации брандмауэра
3) SAN-конфиги
4) экспортированные конфиги ISA (win 2003)
5) Статическое резервирование DHCP (win 2008)
6) DNS записи (победа 2008)
7) Ключи шифрования (хранящиеся в двоичных файлах) для KeePass, тем более что наши резервные копии зашифрованы - дополнительно сохраняются за пределами наших систем резервного копирования.
8) наша папка с документацией по ИТ, дополнительно сохраненная вне наших систем резервного копирования
jftuga
источник
0

В Daily я мог бы порекомендовать вам добавить подписку на известные списки рассылки об уязвимостях исправлений и начать процесс исправления / обновления.

Это может происходить только раз в месяц, но достаточно одного пропущенного сообщения об уязвимости продуктов, чтобы вызвать серьезные сбои.

Я думаю, что это может быть сокращено в пару слов, чтобы поместиться в одну строку, если вы согласны.

КСТАТИ; Это отличный список, я с нетерпением жду его завершения /.

Ник О'Нил
источник
0

Внутренний аудит:

  • Сравните запущенные системы со списком резервируемых систем. Что-нибудь проникло в производство без резервного копирования? (по крайней мере, ежемесячно, если не чаще, в зависимости от объема развертывания)
  • Посетите свои кассеты, если у вас есть хранилище за пределами площадки. Убедитесь, что они там, где они должны быть. (один или два раза в год)
damorg
источник