У меня есть несколько повторяющихся сообщений в Maildir моего IMAP-сервера. Какой лучший способ их удалить?
Некоторые важные моменты:
- Shared Message-ID обычно является достаточно хорошим определением дубликата. Крошечный скрипт, который удаляет все, кроме одного из повторяющихся сообщений, будет работать.
- Иногда необходимо найти дубликаты на основе общих тел сообщений. Какое здесь разумное определение? Побитовый эквивалент? Как насчет странных различий в переносе строк, экранировании, кодировании символов?
- Иногда между «повторяющимися» сообщениями есть существенная разница. Как лучше всего рассмотреть различия в наборах «дублирующих» сообщений? Diffs?
для универсальных файлов в linux я использую утилиты fdupes для удаления дубликатов файлов. Я обнаружил, что это также работает для сообщений Maildir.
источник
.forward
или как-то еще, будет иметь несколько разные заголовки, поэтому, хотя само сообщение является дубликатом, двух файлов, содержащих две копии, может не быть.Evolution [графический агент пользователя почты] Gnome имеет встроенную функцию удаления дубликатов почты. Как объяснено на этой странице справки , это сводится к:
Вуаля.
PS Evolution может получить доступ к вашим сообщениям локально (MailDir, MH, Mbox) или через IMAP.
источник
Лучшее , что я нашел сегодня Кевин Deldycke в Maildir-Дедуплицировать .
X-MIMETrack
заголовок по умолчанию и сравнивает заголовки, используяSHA224
дайджест.Могу поспорить, что кто-то может сделать что-то необычное из delIMAPdups.pl Рика Сандерса , часть его инструментов IMAP .
источник
maildir-deduplicate
переехал на новое место, поэтому я обновил ссылку. Однако ваша информация сейчас устарела.