Я просматривал папку со спамом (что я редко делаю, потому что в Gmail редко бывают ложные срабатывания), и я заметил кое-что интересное:
Примерно в более чем половине сообщений есть по крайней мере один анимированный смайлик в теме.
Никто из моих друзей не использовал бы это дерьмо. Ни одна действительная компания, с которой я бы имел дело, никогда бы этого не сделала.
Как создать фильтр для автоматического удаления сообщений с анимированными смайликами в теме?
Используя jamesmstone ключ «s ниже, я попробовал поиск с subject:=?UTF-8?
и subject:"=?UTF-8?"
и несколько других перестановок, но никто не работал.
Вот примерный набор заголовков из одной из этих дымящихся куч:
Delivered-To: [redacted]@gmail.com
Received: by 10.107.28.200 with SMTP id c191csp1104992ioc;
Sun, 24 Jan 2016 19:07:16 -0800 (PST)
X-Received: by 10.107.38.5 with SMTP id m5mr15068933iom.15.1453691236564;
Sun, 24 Jan 2016 19:07:16 -0800 (PST)
Return-Path: <VivaLoan@mythirdxyz.xyz>
Received: from mythirdxyz.xyz ([2a04:5b00:a2d0:3d74:37fd:ee71:efe6:6e11])
by mx.google.com with ESMTP id o10si8722554igw.41.2016.01.24.19.07.15
for <[redacted]@gmail.com>;
Sun, 24 Jan 2016 19:07:16 -0800 (PST)
Received-SPF: pass (google.com: domain of VivaLoan@mythirdxyz.xyz designates 2a04:5b00:a2d0:3d74:37fd:ee71:efe6:6e11 as permitted sender) client-ip=2a04:5b00:a2d0:3d74:37fd:ee71:efe6:6e11;
Authentication-Results: mx.google.com;
spf=pass (google.com: domain of VivaLoan@mythirdxyz.xyz designates 2a04:5b00:a2d0:3d74:37fd:ee71:efe6:6e11 as permitted sender) smtp.mailfrom=VivaLoan@mythirdxyz.xyz;
dkim=pass header.i=@mythirdxyz.xyz;
dmarc=pass (p=REJECT dis=NONE) header.from=mythirdxyz.xyz
DKIM-Signature: v=1; a=rsa-sha256; c=relaxed/relaxed; d=mythirdxyz.xyz;
i=@mythirdxyz.xyz; q=dns/txt; s=default; t=1453691229;
bh=GuM9JCP4yh7WfVbRBortR7UAr6DAtlgy0oTCna0iWQk=; h=MIME-Version :
Content-Type : Content-Transfer-Encoding : To : From : Subject : Date :
Message-ID : From : Subject : Date;
b=e/zS14UB4o5MhYlfbpsy0h2G/oZyoC5H3ouyhNh13zcSHSNXzI6uvJpIy9a+za2ng26Xe2
NfAI7nenAMCdHJSGF4yfmtTi3+XrR2MqQPHQ1fzTXGhRy/ktCj4tEqt7DhSxnRCqkYFUNaLA
wh3FMLr6IxPi2Z7xUXm3JBffhDcSU=
MIME-Version: 1.0
Content-Type: text/html; charset="utf-8"
Content-Transfer-Encoding: base64
To: [redacted]@gmail.com
From: "APPROVAL DEPARTMENT" <VivaLoan@mythirdxyz.xyz>
Subject: =?utf-8?q?=F3=BE=93=A0_Personal_loan_as_soon_as_tomorrow_=F3=BE=93=A0?=
Date: Sun, 24 Jan 2016 19:07:09 -0800
Message-ID: <A112ED51-1674-4902-BF73-F2EBCBA42CAF@mythirdxyz.xyz>
gmail
gmail-filters
emoji
пиво
источник
источник
goomoji
...Ответы:
Краткий ответ
Вместо использования фильтров Gmail, которые зависят от функции поиска Gmail, для поиска закодированных смайликов в оригинальных сообщениях, создайте сценарий, используя метод GmailMessage :: getRawContent () скрипта Google Apps для обработки сообщений.
Смежные вопросы
Ниже приведены ссылки на ответы на похожие вопросы на этом сайте, включая сценарии с использованием указанного метода.
источник
Я создал скрипт Google Apps для таких целей.
Это на Github: https://github.com/spamzero/spamzero
Он позволяет вам создавать всевозможные расширенные правила, которые вы можете сопоставить со своей папкой спам-сообщений, поэтому сообщения, которые определенно являются спамом, будут автоматически очищаться.
источник
Это не совсем то, что вы просите (отфильтровывать сами смайлики, а не сообщения с смайликами), но вы можете найти часть контента полезной для создания лучшего фильтра сообщений.
Теперь существует сценарий Greasemonkey / Tampermonkey / Violentmonkey с открытым исходным кодом, позволяющий избавиться от этих раздражающих визуальных тараканов (только персонажи, а не сами сообщения):
Gmail Тема сообщения Emoji Roach Motel
Посмотрев на источник этого скрипта , вы увидите, что есть два основных типа тараканов смайликов, которые вы найдете в письмах от злоумышленников (в настоящее время, к сожалению, включая eBay и Amazon):
Тараканы на основе HTML-изображений (включая ужасных анимированных) aka goomoji
Тараканы в Юникоде. Существует еще много смайликов (и других последовательностей Юникода, генерирующих изображения), которые спаммеры и другие бывшие маркетологи начинают использовать в строках темы электронной почты и которые gmail не конвертирует в изображения HTML. В некоторых браузерах они отображаются жирным шрифтом и цветом, что почти так же плохо, как анимация. Браузеры также могли бы анимировать их, но я не знаю, делают ли они это. Эти последовательности Unicode отображаются браузером как текст Unicode, поэтому точный внешний вид (цветной или нет, анимированный или нет, ...) зависит от того, какую систему рендеринга текста использует браузер. Внешний вид данного эмодзи Unicode также зависит от любых селекторов вариаций Unicode и модификаторов emojiкоторые появляются рядом с ним в последовательности кодовых точек Unicode. В отличие от эмодзи-спама на основе изображений, эти последовательности можно копировать и вставлять из браузера и в другие приложения в виде текста Unicode.
Для последнего типа пользовательский скрипт включает в себя регулярное выражение, предназначенное для захвата последовательностей Unicode, которые могут быть использованы маркетологами. Регулярное выражение выглядит следующим образом в ES6 Javascript (пользовательский скрипт переводит это в широко поддерживаемое регулярное выражение до ES6, используя потрясающий ES6 Regex Transpiler ):
источник