Напишите функцию или программу для проверки адреса электронной почты в соответствии с RFC 5321 (некоторые грамматические правила, найденные в 5322 ) с той возможностью, что вы можете игнорировать комментарии и сворачивать пробельные символы ( CFWS
) и обобщенные литералы адресов. Это дает грамматику
Mailbox = Local-part "@" ( Domain / address-literal )
Local-part = Dot-string / Quoted-string
Dot-string = Atom *("." Atom)
Atom = 1*atext
atext = ALPHA / DIGIT / ; Printable US-ASCII
"!" / "#" / ; characters not including
"$" / "%" / ; specials. Used for atoms.
"&" / "'" /
"*" / "+" /
"-" / "/" /
"=" / "?" /
"^" / "_" /
"`" / "{" /
"|" / "}" /
"~"
Quoted-string = DQUOTE *QcontentSMTP DQUOTE
QcontentSMTP = qtextSMTP / quoted-pairSMTP
qtextSMTP = %d32-33 / %d35-91 / %d93-126
quoted-pairSMTP = %d92 %d32-126
Domain = sub-domain *("." sub-domain)
sub-domain = Let-dig [Ldh-str]
Let-dig = ALPHA / DIGIT
Ldh-str = *( ALPHA / DIGIT / "-" ) Let-dig
address-literal = "[" ( IPv4-address-literal / IPv6-address-literal ) "]"
IPv4-address-literal = Snum 3("." Snum)
IPv6-address-literal = "IPv6:" IPv6-addr
Snum = 1*3DIGIT
; representing a decimal integer value in the range 0 through 255
Примечание: я пропустил определение, IPv6-addr
потому что этот конкретный RFC ошибается и запрещает, например ::1
. Правильная спецификация в RFC 2373 .
ограничения
Вы не можете использовать любые существующие вызовы библиотеки проверки электронной почты. Однако вы можете использовать существующие сетевые библиотеки для проверки IP-адресов.
Если вы пишете функцию / метод / оператор / эквивалент, она должна взять строку и вернуть логическое или истинное / ложное значение, соответствующее вашему языку. Если вы пишете программу, она должна взять одну строку из stdin и указать действительный или недействительный через код выхода.
Контрольные примеры
Следующие контрольные примеры перечислены в блоках для компактности. Первый блок - это случаи, которые должны пройти:
email@domain.com
e@domain.com
firstname.lastname@domain.com
email@subdomain.domain.com
firstname+lastname@domain.com
email@123.123.123.123
email@[123.123.123.123]
"email"@domain.com
1234567890@domain.com
email@domain-one.com
_______@domain.com
email@domain.name
email@domain.co.jp
firstname-lastname@domain.com
""@domain.com
"e"@domain.com
"\@"@domain.com
email@domain
"Abc\@def"@example.com
"Fred Bloggs"@example.com
"Joe\\Blow"@example.com
"Abc@def"@example.com
customer/department=shipping@example.com
$A12345@example.com
!def!xyz%abc@example.com
_somename@example.com
_somename@[IPv6:::1]
fred+bloggs@abc.museum
email@d.com
?????@domain.com
Следующие тесты не должны пройти:
plainaddress
#@%^%#$@#$@#.com
@domain.com
Joe Smith <email@domain.com>
email.domain.com
email@domain@domain.com
.email@domain.com
email.@domain.com
email.email.@domain.com
email..email@domain.com
email@domain.com (Joe Smith)
email@-domain.com
email@domain..com
email@[IPv6:127.0.0.1]
email@[127.0.0]
email@[.127.0.0.1]
email@[127.0.0.1.]
email@IPv6:::1]
_somename@domain.com]
email@[256.123.123.123]
источник
IPv6-addr
он оставлен неопределенным, и существуют тестовые примеры, имеющие адреса ipv6, есть ли правильный способ их проверки?email@d.com
и?????@domain.com
не получится?Ответы:
Python 3.3, 261
Python 3.3 необходим для модуля ipaddress, который используется для проверки адресов IPv4 и IPv6.
Менее гольф-версия:
источник
ALPHA
в расширенном BNF и литералах char, создающих aQuoted-string
, все регистрозависимы. Можете ли вы сбрить несколько символов, указав нечувствительность к регистру и исключив один из этих диапазонов классов символов? Кстати, если вы чувствуете себя резвым, можете ли вы дать краткое описание того, как вы разработали это?PHP 5.4.9, 495
И просто для дальнейшего интереса, вот одна для грамматики RFC 5322, которая учитывает вложенные CFWS и устаревшие локальные части:
(764)
И если ограничения по длине не являются обязательными:
RFC 5321 (414)
RFC 5322 (636)
источник