Я загрузил все пользовательские агенты с http://www.user-agents.org/ и запустил скрипт, чтобы подсчитать количество из них, которые использовали +
ссылки стиля по сравнению с простыми ссылками. Я исключил "нестандартные" строки агента пользователя, которые не соответствуют RFC 2616.
Вот результаты:
Total: 2471
Standard: 2064
Non-standard: 407
No link: 1391
With link: 673
Plus link: 145
Plain link: 528
Plus link only: 86
Plain link only: 174
Таким образом, из 673 пользовательских агентов, которые включают ссылку, только 21% включают плюс. Из 260 пользовательских агентов, у которых есть комментарий, который является просто ссылкой, только 33% включают плюс.
Основываясь на этом анализе, плюс является обычным явлением, но большинство пользовательских агентов предпочитают его не использовать. Это хорошо, чтобы оставить это, но достаточно распространено, что было бы хорошо, чтобы включить его.
Вот скрипт Perl, который выполнил этот анализ, если вы хотите запустить его самостоятельно.
#!/usr/bin/perl
use strict;
my $doc="";
while(my $line = <>){
$doc.=$line;
}
my @agents = $doc =~ /\<td class\=\"left\"\>[ \t\r\n]+(.*?)\ \;/gs;
my $total = 0;
my $standard = 0;
my $nonStandard = 0;
my $noHttp = 0;
my $http = 0;
my $plusHttp = 0;
my $noPlusHttp = 0;
my $linkOnly = 0;
my $plusLinkOnly = 0;
for my $agent (@agents){
$total++;
if ($agent =~ /^(?:[a-zA-Z0-9\.\-\_]+(?:\/[a-zA-Z0-9\.\-\_]+)?(?: \([^\)]+\))?[ ]*)+$/){
print "Standard: $agent\n";
$standard++;
if ($agent =~ /http/i){
print "With link: $agent\n";
$http++;
if ($agent =~ /\+http/i){
print "Plus link: $agent\n";
$plusHttp++;
} else {
print "Plain link: $agent\n";
$noPlusHttp++;
}
if ($agent =~ /\(http[^ ]+\)/i){
print "Plain link only: $agent\n";
$linkOnly++;
} elsif ($agent =~ /\(\+http[^ ]+\)/i){
print "Plus link only: $agent\n";
$plusLinkOnly++;
}
} else {
print "No link: $agent\n";
$noHttp++;
}
} else {
print "Non-standard: $agent\n";
$nonStandard++;
}
}
print "
Total: $total
Standard: $standard
Non-standard: $nonStandard
No link: $noHttp
With link: $http
Plus link: $plusHttp
Plain link: $noPlusHttp
Plus link only: $plusLinkOnly
Plain link only: $linkOnly
";