Как удалить повторяющиеся записи в каждом отдельном поле с данными ниже в качестве данных.
0x,9.4,,,#0,#UNIX#unix,#cli#L#فا#0#فا#0#L#SE#Cli#SE,#فارسی#فارسی#۱#1#١#1,bsh,#V & v
ожидаемый результат (либо удалите все дублированные, без учета регистра, разницу в Unicode "персидский #۱
/ арабский #١
", порядок записей и то, какую запись (игнорировать регистр) следует сохранить, здесь не имеет значения):
0x,9.4,,,#0,#unix,#cli#L#فا#0#SE,#فارسی#١#۱#1,bsh,#V & v
Узор в этом формате #x
, x
значит , что - нибудь в одном или более длиной символов.
Таблица Unicode для различий алфавита / цифр персидского / арабского языков
text-processing
awk
perl
unicode
csv-simple
αғsнιη
источник
источник