Вопросы с тегом «natural-language-processing»

31
Нахождение интересных анаграмм

Скажем, что и b 1 b 2 … b n - две строки одинаковой длины. Anagramming из двух строк является взаимно однозначное отображение р : [ 1 ... п ] → [ 1 ... п ] такое , что я = Ь р ( я ) для каждого I .a1a2…ana1a2…ana_1a_2\ldots a_nb1b2…bnb1b2…bnb_1b_2\ldots b_np:[1…n]→[1…n]p:[1…n]→[1…n]p:[1\ldots...

28
Почему пустой тип C не аналогичен пустому / нижнему типу?

Википедия, а также другие источники, которые я обнаружил в списке voidтипа C как тип единицы, а не пустой тип. Мне кажется, что это сбивает с толку, так как мне кажется, что оно voidлучше подходит под определение пустого / нижнего типа voidНасколько я могу судить, ценности не обитают . Функция с...

27
Языки программирования становятся более похожими на естественные языки?

Этот вопрос был перенесен из Биржи стека разработки программного обеспечения, поскольку на него можно ответить в Бирже стеков информатики. Мигрировал 6 лет назад . Можем ли мы изучать языки программирования в контексте лингвистики? Языки программирования развиваются естественным образом аналогично...

21
Сжатие доменных имен

Мне любопытно, как можно очень компактно сжать домен произвольного имени хоста IDN (как определено в RFC5890 ), и подозреваю, что это может стать интересной задачей. Хост Unicode или доменное имя (U-метка) состоит из строки символов Unicode, обычно ограниченных одним языком в зависимости от домена...

13
Определение событий, связанных с датами в абзаце

Существует ли алгоритмический подход для определения того, что даты, указанные в абзаце, соотносятся с конкретными событиями (фразами) в абзаце? Пример, рассмотрим следующий абзац: В июне 1970 года великий лидер принес присягу. Но только после мая 1972 года, после смерти государственного министра,...

11
Связь и разница между поиском и извлечением информации?

Из Википедии Поиск информации - это деятельность по получению информационных ресурсов, имеющих отношение к информационным потребностям, из набора информационных ресурсов. Поиск может быть основан на метаданных или полнотекстовой индексации. Из Википедии Извлечение информации (IE) - это задача...

10
Реализация Наивного Байеса

Я реализую Наивный алгоритм Байеса для категоризации текста с лапласовским сглаживанием. У меня проблема в том, что вероятность приближается к нулю, потому что я умножаю много маленьких дробей. Следовательно, вероятность в конечном итоге дает ноль. Это потому, что в документах и ​​учебных наборах...