Вопросы с тегом «parsing»

14
модульные тесты для парсера csv

Какие тесты я должен использовать для модульного тестирования парсера CSV? У меня есть простой синтаксический анализатор csv в C #, и я хочу быть уверенным, что у меня есть хороший охват модульных тестов для всех распространенных (и необычных) краевых случаев. Какие тесты я должен использовать для...

14
Общий дизайн анализатора файлов в Java с использованием шаблона Strategy

Я работаю над продуктом, в котором ответственность одного из модулей состоит в том, чтобы анализировать XML-файлы и выгружать необходимый контент в базу данных. Несмотря на то, что настоящее требование состоит только в разборе файлов XML, я хочу спроектировать свой модуль синтаксического анализа...

13
Какое отношение имеет разбор без сканера к «Проблеме с висящими остальными»?

Я не понимаю это предложение из статьи в Википедии, посвященной проблеме оборванного остального : [Проблема Dangling Else] - это проблема, которая часто возникает при построении компилятора, особенно при анализе без сканирования. Может кто-нибудь объяснить мне, как методы анализа без сканирования...

13
Как мне лучше всего управлять выпуском открытого исходного кода из конфиденциального исследовательского кода моей компании?

Моя компания (назовем их Acme Technology) имеет библиотеку из примерно тысячи исходных файлов, которые первоначально были получены от исследовательской группы Acme Labs, инкубированы в группе разработчиков в течение пары лет и совсем недавно были предоставлены нескольким клиентам в не разглашать....

13
Каков самый простой читаемый формат файла конфигурации? [закрыто]

Закрыто . Этот вопрос основан на мнении . В настоящее время он не принимает ответы. Хотите улучшить этот вопрос? Обновите вопрос, чтобы ответить на него фактами и цитатами, отредактировав этот пост . Закрыто 5 лет назад . Текущий файл конфигурации выглядит следующим образом: mainwindow.title =...

12
Сохранение обработанного данных на естественном языке

Недавно я начал экспериментировать с обработкой естественного языка (NLP), используя CoreNLP от Stanford , и мне интересно, каковы некоторые стандартные способы хранения проанализированных данных NLP для чего-то вроде приложения для анализа текста? Один способ, который я подумал, может быть...

12
С точки зрения непрофессионала, что осталось от рекурсии?

Согласно одной странице на code.google.com, «левая рекурсия» определяется следующим образом: Левая рекурсия просто относится к любому рекурсивному нетерминалу, который, когда он создает форму предложения, содержащую себя, эта новая копия сама появляется слева от производственного правила. Википедия...

12
Как мне указать грамматику для парсера?

Я программировал много лет, но одна задача, которая все еще занимает у меня слишком много времени, - это задать грамматику для синтаксического анализатора, и даже после этого чрезмерного усилия, я никогда не уверен, что грамматика, которую я придумал, хороша ( любой разумной мерой "хорошо"). Я не...

12
Какие проблемы возникают при работе с сообщениями HL7?

Я тестирую продукт для предприятий здравоохранения, и мы работаем с сообщениями HL7. Я видел, как люди стонали по другому вопросу о проблемах с HL7, но не упомянув о специфике. Может ли кто-нибудь дать мне представление о том, какие проблемы или классы проблем мы должны специально искать? Мы...

11
Получение данных с веб-страницы стабильным и эффективным способом

Недавно я узнал, что использование регулярного выражения для анализа HTML-кода веб-сайта для получения необходимых данных - не лучший способ действий. Поэтому мой вопрос прост: что же является лучшим / наиболее эффективным и в целом стабильным способом получения этих данных? Я должен отметить, что:...

11
Алгоритм форматирования кода SQL

Мне нужен инструмент (для внутреннего использования), который будет форматировать код SQL (SQL Server / MySQL). Существуют различные сторонние инструменты и веб-сайты, которые делают это, но не совсем так, как мне это нужно. Поэтому я хочу написать свой собственный инструмент, который будет...

11
Методы парсинга XML

Я всегда считал, что XML довольно сложно обрабатывать. Я не говорю о реализации парсера XML: я говорю об использовании существующего потокового парсера, такого как парсер SAX, который обрабатывает XML узел за узлом. Да, действительно легко изучить различные API для этих синтаксических анализаторов,...

11
язык с двумя бинарными операторами одинакового приоритета, левоассоциативный и правосторонний

Существуют ли какое - либо программирование (или сценарии) язык (или домен конкретного языка) , имеющие два бинарных операторов oplи oprв том же старшинство с oplтого левоассоциативными и oprбыть правоассоциативным? (Я не могу найти такой пример, но я пытаюсь закодировать некоторый общий...

10
Написание компилятора - понимание использования и возможностей

Это часть серии вопросов, посвященных проекту, связанному с проектом Abstraction Project, целью которого является абстракция концепций, используемых в языковом дизайне, в форме фреймворка. Родственный проект называется OILexer, целью которого является создание синтаксического анализатора из файлов...

10
Влияет ли грамматика бизона GPL на мое приложение?

Я думаю об использовании грамматики GPL Bison для моего собственного компилятора. Будет ли грамматика «заражать» мой синтаксический анализатор таким образом, что он должен быть открытым исходным кодом? Грамматика - с точки зрения - ввод бизона...

10
Почему GCC переключился с Bison на парсер рекурсивного спуска для C ++ и C?

Было ли изменение языка, которое требовало этого, или какая-то практическая причина, по которой Бизон больше не был подходящим или оптимальным? Я видел в википедии, что они переключились, ссылаясь на примечания к выпуску GCC 3.4 и GCC 4.1 . Эти примечания к выпуску гласят: Рукописный синтаксический...

9
Что такое реальный вариант использования грамматики Chomsky Type-I (контекстно-зависимой)

В последнее время мне было весело исследовать разработку синтаксических анализаторов языка в контексте того, как они вписываются в иерархию Хомского. Что является хорошим реальным (то есть не теоретическим) примером контекстно-зависимой грамматики?...

9
Разбор языка для поиска важных слов

Я ищу некоторый вклад и теорию о том, как подходить к лексической теме. Допустим, у меня есть коллекция строк, которая может состоять из одного или нескольких предложений. Я хотел бы проанализировать эти строки и вырвать наиболее важные слова, возможно, с оценкой, которая указывает, насколько...

9
Как мне реализовать приложение для обработки команд?

Я хочу создать простое приложение для проверки концепции (REPL), которое принимает число, а затем обрабатывает команды для этого числа. Пример: я начинаю с 1. Затем я пишу " add 2", это дает мне 3. Затем я пишу " multiply 7", это дает мне 21. Затем я хочу знать, если это простое число, поэтому я...

9
Лучший способ разобрать файл

Я пытаюсь найти лучшее решение для создания парсера для некоторых известных форматов файлов, таких как: EDIFACT и TRADACOMS . Если вы не знакомы с этими стандартами, посмотрите этот пример из Википедии: Ниже приведен пример сообщения EDIFACT, используемого для ответа на запрос доступности продукта:...