У меня есть полный XML-документ в виде строки, и мне нужен Document
объект. Google выдает всякую фигню. Какое самое простое решение? (В Java 1.5)
Решение Благодаря Мэтту Макминну я остановился на этой реализации. Для меня у него правильный уровень гибкости ввода и детализации исключений. (Хорошо знать, возникла ли ошибка из-за искаженного XML SAXException
- или просто из-за плохого ввода-вывода - IOException
.)
public static org.w3c.dom.Document loadXMLFrom(String xml)
throws org.xml.sax.SAXException, java.io.IOException {
return loadXMLFrom(new java.io.ByteArrayInputStream(xml.getBytes()));
}
public static org.w3c.dom.Document loadXMLFrom(java.io.InputStream is)
throws org.xml.sax.SAXException, java.io.IOException {
javax.xml.parsers.DocumentBuilderFactory factory =
javax.xml.parsers.DocumentBuilderFactory.newInstance();
factory.setNamespaceAware(true);
javax.xml.parsers.DocumentBuilder builder = null;
try {
builder = factory.newDocumentBuilder();
}
catch (javax.xml.parsers.ParserConfigurationException ex) {
}
org.w3c.dom.Document doc = builder.parse(is);
is.close();
return doc;
}
Ответы:
У меня это работает в Java 1.5 - я исключил определенные исключения для удобства чтения.
источник
getBytes()
без учета кодирования.return (Document) builder.parse(new ByteArrayInputStream(xml.getBytes()));
??Эй, там!
В этом коде есть потенциально серьезная проблема, поскольку он игнорирует кодировку символов, указанную в
String
(по умолчанию это UTF-8). При вызовеString.getBytes()
платформы по умолчанию используется кодировка для кодирования символов Unicode в байты. Итак, синтаксический анализатор может подумать, что он получает данные UTF-8, хотя на самом деле он получает EBCDIC или что-то в этом роде… некрасиво!Вместо этого используйте метод синтаксического анализа, который принимает InputSource, который может быть создан с помощью Reader, например:
Это может показаться не таким уж большим делом, но незнание проблем с кодировкой символов приводит к коварному гниению кода, подобному y2k.
источник
У меня была аналогичная проблема, за исключением того, что мне нужен был NodeList, а не документ, вот что я придумал. В основном это то же самое решение, что и раньше, но с добавлением корневого элемента вниз как NodeList и с использованием предложения Эриксона об использовании InputSource вместо проблем с кодировкой символов.
источник
Чтобы управлять XML в Java, я всегда использую Transformer API:
источник