Преобразование документов Microsoft Word (.doc / x) в файлы HTML

8

Кто-нибудь знает хорошее приложение, чтобы сделать это быстро и эффективно?

Я купил Word Cleaner, но результатов просто достаточно, и мне нужно просмотреть все сгенерированные html-файлы, чтобы очистить тонны ненужных вставленных тегов, таких как

<strong>H</strong><strong>ell</strong><strong>o </strong><em>Wor</em><em>ld</em>

Большинство статей, отображаемых на веб-сайте, которым я управляю, основаны на документах, написанных на MS Word людьми, которые не имеют представления о том, что такое поля для или упорядоченные / неупорядоченные списки, примечания / примечания и т. Д., И я не могу заставить их использовать что-то еще.

У кого-нибудь есть совет, который поможет мне более эффективно обрабатывать эти страницы, чем просматривать их, чтобы исправить и применить мой стиль CSS?

NB: Просто для записи, использование «Сохранить как HTML DOC» в Word хуже, чем Word Cleaner

danie7LT
источник

Ответы:

4

Вот что я и команда здесь на работе используем для переноса содержимого MS Word в HTML:

http://word2cleanhtml.com/

Мы проверяем все поля, вставляем код, затем конвертируем.

Надеюсь, это поможет.

KruegerDesigns
источник
Word2clean действительно отличный конвертер, очень чистый и именно то, что нам нужно. Спасибо !
danie7LT
Очень приятно, рад, что смог помочь!
KruegerDesigns
3

Я думаю, что лучшим решением для этого было бы использование редактора WYSIWYG. TinyMCE, например, хороший, хотя я подозреваю, что вам может понадобиться отдельный. Использование будет аналогично любой словесной программе, но на выходе будет прямой HTML. Кроме того, вы пробовали другие словесные программы, такие как OpenOffice или LibreOffice? HTML-код не очень хорош, поскольку в нем много встроенных стилей, но из быстрого теста кажется, что в нем нет проблемы множества ненужных тегов.

milo5b
источник
tinyMCE великолепен и это то, что я пытаюсь использовать ИХ. Я уже добавил больше опций форматирования, чтобы помочь им получить то, чего они хотят достичь, но я пытаюсь добиться перехода от слова к чему-то другому , а пока продолжаю получать файлы .doc. Но все равно спасибо, вы говорите, что openOffice дает хорошие результаты при конвертации документа в HTML, я попробую.
danie7LT