Как сохранить документы Word как HTML для просмотра в Firefox

10

Мне нужно сохранить документ Word в формате HTML. У него есть некоторые фоновые изображения, другие изображения, тексты, ... Он правильно открывается в Internet Explorer, но как я могу сохранить слово doc как HTML, чтобы Firefox и другие современные браузеры отображали его правильно?

Все изображения отсутствуют в документе. Я просмотрел сгенерированный HTML-документ, но пути к изображениям выглядят правильными.

Есть идеи?

Такие вещи, как «Не сохранять документы как HTML» здесь не помогут.

Редактировать: чтобы прояснить ситуацию, обычное «Сохранить как HTML» не обрезается, результат искажается в любом браузере, кроме Internet Explorer.

Изменить 2: я использую Word 2010 и Firefox 4. Я также попытался отрендерить его в последней версии Chrome, которая также не удалась. Я использовал разные настройки совместимости для сохранения как html, это не помогло

private_meta
источник
2
Можете ли вы предоставить скриншот (или частичный скриншот), показывающий нам, каким образом это не удается?
Majenko
Не того конкретного документа, я опишу, если недостаточно, я создам что-то новое. У меня есть слово doc с фоновым изображением на всей странице, у меня есть другие изображения в разных местах, и я отформатировал текст на странице. Получающийся HTML-код - это белый фон, без изображений, только отформатированный текст.
private_meta
2
Использование слова для HTML это ужасная идея в целом. Мне любопытно, как будет работать его загрузка в Google Docs и использование его функции вывода html или использование OOo / libreoffice для экспорта
Journeyman Geek
Не могу помочь с самим документом Word. Google Docs показывает изображение, но уничтожает весь формат даже больше, чем Word Export. Я еще не пробовал OOo, не установил его прямо сейчас
private_meta
Только что протестировано в Open Office (3.2. *). Это выглядит нормально в Open Office Writer, но ломается при просмотре в браузере
private_meta

Ответы:

6

При использовании Word Save As Web Page (htm html) перед нажатием кнопки «Сохранить» обратите внимание на выпадающий «Инструменты» слева от кнопки «Сохранить». Зайдите в это раскрывающееся меню, выберите «Веб-параметры». В появившемся окне параметров ОТКЛЮЧИТЕ поле с надписью «Положитесь на VML ...». Это отлично сработало для меня. Удачи.

Джон Джонсон
источник
Какая версия Word у вас была? Я посмотрел на 2003 год, и все они, кажется, по умолчанию не проверяют "Положиться на VML ...".
Стивен
4

У меня есть взлом, который включает в себя изменение кода HTML напрямую. Я использую MS-Office 2007 и FF 10.0.4.

Хитрость заключается в том, чтобы убрать <v:imagedata src = ...>грубый код, который генерирует Word при сохранении файла в HTML, и заменить его стандартным <img src = ...>. Первый (imagedata ...) может быть обработан только IE, в то время как последний является стандартным и может обрабатываться всеми браузерами.

Пример:

Удалить следующее -

<span style='mso-no-proof:yes'><v:shape id="Picture_x0020_2" o:spid="_x0000_i1026"
 type="#_x0000_t75" style='width:282.75pt;height:207.75pt;visibility:visible;
 mso-wrap-style:square'>
 <v:imagedata src="dcsl_overview_files/image006.png" o:title=""/>
</v:shape> </span>

С:

<img src="dcsl_overview_files/image006.png" alt="overview figure">
Saurabh Bagchi
источник
2

Я столкнулся с той же проблемой. Кажется, что по некоторым причинам Word действительно экспортирует обычный HTML для некоторых документов.

Обычно Word экспортирует графику с двумя кодами: специальный для рендеринга в IE и обычный HTML для других браузеров.

Код выглядит как показано ниже (я удалил много кода для удобства чтения)

<p ...><span ...><!--[if gte vml 1]><v:shapetype...>
 [code for IE]
</v:shapetype>
<v:shape id="Picture_x0020_2" ... alt="...png" ...>
 <v:imagedata src="...docx_files/image001.png".../>
</v:shape><![endif]-->
<![if !vml]><img width=169 height=119
src="..."... ><![endif]></span></p>

Заметьте условное?

<!--[if gte vml 1]> IE Code <![endif]--> <![if !vml]> Non IE HTML <![endif]>

Для некоторых документов я вижу, что Word перестает быть двуязычным и экспортирует только часть IE.

У меня пока нет решения для этих случаев. Все еще расследую

Тьерри Теллиес
источник
2

Попробуйте сохранить как веб-страницу, фильтр, чтобы удалить специфичные для Office теги. В Word 2007 это очищает все уродливые офисные теги и генерирует чистый HTML-файл.

Пок
источник
1

Я пробовал только простой документ, представленный в Chrome, поэтому YMMV - но вы пытались сохранить как Web Page, Filtered(доступно в моей копии Word 2010, и я предполагаю, что во всех версиях).

Это должно убрать массу худших вещей, но, тем не менее, результат не всегда может быть идеальным, не зависящим от браузера HTML.

CJM
источник
0

На панели быстрого доступа есть опция предварительного просмотра веб-страницы . Я думаю, что это должно работать (я тестировал его, когда у меня был Word 2007, и я не знаю, доступен ли он в 2010 и 2013 годах).

UltraDEVV
источник
-2

Поскольку, очевидно, больше ничего не работало, оно стало одним из этих чертовых решений "только для IE".

Изменить: Просто чтобы уточнить: я ответил на это сам, так как я не получил никакого другого ответа в течение 8 месяцев. Поскольку в данный момент мне больше не нужно решение, и это было слишком давно, я не приму / не смогу принять другое решение.

private_meta
источник
Другие люди могут столкнуться с той же проблемой, в том числе и я. Так что это очень полезный вопрос. Пожалуйста, будьте любезны и отметьте ответ, который, по вашему мнению, решает проблему. Лично я считаю, что @Saurabh Bagchi - хорошее решение.
Алин С