Как сохранить документ Word в формате PDF * без * встроенных шрифтов?

9

У меня есть Microsoft Word 2010, и я пытаюсь использовать его для создания PDF-документа с подвохом. Я НЕ хочу, чтобы какой-либо из используемых шрифтов был встроенным. Однако все варианты сохранения, которые я пробовал, приводят к появлению шрифтов «Embedded Subset». Есть ли способ сохранить в формате PDF без вложения каких-либо шрифтов?

slipsec
источник
1
Что вы в настоящее время используете для создания этих PDF-файлов? PDF-файлы в основном предназначены для печатных электронных документов и являются более или менее неизменными. Кроме того, что вы читаете с ними, что вы не хотите, чтобы шрифты действительно печатались на документе? Для чего вы их используете?
Остин Т Френч
Я тестирую преобразование в другие форматы изображений (например, tiff), и мне нужно протестировать сценарии, в которых шрифты НЕ были встроены, чтобы убедиться, что они сопоставлены с чем-то, что не нарушает выравнивание и интервалы. Достаточно легко создать документ Word, который включает все установленные системные шрифты, но я хочу сохранить / экспортировать в формате PDF без встроенных шрифтов.
слипсек

Ответы:

3

Можно удалить все шрифты, образующие документ XML типа WordML.

<?xml version="1.0" encoding="UTF-8"?>
<?mso-application progid="Word.Document"?>
    <w:wordDocument xml:space="preserve" xmlns:w="http://schemas.microsoft.com/office/word/2003/wordml">
     <w:body>

      <w:tbl>
       <w:tblPr>
        <w:tblW w:w="9570" w:type="dxa"></w:tblW>
         <w:tblBorders> <w:top w:val="nil" /><w:left w:val="nil" /><w:bottom w:val="nil" /><w:right w:val="nil" />
         </w:tblBorders>
       </w:tblPr>

    <w:tr>
     <w:tc>
    <w:tcPr><w:tcW w:w="4785" w:type="dxa" /></w:tcPr>  <w:p></w:p>  </w:tc>
     <w:tc>  
    <w:tcPr><w:tcW w:w="4785" w:type="dxa" /></w:tcPr>  <w:p></w:p>  </w:tc>
    </w:tr>   

     <w:tr>    
         <w:tc>
          <w:tcPr><w:tcW w:w="0" w:type="auto" /></w:tcPr>  <w:p><w:pPr><w:jc w:val="right" /></w:pPr>
       <w:r><w:t>Company: </w:t></w:r> 
      </w:p>
     </w:tc>   

        <w:tc>
          <w:tcPr><w:tcW w:w="0" w:type="auto" />
           <w:tcBorders>      <w:top w:val="single" w:sz="2" w:color="0070C0" />    <w:left w:val="single" w:sz="2" w:color="0070C0" /> <w:bottom w:val="single" w:sz="2" w:color="0070C0" /> <w:right w:val="single" w:sz="2" w:color="0070C0" />
           </w:tcBorders>
          </w:tcPr>
         <w:p><w:pPr><w:jc w:val="left" /></w:pPr><w:r><w:t></w:t></w:r></w:p>
        </w:tc>      
       </w:tr>       
      </w:tbl>
     </w:body>
    </w:wordDocument>

Но даже если вы удалите все стили и шрифты исходного документа, Word по умолчанию назначит их при открытии стиля документа. Кроме того, по крайней мере один шрифт будет в документе Acrobat при его открытии, как если бы вы не действовали.

Офисный XML-файл WordML, стиль загрузки Word по умолчанию:

Офисный XML-файл WordML

После сохранения в формате PDF в Acrobat просмотрите один шрифт

Acrobat Document шрифт проп

Хорошее решение - выбрать хотя бы один шрифт, который все еще будет в PDF-файле, и использовать его.

Способ 2: удаление неиспользуемых стилей из Word

введите описание изображения здесь

Sub DeleteUnusedStyles()
    Dim oStyle As Style
    For Each oStyle In ActiveDocument.Styles
        ‘Only check out non-built-in styles
        If oStyle.BuiltIn = False Then
            With ActiveDocument.Content.Find
                .ClearFormatting
                .Style = oStyle.NameLocal
                .Execute FindText:=””, Format:=True
                If .Found = False Then oStyle.Delete
            End With
        End If
    Next oStyle
End Sub 

См. Формат шрифтов для значений по умолчанию для текстового поля

Стиль почти всегда включает шрифт и размер шрифта, используемые для определения других размеров. Абзац, межстрочный интервал и т. Д. Если вам нужен другой стиль, создайте сам документ. Включая сменные шрифты. Если окончательный PDF документ, то используйте встроенный Adobe JavaScript. Или Adobe LiveCycle Designer ES и XDP XML.

Шрифт в Adobe LiveCycle Designer XDP XML

Использование Acrobat JavaScript в формах: импорт и экспорт данных форм

Архитектура XML-форм PDF!

STTR
источник
Разве это не удалит сами настройки стиля, а не встроенные шрифты? Я хочу сохранить стиль, но удалите встроенные шрифты, чтобы получить «предположение» для сопоставления программой преобразования, которую я пытаюсь протестировать.
слипсек
@slipsec Может быть, нужно создать PDF вручную?
STTR
@slipsec, вам может понадобиться использовать платный сторонний компонент для достижения этой цели.
Адам
использовал iText, опубликую, когда я закончу.
слипсек
0
[System.Reflection.Assembly]::LoadFrom("C:\path\to\itextsharp.dll")
#by default fonts are NOT embedded
#[iTextSharp.text.FontFactory]::DefaultEmbedding -eq false

$doc = New-Object iTextSharp.text.Document
$fileStream = New-Object IO.FileStream("C:\foo\test\allFonts2.pdf", [System.IO.FileMode]::Create)
[iTextSharp.text.pdf.PdfWriter]::GetInstance($doc, $filestream)

#iTextSharp provides a class to work with fonts, but first we have to register them:
[iTextSharp.text.FontFactory]::RegisterDirectories()

#Phrase is the smallest bit of text that will understand a newline if needed.  it is a chunk[] and paragraph is a phrase[]
$phrase = new-object iTextSharp.text.Phrase 
$paragraph = New-Object iTextSharp.text.Paragraph

#Different fonts for mapping tests
$fN = [iTextSharp.text.Font]::NORMAL
$fB = [iTextSharp.text.Font]::BOLD
$fI = [iTextSharp.text.Font]::ITALIC
$fBI = [iTextSharp.text.Font]::BOLDITALIC

#Sample string
$string = "The quick brown fox jumps over the lazy dog 1234567890 ?.,:;!@#$%^&*()`"'`n"
#something I know maps nicely (I love fixed width fonts!)
$consolas = [iTextSharp.text.FontFactory]::GetFont("consolas", 9)

#create all the nesting needed.
[iTextSharp.text.FontFactory]::RegisteredFamilies | %{

    $chunk = new-object iTextSharp.text.Chunk("`n$_`n", $consolas)
    $phrase.Add($chunk) | out-null

    $a = [iTextSharp.text.FontFactory]::GetFont($_, 9, $fN)
    "adding font: $_"
    $chunk = new-object iTextSharp.text.Chunk($string, $a)
    $phrase.Add($chunk) | out-null

    $b = [iTextSharp.text.FontFactory]::GetFont($_, 9, $fB)
    $chunk = new-object iTextSharp.text.Chunk($string, $b) 
    $phrase.Add($chunk) | out-null

    $c = [iTextSharp.text.FontFactory]::GetFont($_, 9, $fI)
    $chunk = new-object iTextSharp.text.Chunk($string, $c) 
    $phrase.Add($chunk) | out-null

    $d = [iTextSharp.text.FontFactory]::GetFont($_, 9, $fBI)
    $chunk = new-object iTextSharp.text.Chunk($string, $d) 
    $phrase.Add($chunk) | out-null
}

$paragraph.add($phrase) | out-null
$doc.Open()
$doc.add($paragraph) | out-null
$doc.close()
slipsec
источник
Вы можете объяснить, что это?
turbanoff
@turbanoff Похоже на Powershell с библиотекой itextsharp PDF (для .NET).
Боб