Как мне обнаружить ненужные файлы #include в большом проекте C ++?

96

Я работаю над большим проектом на C ++ в Visual Studio 2008, и там много файлов с ненужными #includeдирективами. Иногда #includes - это просто артефакты, и все будет нормально компилироваться с их удалением, а в других случаях классы могут быть объявлены вперед, а #include может быть перемещен в .cppфайл. Есть ли какие-нибудь хорошие инструменты для обнаружения обоих этих случаев?

бессмысленный
источник

Ответы:

50

Хотя он не выявляет ненужные включаемые файлы, в Visual Studio есть параметр /showIncludes(щелкните .cppфайл правой кнопкой мыши Properties->C/C++->Advanced), который выводит дерево всех включенных файлов во время компиляции. Это может помочь в идентификации файлов, которые не нужно включать.

Вы также можете взглянуть на идиому pimpl, чтобы избавиться от меньшего количества зависимостей файлов заголовков, чтобы упростить просмотр мусора, который вы можете удалить.

Затмение
источник
1
/ showincludes великолепен. Делать это вручную без этого было непросто.
shambolic
30

PC Lint отлично подходит для этого, и он также находит для вас множество других глупых проблем. У него есть параметры командной строки, которые можно использовать для создания внешних инструментов в Visual Studio, но я обнаружил, что с надстройкой Visual Lint легче работать. Даже бесплатная версия Visual Lint помогает. Но попробуйте PC-Lint. Настройка его так, чтобы он не выдавал слишком много предупреждений, займет немного времени, но вы будете поражены тем, что он появится.

Джо
источник
3
Некоторые инструкции о том, как это сделать с помощью pc-lint, можно найти на сайте riverblade.co.uk/…
Дэвид Сайкс,
26

!! ОТКАЗ !! Я работаю над коммерческим инструментом статического анализа (не PC Lint). !! ОТКАЗ !!

Есть несколько проблем с простым подходом без синтаксического анализа:

1) Наборы перегрузки:

Возможно, что перегруженная функция имеет объявления из разных файлов. Может случиться так, что удаление одного файла заголовка приведет к выбору другой перегрузки, а не к ошибке компиляции! Результатом будет незаметное изменение семантики, которое потом будет очень трудно отследить.

2) Специализации шаблона:

Как и в примере с перегрузкой, если у вас есть частичные или явные специализации для шаблона, вы хотите, чтобы они все были видны при использовании шаблона. Возможно, специализации для основного шаблона находятся в разных файлах заголовков. Удаление заголовка со специализацией не вызовет ошибки компиляции, но может привести к неопределенному поведению, если эта специализация была бы выбрана. (См .: Видимость шаблонной специализации функции C ++ )

Как указывает msalters, выполнение полного анализа кода также позволяет анализировать использование классов. Проверяя, как класс используется через определенный путь к файлам, возможно, что определение класса (и, следовательно, все его зависимости) могут быть полностью удалены или, по крайней мере, перемещены на уровень ближе к основному источнику во включении. дерево.

Ричард Корден
источник
@RichardCorden: Ваше программное обеспечение (QA C ++) слишком дорогое.
Xander Tulip
13
@XanderTulip: Трудно ответить на это, не закончив коммерческой презентацией, поэтому заранее прошу прощения. ИМХО, вы должны учитывать, сколько времени потребуется хорошему инженеру, чтобы найти такие вещи (а также многие другие ошибки языка / потока управления) в любом проекте разумного размера. По мере изменения программного обеспечения одну и ту же задачу необходимо повторять снова и снова. Поэтому, когда вы рассчитываете сэкономленное время, стоимость инструмента, вероятно, не будет значительной.
Ричард Корден
10

Я не знаю таких инструментов, и я думал о написании одного в прошлом, но оказалось, что это трудная проблема для решения.

Скажем, ваш исходный файл включает ah и bh; ah содержит, #define USE_FEATURE_Xа bh использует #ifdef USE_FEATURE_X. Если #include "a.h"закомментировано, ваш файл все еще может компилироваться, но может не делать то, что вы ожидаете. Обнаружить это программно - нетривиально.

Независимо от того, какой инструмент это делает, необходимо также знать вашу среду сборки. Если а выглядит так:

#if defined( WINNT )
   #define USE_FEATURE_X
#endif

Then USE_FEATURE_Xопределяется только в том случае, если WINNTон определен, поэтому инструменту необходимо знать, какие директивы генерируются самим компилятором, а также какие из них указаны в команде компиляции, а не в файле заголовка.

Грэм Перроу
источник
9

Как и Тиммерманс, я не знаком ни с какими инструментами для этого. Но я знал программистов, которые написали сценарий Perl (или Python), чтобы попытаться закомментировать каждую строку включения по одной, а затем скомпилировать каждый файл.


Похоже, что теперь у Эрика Раймонда есть инструмент для этого .

В cpplint.py Google есть правило «включать то, что вы используете» (среди многих других), но, насколько я могу судить, нет «включать только то, что вы используете». Тем не менее, это может быть полезно.

Макс Либберт
источник
Мне пришлось рассмеяться, когда я прочитал это. Мой босс проделал то же самое в одном из наших проектов в прошлом месяце. Уменьшенный заголовок учитывается несколькими факторами.
Дон Уэйкфилд,
2
codewarrior на Mac раньше имел встроенный скрипт для этого, закомментировал, скомпилировал, при ошибке не комментировал, продолжал до конца #includes. Это работало только для #includes в верхней части файла, но обычно они там и находятся. Он не идеален, но сохраняет разум.
slycrel
5

Если вы в целом интересуетесь этой темой, вы можете попробовать Lakos ' Large Scale C ++ Software Design . Это немного устарело, но связано с множеством проблем «физического дизайна», таких как поиск абсолютного минимума заголовков, которые необходимо включить. Я действительно нигде не видел, чтобы подобные вещи обсуждались.

Адриан
источник
4

Дайте Включить представитель палаты в согласительном комитете конгресса попробовать. Он легко интегрируется в Visual Studio и визуализирует ваши пути включения, что помогает вам находить ненужные вещи. Внутри он использует Graphviz, но есть еще много интересных функций. И хотя это коммерческий продукт, у него очень низкая цена.

Alex
источник
3

Если ваши файлы заголовков обычно начинаются с

#ifndef __SOMEHEADER_H__
#define __SOMEHEADER_H__
// header contents
#endif

(в отличие от использования #pragma один раз) вы можете изменить это на:

#ifndef __SOMEHEADER_H__
#define __SOMEHEADER_H__
// header contents
#else 
#pragma message("Someheader.h superfluously included")
#endif

А поскольку компилятор выводит имя компилируемого файла cpp, это позволит вам узнать, по крайней мере, какой файл cpp вызывает многократное добавление заголовка.

Сэм
источник
12
Я думаю, что можно включать заголовки несколько раз. Хорошо включать то, что вы используете, и не зависеть от ваших включаемых файлов. Я думаю, что OP хочет найти #includes, которые фактически не используются.
Райан Гинстром,
12
ИМО активно неправильно поступать. Заголовки должны включать другие заголовки, если они не работают без них. И когда у вас есть A.hи B.hчто оба зависят от C.hи вы включаете A.hи B.h, потому что вам нужны оба, вы будете включать в себя C.hдва раза, но это нормально, потому что компилятор пропустит его во второй раз , и если вы не делали, вы должны помнить , всегда включать C.hдо A.hили в B.hконечном итоге гораздо более бесполезные включения.
Ян Худек
5
Контент точный, это хорошее решение для поиска заголовков, которые включаются несколько раз. Однако на исходный вопрос это не отвечает, и я не могу представить, когда это было бы хорошей идеей. Файлы Cpp должны включать все заголовки, от которых они зависят, даже если заголовок включен раньше где-то еще. Вы не хотите, чтобы ваш проект был привязан к порядку компиляции или предполагал, что другой заголовок будет включать тот, который вам нужен.
jaypb 02
3

PC-Lint действительно может это сделать. Один из простых способов сделать это - настроить его так, чтобы он обнаруживал только неиспользуемые включаемые файлы и игнорировал все другие проблемы. Это довольно просто - чтобы включить только сообщение 766 («Заголовочный файл не используется в модуле»), просто включите параметры -w0 + e766 в командную строку.

Такой же подход можно использовать со связанными сообщениями, такими как 964 («Заголовочный файл не используется напрямую в модуле») и 966 («Косвенно включаемый заголовочный файл не используется в модуле»).

FWIW Я написал об этом более подробно в блоге на прошлой неделе по адресу http://www.riverblade.co.uk/blog.php?archive=2008_09_01_archive.xml#3575027665614976318 .


источник
2

Если вы хотите удалить ненужные #includeфайлы, чтобы сократить время сборки, лучше потратить свое время и деньги на распараллеливание процесса сборки с помощью cl.exe / MP , make -j , Xoreax IncrediBuild , distcc / icecream. и т. Д.

Конечно, если у вас уже есть параллельный процесс сборки, и вы все еще пытаетесь его ускорить, то обязательно очистите свои #includeдирективы и удалите эти ненужные зависимости.

bk1e
источник
2

Начните с каждого включаемого файла и убедитесь, что каждый включаемый файл включает только то, что необходимо для его компиляции. Любые включаемые файлы, которые отсутствуют в файлах C ++, можно добавить в сами файлы C ++.

Для каждого включаемого и исходного файла закомментируйте каждый включаемый файл по одному и посмотрите, компилируется ли он.

Также рекомендуется отсортировать включаемые файлы в алфавитном порядке, а если это невозможно, добавьте комментарий.

Selwyn
источник
2
Я не уверен, насколько практичен этот комментарий, если задействовано очень большое количество файлов реализации.
Сонни,
1

Добавление одного или обоих из следующих #define исключает часто ненужные файлы заголовков и может существенно улучшить время компиляции, особенно если код не использует функции Windows API.

#define WIN32_LEAN_AND_MEAN
#define VC_EXTRALEAN

См. Http://support.microsoft.com/kb/166474

Роджер Нельсон
источник
1
Нет необходимости в обоих - VC_EXTRALEAN определяет WIN32_LEAN_AND_MEAN
Эйдан Райан
1

Если вы еще этого не сделали, использование предварительно скомпилированного заголовка, включающего все, что вы не собираетесь изменять (заголовки платформы, внешние заголовки SDK или статические уже завершенные части вашего проекта), значительно изменит время сборки.

http://msdn.microsoft.com/en-us/library/szfdksca(VS.71).aspx

Кроме того, хотя для вашего проекта может быть уже слишком поздно, хорошей практикой является организация вашего проекта по разделам, а не объединение всех локальных заголовков в один большой основной заголовок, хотя это требует небольшой дополнительной работы.

анон6439
источник
Отличное объяснение предварительно скомпилированных заголовков: cygnus-software.com/papers/precompiledheaders.html (Не уверен, что автогенерация предварительно скомпилированных заголовков нарушена в последних версиях VisualStudio, но это стоит проверить.)
idbrii
1

Если вы будете работать с Eclipse CDT, вы можете попробовать http://includator.com, чтобы оптимизировать структуру включения. Однако Includator может не знать достаточно о предопределенных включениях VC ++, и настройка CDT для использования VC ++ с правильными включениями еще не встроена в CDT.

PeterSom
источник
1

Последняя версия Jetbrains IDE, CLion, автоматически показывает (серым цветом) включения, которые не используются в текущем файле.

Также можно получить список всех неиспользуемых включений (а также функций, методов и т. Д.) Из IDE.

Жан-Микаэль Селерье
источник
0

Некоторые из существующих ответов утверждают, что это сложно. Это действительно так, потому что вам нужен полноценный компилятор для обнаружения случаев, в которых будет уместно предварительное объявление. Вы не можете разобрать C ++, не зная, что означают символы; грамматика слишком двусмысленна для этого. Вы должны знать, является ли определенное имя именем класса (может быть объявлено вперед) или переменной (нельзя). Кроме того, вам нужно знать пространство имен.

MSalters
источник
Вы можете просто сказать: «Решение, какие #includes необходимы, эквивалентно решению проблемы остановки. Удачи :)» Конечно, вы можете использовать эвристику, но я не знаю ни одного бесплатного программного обеспечения, которое делает это.
porges
0

Возможно, немного поздно, но однажды я нашел Perl-скрипт WebKit, который делал именно то, что вы хотели. Думаю, потребуется некоторая адаптация (я не очень разбираюсь в perl), но это должно помочь:

http://trac.webkit.org/browser/branches/old/safari-3-2-branch/WebKitTools/Scripts/find-extra-includes

(это старая ветка, потому что в стволе больше нет файла)

rubenvb
источник
0

Если есть определенный заголовок, который, по вашему мнению, больше не нужен (например, string.h), вы можете закомментировать его, а затем поместить его под всеми включениями:

#ifdef _STRING_H_
#  error string.h is included indirectly
#endif

Конечно, заголовки вашего интерфейса могут использовать другое соглашение #define для записи их включения в память CPP. Или без соглашения, и в этом случае этот подход не сработает.

Затем восстановите. Есть три возможности:

  • Строится нормально. string.h не критичен для компиляции, и включение для него можно удалить.

  • Ошибка #error. string.g каким-то образом был включен косвенно. Вы все еще не знаете, требуется ли string.h. Если это необходимо, вы должны напрямую #include (см. Ниже).

  • У вас другая ошибка компиляции. string.h был необходим и не включается косвенно, поэтому включение было правильным с самого начала.

Обратите внимание, что в зависимости от косвенного включения, когда ваш .h или .c напрямую использует другой .h, почти наверняка это ошибка: вы фактически обещаете, что ваш код будет требовать только этот заголовок, если этого требует какой-то другой заголовок, который вы используете, что, вероятно, не то, что вы имели в виду.

Предостережения, упомянутые в других ответах о заголовках, которые изменяют поведение, а не объявляют вещи, вызывающие сбои сборки, также применяются здесь.

Бриттон Крейн
источник