Я разработал вдохновленный отсюда код запуска из металла для Arm Cortex M3. Однако я сталкиваюсь со следующей проблемой: предположим, я объявляю неинициализированную глобальную переменную, скажем, типа unsigned char в main.c
#include ...
unsigned char var;
...
int main()
{
...
}
это делает область .bss в STM32 f103 начиная с _BSS_START = 0x20000000 и заканчивая _BSS_END = 0x20000001. Теперь код запуска
unsigned int * bss_start_p = &_BSS_START;
unsigned int * bss_end_p = &_BSS_END;
while(bss_start_p != bss_end_p)
{
*bss_start_p = 0;
bss_start_p++;
}
пытается инициализировать нулем весь регион .bss. Однако внутри цикла while указатель увеличивается на 4 байта, поэтому после одного шага bss_start_p = 0x20000004, следовательно, он всегда будет отличаться от bss_end_p, что приведет к бесконечному циклу и т. Д.
Есть ли стандартное решение для этого? Предполагаю ли я «заставить» каким-либо образом размер области .bss быть кратным 4? Или я должен использовать указатель на unsigned char, чтобы пройти через регион .bss? Возможно что-то вроде:
unsigned char * bss_start_p = (unsigned char *)(&_BSS_START);
unsigned char * bss_end_p = (unsigned char *)(&_BSS_END);
while(bss_start_p != bss_end_p)
{
*bss_start_p = 0;
bss_start_p++;
}
```
Ответы:
Как вы подозреваете, это происходит потому, что тип данных unsigned int имеет размер 4 байта. Каждое
*bss_start_p = 0;
утверждение на самом деле очищает четыре байта области bss.Диапазон памяти bss должен быть правильно выровнен. Вы можете просто определить _BSS_START и _BSS_END так, чтобы общий размер был кратен четырем, но это обычно выполняется, позволяя сценарию компоновщика определять начальные и конечные местоположения.
В качестве примера, вот раздел линкера в одном из моих проектов:
В
ALIGN(4)
заявлении заботиться о вещах.Кроме того, вы можете изменить
while(bss_start_p != bss_end_p)
в
while(bss_start_p < bss_end_p)
,Это не предотвратит проблему (поскольку вы можете очистить на 1-3 байта больше, чем вы хотите), но это может минимизировать влияние :)
источник
while(bss_start_p < bss_end_p - 1)
с последующей побайтовой очисткой оставшегося диапазона памяти устранит последнюю проблему.Стандартное решение
memset()
:Если вы не можете использовать стандартную библиотеку, вам придется решить, нормально ли в вашем случае округлить размер области памяти до 4 байт и продолжить использовать
unsigned int *
; или если вам нужно быть строгим, в этом случае вам придется использоватьunsigned char *
.Если вы действительно округлите размер, как в первом цикле, то он
bss_start_p
действительно может оказаться больше, чем просто,bss_end_p
но<
вместо теста неравенства легко справиться с сравнением меньше чем .Конечно, вы также можете заполнить большую часть памяти 32-битными передачами и только последние несколько байтов 8-битными передачами, но это больше работы для небольшого выигрыша, особенно здесь, когда это только часть кода запуска.
источник
memset()
. Но выравнивание до 4 байтов является более или менее обязательным. Так почему бы не сделать это?memset()
, и C - это то, в чем они, кажется, программируют. Простая реализацияmemset()
также в значительной степени просто цикл, но не зависит от чего-то еще. Поскольку это микроконтроллер, я также предполагаю, что там нет динамического связывания или чего-то подобного (и, глядя на ссылку, нет, это просто вызовmain()
после этого цикла обнуления), так что компилятор должен быть в состоянии вставитьmemset()
туда наряду с любыми другими функциями (или для реализации его в строке).Просто измени
!=
на<
. В любом случае это обычно лучший подход, так как он имеет дело с такими проблемами.источник
Есть множество других сайтов и примеров. Многие тысячи, если не десятки тысяч. Существуют хорошо известные c-библиотеки со скриптами компоновщика и кодом boostrap, в частности, newlib, glibc, но есть и другие, которые вы можете найти. Самозагрузка C с C не имеет смысла.
На ваш вопрос ответили, вы пытаетесь провести точное сравнение с вещами, которые могут быть неточными, они могут не начинаться на известной границе или заканчиваться на известной границе. Таким образом, вы можете делать меньше, чем нужно, но если код не работает с точным сравнением, это означает, что вы обнуляете .bss в следующем разделе, что может или не может привести к плохим вещам, поэтому просто замените на меньше, чем isnt решение.
Так что здесь идет TL; DR в порядке. Вы не загружаете язык с этим языком, вы можете с этим сойти с рук, но вы играете с огнем, когда делаете это. Если вы только учитесь тому, как это делать, вам нужно быть осторожнее, а не тупой удачей или фактами, которые вы еще не раскрыли.
Сценарий компоновщика и загрузочный код имеют очень близкие отношения, они женаты, соединены в бедре, вы не разрабатываете один без другого, что приводит к массовому провалу. И, к сожалению, скрипт компоновщика определяется компоновщиком и языком ассемблера, определенным ассемблером, поэтому при изменении цепочек инструментов придется переписать оба. Почему ассемблер? Он не нуждается в начальной загрузке, обычно это делают скомпилированные языки. C делает, если вы не хотите ограничивать использование языка, я начну с чего-то очень простого, с минимальными особыми требованиями для цепочки инструментов, вы не предполагаете, что переменные .bss равны нулю (делает код менее читабельным, если переменная никогда не инициализируется в этом языке попробуйте избежать этого, это не относится к локальным переменным, поэтому нужно быть в курсе того, когда вы его используете. так почему мы говорим о .bss и .data ??? (глобальные переменные хороши для работы на этом уровне, но это уже другая тема)) другое правило для простого решения - не инициализировать переменные в объявлении, делайте это в коде. да горит больше флэш, обычно у вас их много, но не все переменные инициализируются константами, которые в итоге потребляют инструкции.
Вы можете сказать из дизайна cortex-m, что они, возможно, думали, что нет никакого загрузочного кода вообще, поэтому нет поддержки ни .data, ни .bss. Большинство людей, которые используют глобалы, не могут жить без них, так что здесь идет:
Я мог бы сделать это более минимальным, но минимальным функциональным примером для всех cortex-ms, используя цепочку инструментов gnu, я не помню, какие версии вы можете запустить с 5.xx или выше до текущего 9.xx Я переключил сценарии компоновщика где-то около 3. хх или 4.хх, как я узнал больше и как GNU изменил что-то, что сломало мой первый.
самозагрузки:
точка входа в код C:
скрипт компоновщика.
Все это может быть меньше и по-прежнему работать, добавив некоторые дополнительные вещи, чтобы увидеть это на работе.
Оптимизированная сборка и ссылка.
для некоторых поставщиков вы хотите использовать 0x08000000 или 0x01000000 или другие подобные адреса, поскольку флэш-память там отображается и зеркально отображается в 0x00000000 в некоторых режимах загрузки. В некоторых случаях флэш-память зеркально отображает только 0x00000000, поэтому вы хотите, чтобы векторная точка таблицы указывала на пространство флэш-памяти приложения, а не на ноль. поскольку он основан на векторной таблице, все работает.
сначала обратите внимание, что cortex-ms являются машинами только для большого пальца и по какой-то причине они применяют адрес функции большого пальца, что означает, что lsbit нечетен. Знайте свои инструменты, директивы .thumb_func сообщают ассемблеру gnu, что следующая метка - это адрес функции thumb. выполнение +1 в таблице приведет к провалу, не поддавайтесь искушению сделать это, сделайте это правильно. Существуют другие способы GNU-ассемблера для объявления функции, это минимальный подход.
он не загрузится, если вы не получите правильную таблицу векторов.
возможно, нужен только вектор указателя стека (можно поместить что угодно, если вы хотите установить указатель стека самостоятельно в коде) и вектор сброса. Я положил четыре здесь без особой причины. Обычно ставят 16, но хотели сократить этот пример.
Так какой же минимальный загрузчик C должен сделать? 1. установить указатель стека 2. ноль .bss 3. скопировать .data 4. перейти или вызвать точку входа C
точка входа C обычно называется main (). но некоторые наборы инструментов видят main () и добавляют дополнительный мусор в ваш код. Я намеренно использую другое имя. YMMV.
копия .data не нужна, если все это основано на оперативной памяти. быть микроконтроллером cortex-m технически возможно, но маловероятно, поэтому требуется копия .data ..... если есть .data.
Мой первый пример и стиль кодирования - не полагаться на .data или .bss, как в этом примере. Arm позаботился о указателе стека, поэтому остается только вызвать точку входа. Мне нравится иметь его, чтобы точка входа могла вернуться, многие люди утверждают, что вы никогда не должны этого делать. Вы могли бы просто сделать это тогда:
и не возвращаться из centry () и не иметь кода обработчика сброса.
компоновщик положил вещи там, где мы просили. И в целом у нас есть полностью функциональная программа.
Итак, сначала поработаем над скриптом компоновщика:
подчеркивая, что имена rom и ram не имеют значения, они только соединяют точки для компоновщика между разделами.
добавить некоторые элементы, чтобы мы могли видеть, что сделали инструменты
добавьте некоторые элементы для размещения в этих разделах. и получить
вот что мы ищем в этом эксперименте (отметьте, что нет причин загружать или запускать какой-либо код ... знайте свои инструменты, изучайте их)
поэтому мы узнали, что положение переменных очень чувствительно в сценариях компоновщика GNU. обратите внимание на положение data_rom_start против data_start, но почему работает data_end ? Я позволю тебе понять это. Уже понимая, почему не нужно связываться со скриптами компоновщика и просто приступить к простому программированию ...
Итак, еще одна вещь, которую мы узнали здесь, это то, что компоновщик выровнял data_rom_start для нас, нам там не нужен ALIGN (4). Должны ли мы предполагать, что это всегда будет работать?
Также обратите внимание, что он дополняется при выходе в. У нас есть 5 байт .data, но он дополняет его до 8. Без каких-либо ALIGN () мы уже можем сделать копию, используя слова. Исходя из того, что мы видим сегодня с помощью этого набора инструментов на моем компьютере, может ли это быть правдой для прошлого и будущего? Кто знает, даже если ALIGN необходимо периодически проверять, чтобы какая-то новая версия ничего не сломала, они будут делать это время от времени.
из этого эксперимента давайте перейдем к этому, просто чтобы быть в безопасности.
перемещение концов внутри, чтобы соответствовать тому, что делают другие люди. И это не изменило это:
еще один быстрый тест:
дающий
нет необходимости вставлять между bounce и .align
О, да, теперь я помню, почему я не помещаю _end__ внутрь. потому что это не работает.
простой, но очень переносимый код для вступления в брак с этим скриптом компоновщика
дающий
мы можем остановиться или продолжать идти. Если мы инициализируем в том же порядке, что и скрипт компоновщика, то все в порядке, если мы перейдем к следующему пункту, поскольку мы еще не достигли этого. и stm / ldm требуются / желаются только для использования выровненных по словам адресов, поэтому если вы измените на:
сначала с bss в скрипте компоновщика, и да, вы хотите ble не bls.
эти петли будут идти быстрее. теперь я не знаю, могут ли шины ahb иметь ширину 64 бита или нет, но для полноразмерного плеча вы бы хотели выровнять эти вещи по границам 64 бита. четыре регистра ldm / stm на 32-битной границе, но не на 64-битной границе, становятся тремя отдельными шинными транзакциями, где выравнивание на 64-битной границе представляет собой одну транзакцию, сохраняющую несколько тактов на команду.
так как мы делаем голые металлы и мы несем полную ответственность за все, что мы можем сначала сказать, скажем, bss, затем данные, затем, если у нас будет куча, стек будет расти сверху вниз, поэтому, если мы обнуляем bss и растекаемся по некоторым, пока мы начинаем правильное место, которое хорошо, мы еще не используем эту память. затем мы копируем .data поверх и можем пролить в кучу, что нормально, куча или нет, есть много места для стека, поэтому мы не наступаем ни на кого / что-либо (пока мы уверены, что в сценарии компоновщика мы это делаем. если есть проблема, сделайте ALIGN () больше, чтобы мы всегда располагали пространство для этих заливок.
так что мое простое решение, принять его или оставить. добро пожаловать, чтобы исправить любые ошибки, я не запускал это ни на оборудовании, ни на моем симуляторе ...
сложите все вместе, и вы получите:
обратите внимание, что это работает с arm-none-eabi- и arm-linux-gnueabi и другими вариантами, так как никакие гхи-одаренные материалы не использовались.
Когда вы оглядываетесь вокруг, вы обнаружите, что люди сойдут с ума от гхи-одаренности в своих скриптах компоновщика, огромных чудовищных кухонных вещей. Лучше просто знать, как это сделать (или лучше, как овладеть инструментами, чтобы вы могли контролировать то, что происходит), чем полагаться на чужие вещи и не знать, где это сломается, потому что вы не понимаете и / или хотите исследовать Это.
Как правило, не загружайте язык с тем же языком (загрузочный термин в этом смысле означает запуск кода без компиляции с тем же компилятором), вы хотите использовать более простой язык с меньшим количеством загрузчика. Вот почему C выполняется в сборке, у него нет требований к начальной загрузке, вы просто начинаете с первой инструкции после сброса. JAVA, конечно, вы можете написать jvm на C и загрузить C с помощью asm, а затем, если вы захотите с C, запустить JAVA, но также выполнить JAVA на C.
Поскольку мы контролируем допущения для этих циклов копирования, они по определению более плотные и чистые, чем настроенные вручную memcpy / memset.
Обратите внимание, что ваша другая проблема заключалась в следующем:
если это локально, нет проблем, если они глобальные, то сначала вам нужно инициализировать .data, чтобы они работали, и если вы попробуете этот трюк для выполнения .data, то у вас ничего не получится. Локальные переменные, хорошо, что будут работать. если вы по какой-то причине решили создать статические локальные объекты (локальные глобалы, которые мне нравятся называть), то вы снова попадаете в беду. Каждый раз, когда вы делаете присвоение в объявлении, вы должны подумать о том, как оно реализовано и безопасно ли оно. Каждый раз, когда вы предполагаете, что переменная равна нулю, когда она не объявлена, действует то же самое, если локальная переменная не считается равной нулю, если она глобальная, то это так. если вы никогда не предполагаете, что они равны нулю, вам никогда не придется беспокоиться.
источник