253
Материал, изложенный далее, делится на четыре темы:
1. Организация памяти.
2. Поиск периметра.
3. Перебор внутри периметра.
4. Сборка мусора.
Организация памяти
Существует несколько ключевых вопросов, на которые вы должны уметь быстро отвечать. А для этого
необходимо, чтобы память находилась в более-менее организованном состоянии:
1. Известен некий участок памяти. Хранится ли в нем адрес или что-то другое — скажем, номер
банковского счета?
2. Известен адрес. Ссылается ли он на объект или просто на случайное место в памяти?
3. Известен адрес объекта. К чему он относится — к вмещающему объекту или же к переменной
или базовому классу другого объекта?
Блоки памяти
Управляемый блок памяти начинается с короткого заголовка, в котором хранится следующая
информация:
•
физический размер блока;
•
признак использования блока;
•
логический размер блока.
Первоначально вся память представляет собой один большой блок. Когда блок делится, он всегда
делится пополам. Рекурсивное деление продолжается, пока не будет найден блок, размер которого
равен минимальной степени 2, достаточной для хранения создаваемого объекта. В процессе удаления
по начальному адресу блока и его размеру можно легко определить его парный блок; это обеспечивает
эффективное объединение смежных свободных блоков.
А теперь ответим на вопросы, перечисленные выше.
Является ли значение адресом?
Является ли некоторая четрехбайтовая (на большинстве компьютеров) величина адресом памяти?
Будем считать, что является, если она указывает внутрь всего управляемого пространства (то есть
исходного, неразделенного блока).
Является ли адрес адресом объекта?
Будем считать, что является, если адрес лежит в логическом диапазоне используемого блока.
Логический диапазон начинается после заголовка и завершается на его логическом размере.
Наименьший блок, содержащий данный адрес, находится с помощью поиска в бинарном дереве
памяти. Если адрес находится за пределами управляемой памяти и указывает на неиспользуемый блок
или на заголовок блока, он не может быть адресом объекта.
Ссылается ли адрес на объект верхнего уровня?
Если точка, на которую ссылается адрес, расположена сразу же после заголовка используемого блока,
то адрес ссылается на объект верхнего уровня. Если адрес ссылается на некоторую внутреннюю точку
объекта, он соответствует переменной класса или базовому классу вмещающего объекта.
Быстродействие
Если управляемая память имеет длину N байт и вы никогда не выделяете менее 2
M
байт, то ответы на
все три вопроса потребуют не более N-M просмотров заголовков блоков. Например, если N=20 (один
мегабайт), а M=4 (минимальный размер блока равен 16 байтам), потребуется не более 16 попыток. Это
254
не так уж мало, поэтому важно найти оптимальный размер блока — большие блоки увеличивают
фрагментацию, но сокращают количество просмотров.
Поиск периметра
Снятие ограничения «дескрипторы повсюду» означает, что будет разрешен код наподобие
следующего:
class Foo {
private:
Bar*
bar;
};
Foo* f = new Foo;
Кроме того, это означает, что будут разрешены указатели на базовые классы (помните дурацкие
фокусы с
this
?) и указатели на переменные классов. Кончено, становится намного сложнее
определить, что доступно, а что — нет, начиная с поиска периметра. Рассмотрим два варианта.
Умные указатели
Как и прежде, самое надежное — хранить умные указатели в стеке, даже если они и не являются
дескрипторами. Для перебора этих указателей можно воспользоваться скрытой коллекцией.
Конструктор умного указателя заносит его в коллекцию, а деструктор — удаляет.
Перебор стека
Возможно, это звучит довольно странно, однако периметр можно определить приближенно, с ошибкой
в консервативную сторону (то есть с «запасом»). Достаточно просто просканировать стек и найти в нем
значения, соответсвующие адресам объектов. Всегда существует вероятность, что там найдется
переменная с телефоном тетушки Милли из Небраски, которая по чистой случайности совпадает с
адресом некоторого объекта в памяти. Это называется имитацией указателя (pointer aliasing). В
результате объект помечается как доступный, хотя в действительности он недоступен. Обычно это не
имеет вредных последствий, разве что несколько неиспользуемых байт не будут возвращены в
систему. Подумайте хорошенько — случайный «адрес» в стеке должен не только ссылаться на нужное
место в памяти, но и быть единственным указателем на недоступный объект. В общем, особенно
переживать не стоит.
Пометка объектов
Итак, вы определили, что стековая величина ссылается на допустимый объект. Теперь необходимо
пометить этот объект. Бит пометки должен быть частью заголовка блока, поэтому единственная
хитрость заключается в том, как эффективно найти наименьший содержащий блок. Для этого придется
перебирать дерево памяти до тех пор, пока не будет найден заголовок наименьшего блока.
Перебор внутри периметра
После того как вы определите периметр одним из перечисленных выше способов, возникает
следующая задача — пройтись по всем объектам внутри периметра. И снова существуют два основных
варианта: анализ объекта или интерпретация всех значений как потенциальных указателей.
Анализ объекта
Программу можно видоизменить, чтобы в перебор включались только указатели внутри каждого
объекта. При этом можно использовать решение с виртуальными функциями, объектами классов или
даже заставить умные указатели организовать перебор указателей в тех объектах, на которые они
ссылаются. В любом случае вам придется основательно потрудиться над модификацией кода ваших
классов.
Силовое решение
Второй вариант — просканировать весь логический размер каждого помеченного объекта в поисках
потенциальных адресов объектов. Мы делаем то же самое, что делалось раньше для стека, и
Do'stlaringiz bilan baham: |