Листинг 7.4.
Создание столбчатой диаграммы с помощью функции tfvis.render.barchart()
Рис. 7.3.
Столбчатая диаграмма, состоящая как из строковых, так и из числовых столбцов.
Создана с помощью кода из листинга 7.4
294
Часть III • Продвинутые возможности глубокого обучения с TensorFlow.js
Гистограммы
Три вышеописанных типа графиков позволяют строить зависимости определенных
величин. Иногда не столь важны подробные количественные значения, как
распре-
деление
значений. Представьте себе экономиста, изучающего данные по годовым
доходам семей из результатов общегосударственной переписи. Для него наибольший
интерес представляют не подробные показатели доходов. В них содержится слишком
много информации (да, иногда слишком много информации тоже плохо!). Вместо
них он предпочел бы более краткие сводные показатели дохода. Ему интересно рас
пределение этих значений, то есть сколько из них меньше $20 000, сколько в диа
пазоне от $20 000 до 40 000 или от $40 000 до 60 000 и т. д. Для решения подобной
задачи визуализации и служат
гистограммы
(histograms).
В гистограмме значения распределяются по
интервалам
(bins), иногда назы
ваемым
«корзинами»
. Эти интервалы — просто непрерывные диапазоны значений
величины со своими нижними и верхними границами. Обычно выбираются смежные
интервалы, чтобы охватить все возможные значения. В предыдущем примере эко
номист мог бы воспользоваться следующими интервалами значений: 0 ~ 20 тыс.,
20 тысяч ~ 40 тысяч, 40 тысяч ~ 60 тысяч и т. д. После выбора множества из
N
ин
тервалов значений пишется программа для подсчета количества отдельных точек
данных, попадающих в каждый из интервалов, в результате выполнения которой
получается
N
чисел (по одному для каждого интервала значений). А если построить
график этих чисел с помощью вертикальных столбцов, то и получится гистограмма.
Все вышеописанные шаги реализованы в функции
tfvis.render.histogram()
. Она
освобождает вас от забот по определению границ интервалов и подсчету числа при
меров данных в них. Для вызова
histogram()
достаточно передать в нее массив чисел,
как показано в листинге 7.5. Никакой упорядоченности этих чисел не требуется.
Листинг 7.5.
Визуализация распределения значений с помощью tfvis.render.histogram()
В листинге 7.5 есть два несколько отличающихся вызова функции
histogram()
.
При первом вызове не задается никаких пользовательских опций, за исключением
ширины графика, и
histogram()
рассчитывает интервалы значений с помощью
встроенных эвристических механизмов. В итоге получается семь «корзин»: –4 ~ –2,
–2 ~ 0, 0 ~ 2… 8 ~ 10, как показано слева на рис. 7.4. При разбиении значений по этим
интервалам самое большое значение (4) оказывается в «корзине» 4 ~ 6, поскольку
Do'stlaringiz bilan baham: |