JavaScript для глубокого обучения 2021 TensorFlow js Ббк



Download 30,75 Mb.
Pdf ko'rish
bet451/457
Sana27.03.2022
Hajmi30,75 Mb.
#513488
1   ...   447   448   449   450   451   452   453   454   ...   457
Bog'liq
Цэй Ш., Байлесчи С., и др. - JаvaScript для глубокого обучения (Библиотека программиста) - 2021

556
Приложения
Рис. Б2.
Формы тензоров для отдельных примеров данных 
(слева) и батчей примеров данных 
(справа). Ранг тензора для батчей примеров данных на 1 превышает ранг тензора отдельных 
примеров данных. Именно такой формат используется в качестве параметров методов predict(), 
fit() и evaluate() объектов tf.Model. null в форме тензора для примеров данных указывает, что 
размер первого измерения тензора не определен, так что при реальных вызовах вышеупомянутых 
методов может быть равен любому положительному целому числу
Б.1.6. Примеры тензоров из практики
Давайте покажем несколько более реалистичных примеров тензоров, подобных тем, 
которые встретятся вам в этой книге. Данные, с которыми вы будете работать, прак­
тически всегда будут относиться к одной из следующих категорий. Выше мы всегда 
следовали соглашению о наименовании батчей и всегда указывали число примеров 
данных в качестве первого измерения батча (
числоПримеров
).
z
z
Векторные данные
— двумерные тензоры формы 
[числоПримеров,
признаки]
.
z
z
Данные в виде 
временных рядов
(последовательностей)
— трехмерные тензоры 
формы 
[числоПримеров,
интервалы
времени,
признаки]
.
z
z
Изображения
— 4­мерные тензоры формы 
[числоПримеров,
высота,
ширина,
каналы]
.
z
z
Видеоданные
— 5­мерные тензоры формы 
[числоПримеров,
кадр,
высота,
ширина,
каналы]
.
Векторные данные
Наиболее распространенный вид данных. В подобных наборах данных отдельные 
примеры данных кодируются векторами, а потому батчи данных можно кодировать 
тензорами ранга 2, в которых роль первой оси координат играет ось примеров дан­
ных, а второй — ось признаков.
Рассмотрим два примера.
z
z
Набор страховых данных о людях, в котором учитывается возраст каждого из 
страхуемых, почтовый индекс и доход. Каждый человек характеризуется век­
тором из трех значений, так что весь набор данных по 100 000 человек хранится 
в двумерном тензоре формы 
[100000,
3]
.
z
z
Набор данных текстовых документов, где каждому документу соответствует коли­
чество вхождений в него каждого слова (например, исходя из словаря 20 000 наи­
более распространенных слов русского языка). Каждый документ можно за­


Приложение Б. Краткое руководство по тензорам и операциям над ними
557
кодировать вектором из 20 000 значений (по одному на каждое слово словаря), 
а значит, батч из 500 документов можно хранить в тензоре формы 
[500,
20000]
.
Временные ряды (последовательности)
Любые данные, в которых должно учитываться время (или в любом случае, когда по­
следовательность упорядочена), имеет смысл хранить в трехмерном тензоре с явной 
осью координат для времени. Примеры данных кодируются последовательностями 
векторов (двумерных тензоров), а значит, батч примеров данных можно закодиро­
вать трехмерным тензором (рис. Б.3).
Ось времени — почти всегда вторая в тен­
зоре (ось с индексом 1) по общепринятому 
соглашению, как в следующих примерах.
z
z
Набор данных по курсам акций. Каждую 
минуту сохраняется текущая цена ак­
ции, максимальная цена за прошедшую 
минуту и минимальная цена за прошед­
шую минуту. Таким образом, данные за 
каждую минуту кодируются вектором 
из трех значений. А поскольку в часе 
60 минут, то час биржевых торгов коди­
руется двумерным тензором формы 
[60,
3]
. Поэтому форма набора данных по 
250 независимым часам будет 
[250,
60,
3]
.
z
z
Набор данных твитов, в котором отдельные твиты кодируются последова­
тельностью 280 символов алфавита, состоящего из 128 уникальных символов. 
При такой схеме отдельный символ можно закодировать бинарным вектором 
размером 128 (состоящим из нулей, за исключением единицы на позиции, со­
ответствующей символу). Следовательно, каждый твит можно рассматривать 
как тензор ранга 2 формы 
[280,
128]
. А набор данных о 1 000 000 твитов можно 
хранить в тензоре формы 
[1000000,
280,
128]
.
Изображения
Данные об изображении обычно включают три 
измерения: высоту, ширину и число цветов. И хотя 
общепринято, что у изображений в оттенках се­
рого обычно только один цветовой канал, тензо­
ры изображений — всегда ранга 3, с одномерным 
цветовым каналом для изображений в оттенках 
серого. Батч из 128 изображений в оттенках серого 
размером 256 
×
256, таким образом, можно хра­
нить в тензоре формы 
[128,
256,
256,
1]
, а батч из 
128 полноцветных изображений — в тензоре фор­
мы 
[128,
256,
256,
3]
(рис. Б.4). Это называется 
соглашением NHWC (см. подробности в главе 4).

Download 30,75 Mb.

Do'stlaringiz bilan baham:
1   ...   447   448   449   450   451   452   453   454   ...   457




Ma'lumotlar bazasi mualliflik huquqi bilan himoyalangan ©hozir.org 2024
ma'muriyatiga murojaat qiling

kiriting | ro'yxatdan o'tish
    Bosh sahifa
юртда тантана
Боғда битган
Бугун юртда
Эшитганлар жилманглар
Эшитмадим деманглар
битган бодомлар
Yangiariq tumani
qitish marakazi
Raqamli texnologiyalar
ilishida muhokamadan
tasdiqqa tavsiya
tavsiya etilgan
iqtisodiyot kafedrasi
steiermarkischen landesregierung
asarlaringizni yuboring
o'zingizning asarlaringizni
Iltimos faqat
faqat o'zingizning
steierm rkischen
landesregierung fachabteilung
rkischen landesregierung
hamshira loyihasi
loyihasi mavsum
faolyatining oqibatlari
asosiy adabiyotlar
fakulteti ahborot
ahborot havfsizligi
havfsizligi kafedrasi
fanidan bo’yicha
fakulteti iqtisodiyot
boshqaruv fakulteti
chiqarishda boshqaruv
ishlab chiqarishda
iqtisodiyot fakultet
multiservis tarmoqlari
fanidan asosiy
Uzbek fanidan
mavzulari potok
asosidagi multiservis
'aliyyil a'ziym
billahil 'aliyyil
illaa billahil
quvvata illaa
falah' deganida
Kompyuter savodxonligi
bo’yicha mustaqil
'alal falah'
Hayya 'alal
'alas soloh
Hayya 'alas
mavsum boyicha


yuklab olish