JavaScript для глубокого обучения 2021 TensorFlow js Ббк



Download 30,75 Mb.
Pdf ko'rish
bet225/457
Sana27.03.2022
Hajmi30,75 Mb.
#513488
1   ...   221   222   223   224   225   226   227   228   ...   457
Bog'liq
Цэй Ш., Байлесчи С., и др. - JаvaScript для глубокого обучения (Библиотека программиста) - 2021


Глава 6. Работа с данными
267
Листинг 6.17.
Использование API tf.data.webcam() в цикле предсказания
Листинг 6.18.
Создание набора видеоданных из tf.data.webcam()
6.3.3. Доступ к аудиоданным 
с помощью API tf.data.microphone()
Помимо данных изображений, модуль 
tf.data
включает специальный API для сбора 
аудиоданных с аппаратного микрофона. Подобно API веб­камеры, API микрофона 
создает отложенный итератор, позволяющий вызывающей его программе по мере 


268
Часть III • Продвинутые возможности глубокого обучения с TensorFlow.js
необходимости запрашивать кадры, аккуратно упакованные в тензоры, которые 
подходят для непосредственного использования моделью. Типичный сценарий — 
сбор аудиокадров для последующего выполнения предсказаний. И хотя технически 
сгенерировать поток обучающих данных с помощью этого API можно, объединить 
его с метками — непростая задача.
Листинг 6.19 демонстрирует пример сбора аудиоданных длительностью одна 
секунда с помощью API 
tf.data.microphone()
. Учтите, что при выполнении этого 
кода браузер попросит у пользователя разрешить доступ к микрофону.
Листинг 6.19.
Сбор аудиоданных длительностью одна секунда с помощью API tf.data.microphone()
У микрофона есть несколько настраиваемых параметров, позволяющих пользова­
телям контролировать применение к аудиоданным быстрого преобразования Фурье 
(fast Fourier transform, FFT). Например, чтобы в спектрограмме присутствовало 
больше или меньше кадров частотного представления аудиоданных либо только 
определенный диапазон аудиоспектра, скажем лишь частоты, необходимые для 
слышимой речи. Поля из листинга 6.19 означают следующее.
z
z
sampleRateHz:
44100
• Частота дискретизации волнового сигнала микрофона. Должна быть равна 
44 100 или 48 000 и совпадать с частотой самого устройства, в противном 
случае будет сгенерирована ошибка.
z
z
fftSize:
1024
• Этот параметр определяет количество элементов выборки, на основе которого 
вычисляется каждый неперекрывающийся «кадр» аудио. Каждый из кадров 
проходит FFT, и чем больше кадр, тем выше его частотная чувствительность 
и ниже разрешающая способность по времени, поскольку временн
á
я инфор­
мация 
внутри кадра
теряется.
• Обязан быть равен числу в степени 2, от 16 до 8192 включительно. В данном 
случае 
1024
означает вычисление мощности сигнала в полосе частот по вы­
борке примерно из 1024 элементов.


Download 30,75 Mb.

Do'stlaringiz bilan baham:
1   ...   221   222   223   224   225   226   227   228   ...   457




Ma'lumotlar bazasi mualliflik huquqi bilan himoyalangan ©hozir.org 2024
ma'muriyatiga murojaat qiling

kiriting | ro'yxatdan o'tish
    Bosh sahifa
юртда тантана
Боғда битган
Бугун юртда
Эшитганлар жилманглар
Эшитмадим деманглар
битган бодомлар
Yangiariq tumani
qitish marakazi
Raqamli texnologiyalar
ilishida muhokamadan
tasdiqqa tavsiya
tavsiya etilgan
iqtisodiyot kafedrasi
steiermarkischen landesregierung
asarlaringizni yuboring
o'zingizning asarlaringizni
Iltimos faqat
faqat o'zingizning
steierm rkischen
landesregierung fachabteilung
rkischen landesregierung
hamshira loyihasi
loyihasi mavsum
faolyatining oqibatlari
asosiy adabiyotlar
fakulteti ahborot
ahborot havfsizligi
havfsizligi kafedrasi
fanidan bo’yicha
fakulteti iqtisodiyot
boshqaruv fakulteti
chiqarishda boshqaruv
ishlab chiqarishda
iqtisodiyot fakultet
multiservis tarmoqlari
fanidan asosiy
Uzbek fanidan
mavzulari potok
asosidagi multiservis
'aliyyil a'ziym
billahil 'aliyyil
illaa billahil
quvvata illaa
falah' deganida
Kompyuter savodxonligi
bo’yicha mustaqil
'alal falah'
Hayya 'alal
'alas soloh
Hayya 'alas
mavsum boyicha


yuklab olish