Глава 13. Резюме, заключительные слова и дальнейшие источники информации
541
13.4.1.
Отрабатывайте навыки решения реальных задач
на Kaggle
Эффективный способ получить реальный опыт машинного обучения (и особенно
глубокого обучения) — попробовать свои силы в конкурсах Kaggle (
https://kaggle.com/
).
Понастоящему разобраться в машинном обучении можно только посредством напи
сания кода, создания моделей и их настройки. Это и есть главная идея данной книги,
как видно из многочисленных примеров кода, только и ждущих изучения, доработки
и использования в качестве основы для ваших программ. Но самый эффективный
способ изучить МО — создавать свои собственные модели и системы машинного
обучения с нуля с помощью библиотек наподобие TensorFlow.js. На сайте Kaggle
можно найти постоянно обновляемый перечень конкурсов по обработке данных
и наборов данных, многие из которых связаны с глубоким обучением.
И хотя большинство пользователей Kaggle применяют в конкурсах инструменты
для языка Python (например, TensorFlow и Keras), большинство наборов данных
на Kaggle от языка программирования не зависит. Поэтому вполне реально решать
большинство задач Kaggle с помощью фреймворков глубокого обучения отличных
от Python языков программирования, например TensorFlow.js. Поучаствовав в не
скольких конкурсах, возможно, в составе команды разработчиков вы познакоми
тесь с практической стороной описанных в этой книге рекомендуемых передовых
практик, особенно подбора гиперпараметров и предотвращения переобучения на
проверочном наборе данных.
13.4.2. Читайте о последних новинках на arXiv
Исследования в сфере глубокого обучения, в отличие от некоторых других научных
областей, происходят практически полностью на виду. Статьи открываются для
всеобщего (бесплатного) доступа сразу же после завершения и рецензирования,
а огромное количество соответствующего программного обеспечения отличается от
крытым исходным кодом. ArXiv (
https://arxiv.org/
) — произносится «а(р)хив» (X — это
греческая буква «хи») — сервер препринтов со свободным доступом для научных
статей по математике, физике и теории вычислительной техники. Он стал фактиче
ски способом по умолчанию публикации передовых работ в области машинного об
учения и глубокого обучения, а потому — способом по умолчанию для поддержания
актуальности своих знаний в этой области. Благодаря этому данная сфера знаний
развивается исключительно быстро: все новые открытия и изобретения открыты для
всеобщего обозрения, критических замечаний и дальнейшего развития.
Существенный недостаток ArXiv — само количество публикуемых ежедневно
новых статей, так что просмотреть их все невозможно. А поскольку многие из статей
в ArXiv — нерецензированные, найти наиболее важные и качественные непросто.
К счастью, были созданы инструменты для решения этой проблемы. Например, с по
мощью вебсайта ArXiv Sanity Preserver
1
(
arxiv-sanity.com
) — системы рекомендации
1
Буквально «хранитель душевного равновесия для ArXiv». —
Примеч. пер.
542
Do'stlaringiz bilan baham: |