Data Science-дайджест №8: главные статьи месяца

05.07.2019
405
Подпишитесь, чтобы получать новые статьи на почту

Редакция Нетологии выбрала главное из свежих статей о Data Science: как развиваются камеры глубины, какие шаги нужно сделать начинающему дата сайентисту и что сделать, чтобы уберечь дом от не самых приятных подарков домашнего питомца. 

Обучение в онлайн-университете: курс «Big Data»

«30 самых удивительных проектов по машинному обучению», Rusbase

В Mybride проанализировали проекты с открытым исходным кодом и отобрали 30 лучших. Все проекты можно посмотреть в подборке

FastText

Что это. Библиотека для изучения вложений слов и текстовой классификации. 

Кто создал. Facebook Research.

Face Recognition

Что это. API для распознавания лиц.

Кто создал. Адам Гейтгей, специалист по машинному обучению.

Fast Style Transfer in TensorFlow

Что это. Передача стиля с TensorFlow.

Кто создал. Логан Энгсторм, аспирант Массачусетского технологического института. 

Facets

Что это. Визуализации для датасетов машинного обучения.

Кто создал. Google Brain.

Style2Paints

Что это. ИИ-раскраска изображений.

Кто создал. Style2paints.

«Камеры глубины — тихая революция (когда роботы будут видеть) Часть 1», habr

В блоге 3Dvideo на Хабре опубликовали две статьи, в которых рассказали о камерах глубины, позволяющих роботам видеть лучше. 

В последнее время производство камер глубины переживает революцию. Развиваются направления:

  • Structured Light камеры — у которых есть проектор и камера.
  • Time of Flight камеры — основаны на измерении задержки отраженного света.
  • Depth from Stereo камеры — построение глубины из стерео.
  • Light Field Camera — камеры светового поля.
  • Solid State Lidars — камеры, основанные на Lidar-технология: работают в несколько раз дольше и выдают прямоугольную картинку. 

Способ 1. Structured Light камеры

Структурированный свет — простой и дешевый способ измерения глубины. 

Идея проста: ставят проектор, который создает горизонтальные и вертикальные полосы, и камеру, снимающую картину с полосками: 

 

Даже самым дешевым проектором и смартфоном можно измерить глубину статических сцен:

В 2010 году Microsoft выпустили бюджетный (150$) сенсор глубины MS Kinect, что привело к революции и инвестициям. 

Kinect работает так: инфракрасный проектор дает псевдослучайный набор точек:

Другим массовым продуктом со встроенной камерой глубины структурированного света был iPhone X:

В компании Texel создали платформу с четырьмя камерами Kinect и программным обеспечением, которая дает интересный результат:

Способ 2. Time of Flight камеры

Этот способ измерения глубины сложнее — он основан на измерении round-trip задержки света. Картинка получается достаточно низкого разрешения, но с высокой кадровой частотой. 

Такие камеры получили развитие с производством промышленных роботов. Еще их используют для домашних продуктов, например, охранных камер. 


Охранная камера с блоком ночного видения от компании PMD Technologies

«Камеры глубины — тихая революция (когда роботы будут видеть) Часть 2», habr

Способ 3. Depth from Stereo камеры

Главное достоинство таких камер — их можно использовать на улице. Солнечный свет не портит снимки, а делает результат лучше. 


Пример уличного использования

Тема автономных автомобилей привела инвестиции в построение глубины из стерео:

 

Способ 4. Light Field камеры глубины

Главная идея таких камер — зафиксировать в каждой точке двумерный массив световых лучей, сделав каждый кадр четырехмерным. Это дает много возможностей, но снижает разрешение снимка. 

Способ 5. Камеры на lidar технологиях

Лазерные дальномеры стоят недорого и дают высокую точность, поэтому их стали активно использовать. Лидары хорошо проявили себя в автопилотах машин. Поэтому крупные компании инвестируют в их развитие. 

Изначально лидары вращались, давая несколько раз в секунду подобный результат:

Из-за движущихся частей это было неудобно и дорого. Сейчас бум исследований и производства постепенно снижает цену лидаров. 

Производители разработали Solid State Lidar, который дешевле, надежнее и дает прямоугольную картинку:

Обучение в онлайн-университете: «SQL и получение данных»

«Руководство по Data Science для начинающих», Towards Data Science

Автор рассказал, какие шаги должен сделать начинающий специалист, чтобы работать в Data Science. 

Шаг 0. Что есть что. Искусственный интеллект, машинное обучение, глубокое обучение, наука о данных — не одно и то же. Поймите разницу между ними перед погружением в сферу. 

Шаг 1. Статистика, математика, линейная алгебра. Для серьезного понимания работы в Data Science понадобится знание теории вероятности, математический анализ, линейная алгебра и математическая статистика. Математические знания важны для того, чтобы анализировать результаты применения алгоритмов обработки данных.

Шаг 2. Программирование (Python). Знания основ программирования — большое преимущество начинающего дата сайентиста. Начните изучать один язык и сосредоточьтесь на всех нюансах программирования.

Шаг 3. Машинное обучение. Специалист должен разбираться в машинном обучении, так как оно позволяет обучать компьютеры самостоятельным действиям.

Шаг 4. Data Mining (Анализ данных) и визуализация данных. Знания в этих областях сделают специалиста конкурентоспособным. 

Шаг 5. Практический опыт. Заниматься только теорией — скучно. Каждому специалисту нужно попробовать свои силы на практике. В этом поможет Kaggle — сайт, где постоянно проводятся соревнования по анализу данных.  

Шаг 6. Подтверждение квалификации. Попробуйте свои силы в открытых заданиях и конкурсах, и начинайте искать работу. 

«Инженер Amazon создал блокирующее устройство с ИИ, которое не пускает в дом кота с уличной добычей», habr

Бен Хэмм, инженер в Amazon, разработал блокиратор, который не дает его коту тащить домой мертвых крыс и птиц. 

Котик приносил своему хозяину подарки, даже в самый неподходящий для этого момент. Чтобы избавиться от мертвых животных, Бен решил создать блокиратор, который закрывается, когда котик приносит домой добычу. 

Хэмм поставил камеру Amazon DeepLens над входом для обнаружения кота:

За несколько месяцев сделал 23 000 снимков котика и разделил их на три модели для машинного обучения:

Умный блокиратор понимает, когда котик возвращается домой с добычей, и закрывает кошачью дверцу.

Читать еще: «Как перейти в Machine learning, если знаешь Python»


Мнение автора и редакции может не совпадать. Хотите написать колонку для «Нетологии»? Читайте наши условия публикации. Чтобы быть в курсе всех новостей и читать новые статьи, присоединяйтесь к Телеграм-каналу Нетологии.

Мы используем файлы cookie
Чтобы улучшить работу сайта и предоставить вам больше возможностей для обучения. Продолжая использовать сайт, вы соглашаетесь с условиями использования файлов cookie.