Пришло время исследовать наши лучшие глубокие погружения
Отличные посты в блогах по науке о данных бывают разных форм, форматов и времени чтения; требуется много навыков, чтобы создать краткий и эффективный учебник или быстрое, подробное объяснение! Тем не менее, у команды TDS есть слабость к тем длинным, наводящим на размышления статьям, которые наши авторы преуспели в написании, и мы опубликовали особенно впечатляющее количество таких статей за последние недели.
На случай, если вы пропустили их (или у вас не было времени прочитать их, когда они впервые появились в вашей ленте), на этой неделе мы собрали некоторые из наших выдающихся глубоких погружений за последний месяц. Они охватывают широкий спектр тем и подходов и делают это с терпением, страстью и вниманием к деталям. Наслаждайтесь чтением — и не забудьте добавить в закладки любой пост, который вы хотели бы сохранить для вашего следующего полета, поездки на автобусе через город или тихого дня.
- Узнайте о простой, но мощной ментальной структуре . «Эвристика» может звучать как красивое слово, но, как объясняет Холли Эмблем , на самом деле это четкий, оптимизированный подход к решению проблем. Не убежден? Пост Холли содержит четкое определение и практические примеры использования науки о данных, которые вы можете рассмотреть.
- Всесторонний обзор последних достижений в области обнаружения объектов . Есть глубокие погружения, а затем естьобзор модели YOLOv7, сделанный Крисом Хьюзом и Бернатом Пуиг Кэмпсом. Пусть вас не пугает внушительное ~50-минутное время чтения — оно увлекательное и легкое для понимания, а также предлагает плавное сочетание теории и практики.
- Нужно доступное введение в RL? Как и многие новые области, обучение с подкреплением иногда может показаться немного ошеломляющим: так много модных словечек! Кей Ян Вонг вносит освежающую дозу ясности в свой последний пост, который знакомит нас с фундаментальными концепциями, а также с шестью часто используемыми алгоритмами.
- Объяснение полезной альтернативы обычному методу наименьших квадратов (OLS) . Сачин Дейт обладает особым умением переводить сложные теоретические темы в доступные и действенные идеи. Его глубокое погружение в оценку обобщенных наименьших квадратов (GLS) не является исключением: оно представляет собой мощный подход к обработке наборов данных, которые демонстрируют гетероскедастичность (т. е. непостоянную дисперсию).
- Как культивировать более быстрый и эффективный процесс разработки . Если вы работаете в области обработки больших объемов кода в области науки о данных или машинного обучения, вы, вероятно, сталкивались со своей долей неуклюжих, запутанных или негибких кодовых баз. Учебник Betty LD по рефакторингу представляет собой полезный синтез ключевых принципов, правил и лучших практик, позволяющих избежать этих ловушек.
- Следуйте по стопам Паскаля и Ферма . Чтобы получить исчерпывающую информацию о теории вероятностей, не пропуститедебютный пост Намана Агравала в TDS. Это подробный, богатый формулами пост о проблеме разорения игрока, которая веками занимала статистиков.
- Мы получили удовольствие от оживленной беседы с Эдриенн Клайн , которая рассказала о своих разнообразных интересах, междисциплинарной карьере и популярной серии учебных курсов по статистике.
- Как вы можете создать лучший и наиболее продуктивный опыт для людей, аннотирующих ваш набор данных? Лия Берг и Рэй МакЛендон предоставляют практическое руководство.
- Ребекка Викери поделилась важным, удобным для начинающих ресурсом: шпаргалка по использованию пяти вездесущих алгоритмов , включая, среди прочего, линейную регрессию и случайный лес.
- Может быть сложно решить, какая платформа данных нужна вашей компании, не говоря уже о том, как создать ее с нуля. Марина Тошич рассказывает нам о «захватывающем и пугающем» опыте, который она недавно пережила, делая именно это.
- Продолжая изучение библиотеки D3Blocks с открытым исходным кодом, Эрдоган Таскесен показал, как максимально использовать возможности ее диаграммы рассеяния .
До следующей переменной,
Редакторы TDS