Машинное обучение (англ Machine Learning) — обширный подраздел искусственного интеллекта, математическая дисциплина, использующая разделы математической статистики, численных методов оптимизации, теории вероятностей, дискретного анализа, и извл

Рейтинг: 13
Создана: 11 лет назад
Владелец: root

Machine Learning/Data Mining/Big Data

Основная информация

Машинное обучение (англ Machine Learning) — обширный подраздел искусственного интеллекта, математическая дисциплина, использующая разделы математической статистики, численных методов оптимизации, теории вероятностей, дискретного анализа, и извлекающая знания из данных.

Data Mining (рус. добыча данных, интеллектуальный анализ данных, глубинный анализ данных) — собирательное название, используемое для обозначения совокупности методов обнаружения в данных ранее неизвестных, нетривиальных, практически полезных и доступных интерпретации знаний, необходимых для принятия решений в различных сферах человеческой деятельности.

Стена группы

Загрузка...
6 лет назад
#

International Data Analysis Olympiad 2019 — Илья Иваницкий


Илья Иваницкий делится опытом участия в финальном этапе International Data Analysis Olympiad 2019 (IDAO), в котором он занял первое место.

6 лет назад
#

Representation Disentanglement


Способность понимать многомерные данные и перерабатывать эти знания в полезные представления без учитлея, остается ключевой проблемой глубокого обучения. Один из подходов к решению этих проблем заключается в распутывании представлений, моделей, которые фиксируют независимые особенности данного представления таким образом, что, если один объект изменяется, другие остаются неизменными.

Стадартные подходы к распутыванию представлений всё ещё не устоялись. Для этого есть две основные причины: (1) мы еще не остановились на формальном определении распутывания, (2) вследствие этого мы еще не договорились о наилучшей метрике.

На предстоящем семинаре мы обсудим определение, метрики оценки и современных кандидатов на лучший подход к распутыванию.

Докладчик: Рауф Курбанов.

Ссылка на слайды: https://docs.google.com/presentation/...

6 лет назад
#

Image Inpainting Online Hackathon — Анастасия Ремизова


Анастасия Ремизова рассказывает про Image Inpainting Online Hackathon, в котором она заняла победное первое место.

Из этого видео вы сможете узнать:
— Какие последствия может иметь выбор метрики организаторами
— Всегда ли нужно обучать модели, чтобы победить в конкурсе
— И ещё несколько хитростей, помогающих занять высокое место

6 лет назад
#

Дипфейк в реальном времени с Путиным


На конференции EmTech MIT показали дипфейк в реальном времени с Путиным. Подделали не только изображение но и голос. Можно было, конечно подобрать похожего актера, тогда качество было бы по лучше.

6 лет назад
#

Kaggle iMaterialist (Fashion) 2019 at FGVC6 — Илья Денисов


Илья Денисов рассказывает про опыт участия в соревновании Kaggle iMaterialist (Fashion) 2019 at FGVC6, в котором он выиграл золотую медаль.

Из этого видео вы сможете узнать:
— Как детальное изучение метрики дает улучшение на лидерборде
— Как особенности в данных могут помешать хорошо обучить модель
— Как выбор неправильного метода интерполяции может занижать результаты вашей сети

6 лет назад
#

Artificial Intelligence Journey — Алексей Натекин, Валентин Малых


Алексей Натекин и Валентин Малых рассказывают про новое и очень интересное соревнование Artificial Intelligence Journey. Задача — разработать алгоритм, который способен успешно ответить на вопросы экзаменационного теста, основываясь на информации из открытых источников.

https://contest.ai-journey.ru/ru/comp...

6 лет назад
#

Анастасия Мотренко: Выбор моделей прогнозирования


Цель работы. Исследование свойств и разработка новых методов выбора модели в условиях избыточного мультикоррелирующего признакового пространства.
Проблема. При решении задачи декодирования временных рядов признаковое описание обладает корреляцией сложной мультииндексной структуры.
Избыточность признакового пространства, мультикорреляция и высокая размерность приводят к завышению сложности модели и получению неустойчивых оценок параметров.
Предложен метод выбора признаков, учитывающий многоиндексное мультикоррелирующее представление данных. Метод основан на решении задачи квадратичного программирования.

6 лет назад
#

Lecture 1: Autoregressive models (Sept 4, 2019)




Lecture 2: Latent Variable Models (Sept 11, 2019)


6 лет назад
#

Machine Learning Live Stream


6 лет назад
#

The 2nd Tellus Satellite Challenge, DIUx xView 2018 Detection Challenge — Николай Сергиевский


Николай Сергиевский рассказывает про задачу детектирования объектов на примере двух соревнований: The 2nd Tellus Satellite Challenge (на японской площадке Signate) и xView: Objects in Context in Overhead Imagery. В каждом из них Николай занял первое место.

6 лет назад
#

Представление текста вектором One Hot Encoding | Нейросети для анализа текстов


Ссылка на ноутбук в Colaboratory — https://colab.research.google.com/dri...


6 лет назад
#

Анализ тональности отзывов на фильмы IMDB | Нейросети для анализа текстов


Рассматривается загрузка набора данных IMDB средствами Keras. Выполняется исследование набора данных IMDB и предварительная подготовка. Классификация выполняется с помощью полносвязной нейросети.

Ссылка на ноутбук из видео — https://colab.research.google.com/dri...

Описание набора данных IMDB — https://ai.stanford.edu/~amaas/data/s...

6 лет назад
#

Scrape or not? — Константин Гаврильчик


Соревнование — это в том числе и возможность побороться за призы. Но что делать, если организаторы использовали опенсорс данные и даже не попытались их анонимизировать? Честные подходы не могут дать результатов сопоставимых с победителями, поэтому перед участниками встаёт выбор: Scrape or not?

Доклад Константина Гаврильчика, секция Black ML, Data Fest⁶.

6 лет назад (отредактировано)
#
31 августа 2019г. Mail.ru Group и сообщество Open Data Science проводят Moscow Data Science Major. Это как Data Fest, только мини. Событие состоит из 8 тематических блоков докладов, ML-тренировки, DS PPT Karaoke и 8 часов ударной порции нетворкинга и знакомств.

Moscow Data Science Major August 2019


Программа в Кинозале


Секция A/B testing


– «Как мы ускорили А/Б тесты в Яндекс Советнике в 10/100 раз», Нерсес Багиян
– «Рекурсивная оценка разнородности причинных эффектов в субпопуляциях при A/B», Алексей Мясников
– «Методология А/Б тестов и пост-анализа в офлайн ритейле», Александр Сахнов

Секция DS 4 Life


– «Эмоции города: анализ качества городской среды с помощью PPGIS», Александра Ненько
– «Вычислительное прогнозирование психометрик пользователя на основе его цифрового следа в социальных сетях», Ирина Деева
– «Эмоциональный пульс школы: использование данных ВКонтакте для изучения психологического благополучия учащихся», Иван Смирнов

Секция Summer ML conf


– «ICML 2019 Report», Сергей Свиридов
– «ACL», Валентин Малых
– «Highlights and trends CVPR-2019», Сергей Алямкин



Программа в Атриуме


Секция SysML


– «End-to-End Production: на примере дефектовки колодок и бандажей тележек локомотивов с помощью CV», Александр Дончук
– «Давай останемся друзьями — или как устроен раздел Возможно Вы Знакомы в Одноклассниках», Евгений Малютин
– «Суровая действительность товарных рекомендаций бытовой техники», Владимир Литвинюк

Секция NLP


– «Промышленная эксплуатация BERT в задачах классификации и поиска», Денис Антюхов
– «Вытаскивание товаров из платежек», Андрей Ахметов
– «NER: как мы учили Почту выделять именованные сущности», Михаил Баранов
– «Переобучение? Не думаю. Как машинное обучение работает в новостном агентстве», Андрей Коломиец
– «Sentence-level pretraining», Борис Зубарев

Секция Fail/cess story


– «Моделирование продаж», Максим Павлов
– «Ранжирование ленты ВКонтакте: офлайн валидация моделей», Данила Савенков
– «Как мы не запилили динамическое ценообразование в большом е-коме», Павел Мягких, Евгений Лимаренко
– «Мультимодальное распознавание эмоций», Андрей Беляев



Программа в Переговорной 1


Секция ML trainings


– «Ice Vision Hacathon», Азат Давлетшин
– «KDD 2019 Policy Learning for Malaria Control», Влад Шах-Назаров
– «Чемпионат по машинному обучению и анализу данных – ML Boot Camp 9», Александр Ничипоренко

Секция ML4IR


– «Мир глазами нейросетей», Данила Байгушев и Михаил Белозеров
– «Обзор трендов Рекомендательных систем от Пульса», Андрей Мурашев
– «Нейромашинный перевод в задачах поиска документов, отвечающих на вопросы», Федор Федоренко

Секция PyData


– «Как ухаживать за пандами», Николай Марков
– «Фишки AutoML», Денис Воротынцев
– «PyData Puzzlers», Пётр Ермаков

6 лет назад
#

Kaggle Inclusive Images Challenge — Павел Остяков


Павел Остяков рассказывает про соревнование Kaggle Inclusive Images Challenge. Оно являлось частью NeurIPS 2018 competition track и Павел занял в нём первое место. Задача заключалась в классификации изображений c применением на новый географический регион.

Из видео вы сможете узнать:
— Про особенности задачи и датасета
— Ограничения в соревновании
— Ключевые идеи и подходы к решению
— Как достичь хороших результатов на Kaggle

4 5 7 8

Авторизация

Войдите, используя Ваш аккаунт

Войти с помощью

Пользователи

Skyeng
GeekBrains
Lingualeo