Machine Learning/Data Mining/Big Data — TechCave

Машинное обучение (англ Machine Learning) — обширный подраздел искусственного интеллекта, математическая дисциплина, использующая разделы математической статистики, численных методов оптимизации, теории вероятностей, дискретного анализа, и извлекающа

Machine Learning/Data Mining/Big Data

Машинное обучение (англ Machine Learning) — обширный подраздел искусственного интеллекта, математическая дисциплина, использующая разделы математической статистики, численных методов оптимизации, теории вероятностей, дискретного анализа, и извлекающая знания из данных.

Data Mining (рус. добыча данных, интеллектуальный анализ данных, глубинный анализ данных) — собирательное название, используемое для обозначения совокупности методов обнаружения в данных ранее неизвестных, нетривиальных, практически полезных и доступных интерпретации знаний, необходимых для принятия решений в различных сферах человеческой деятельности.

Стена группы

Загрузка...
3 дня назад
#

Deep learning на пальцах 1 — Введение


Загрузка...
3 дня назад
#

Theoretical Deep Learning course. Loss Landscape. Part 1


The first class of our Theoretical Deep Learning course, where we talk about loss surfaces of neural networks.

Find out more: https://github.com/deepmipt/tdl?fbcli...

Our open-source framework to develop and deploy conversational assistants: https://deeppavlov.ai/

Загрузка...
3 дня назад
#

Theoretical Deep Learning. Introduction


This is the introduction to our Theoretical Deep Learning course.

Find out more: https://github.com/deepmipt/tdl?fbcli...

Our open-source framework to develop and deploy conversational assistants: https://deeppavlov.ai/

Загрузка...
6 дней назад
#

Яндекс изнутри: рекомендательные системы Музыки и Дзена — Прямая трансляция


12:00 Открытие встречи
12:20 Как рекомендовать музыку, которую почти никто не слушал — Даниил Бурлаков
12:50 Дзен — рекомендательная система с несколькими игроками
Антон Фролов
13:20 Перерыв
13:40 Устройство рекомендательной системы сервиса — Яндекс.Дзен
Дмитрий Ушанов
14:10 Секретный доклад — Евгений Крофто

Загрузка...
7 дней назад
#

Команды Linux в Colab | Глубокие нейронные сети на Python


Демонстрация использования команд Linux на платформе Google Colaboratoty. Курс «Программирование глубоких нейронных сетей на Python» — https://www.asozykin.ru/courses/nnpython

Ссылка на ноутбук из видео — https://colab.research.google.com/dri...

Не забудьте сохраните копию этого ноутбука себе. Свою копию вы сможете изменять и запускать.

Загрузка...
11 дней назад
#

Deep learning in natural language processing


Seminar 1. Part 1. Conversational Artificial Intelligence.


Вступительное слово от главы лаборатории нейронных систем и глубокого обучния МФТИ Михаила Бурцева.



Seminar 1. Part 2. Course intro


Введение в структуру курса.
Презентация:https://bit.ly/2Gi9V1z



Seminar 1. Part 3. Word vector representations


Векторные представления слов.
Презентация: https://bit.ly/2WQRtSR

Загрузка...
15 дней назад
#

zoomcall #7 06.02.2019 (Dataset augmentation)


Иван Брагин: Аугментация данных

Загрузка...
15 дней назад
#

zoomcall #7 06.02.2019 (Dataset augmentation)


Иван Брагин: Аугментация данных

Загрузка...
15 дней назад
#

Kaggle Human Protein: классификация паттернов белков — Дмитрий Буслов


Дмитрий Буслов рассказывает про задачу многоклассовой классификации изображений паттернов белков, которая решалась в рамках Kaggle Human Protein Atlas Image Classification, где его команде удалось войти в золото. Из видео вы сможете узнать про используемые архитектуры сетей и трюки обучения (в том числе неудачные), организацию второго уровня и лучшие решения контеста.

Слайды: https://gh.mltrainings.ru/presentatio...

Загрузка...
Den
20 дней назад
#

Мой адрес не дом и не улица



microBIGDATA или ФИАС в кармане



Питер Брейгель Младший, Уплата налога, 1640 год

Прошлый заход на бреющем
по объектам зашел. Продолжим разведку боем. Сегодня поговорим о тяжелом. Пусть ещё не о BIG DATA, но работать уже неудобно – достаточно большие объёмы данных. Не каждому влезет в оперативную память целиком, а некоторым не влезет даже на диск (не места мало, а хламу много). Имя нашему подопечному
БД ФИАС — база данных федеральной адресной информационной системы. Архив в 5,5 ГБ. И это сжатый в архив XML. После распаковки будут полные 53 ГБ (для распаковки запасайте 110 ГБ). И как начнёшь его парсить да конвертить, то и 110 ГБ будет мало. О потребном размере ОЗУ тоже будет.

Источник
Загрузка...
20 дней назад
#

Proof of Concept: целесообразность внутреннего ML проекта



Недавно в уютном чатике дата сатанистов подняли вопрос, как правильно «продавать» внутренние проекты по машинному обучению. Оказалось, что многие из нас весьма брезгливо относятся к экономическому обоснованию своей деятельности. Меж тем, чтобы провести минимальную оценку рентабельности проекта, никакого MBA не нужно — в небольшой статье (10 страниц текста, ке-ке-ке) я расскажу вам, что такое рентабельность инвестиций, как оценить её для внутреннего проекта, какую роль в этом играет Proof of Concept, и почему в реальной жизни всё может пойти не так. Делать мы всё это будем вокруг вымышленного проекта по автоматизации составления расписаний для колл-центра. Добро пожаловать под кат!



Я сделяль!



Источник
Загрузка...
20 дней назад
#

Краткая история одной «умной ленты»





Социальные сети — это один из наиболее востребованных на сегодняшний день интернет-продуктов и один из основных источников данных для анализа. Внутри же самих социальных сетей самой сложной и интересной задачей в сфере data science по праву считается формирование ленты новостей. Ведь для удовлетворения всё возрастающих требований пользователя к качеству и релевантности контента необходимо научиться собирать информацию из многих источников, вычислять прогноз реакции пользователя и балансировать между десятками конкурирующих метрик в А/Б-тесте. А большие объемы данных, высокие нагрузки и жесткие требования к скорости ответа делают задачу ещё интереснее.

Источник
Загрузка...
Den
22 дня назад
#

Захват сигнала мышечной активности в систему машинного обучения



Около полугода назад ко мне пришла идея создания открытого фреймворка для нейроинтерфейсов.

Источник
Загрузка...
22 дня назад
#

Другой GitHub: репозитории по Data Science, визуализации данных и глубокому обучению





(
с)

Гитхаб — это не просто площадка для хостинга и совместной разработки IT-проектов, но и огромная база знаний, составленная сотнями экспертов. К счастью, сервис предоставляет не просто инструменты для работы с открытым исходным кодом, но и качественные материалы для обучения. Мы выбрали некоторые популярные репозитории и отсортировали их по количеству звезд в порядке убывания.

Эта подборка поможет разобраться, на какие именно репозитории стоит обратить внимание, если вас интересует работа с данными и сфера глубокого обучения.

Источник
Загрузка...
Den
22 дня назад
#

Почему работой CarPrice управляет искусственный интеллект?



О нейросетях последние года три было написано и сказано немало. Подумав, мы тоже решили рассказать, как мы используем «искусственный разум» в повседневной работе. Тем более что со многими рутинными операциями он справляется значительно лучше людей.



В продажах автомобилей все основные операции традиционно завязаны на людях — эмоциональных и в разной степени надежных. Ежегодно CarPrice проводит до 150 тысяч аукционов, а значит в недрах компании накапливается терабайты статистики по каждой модели авто, от ее реального состояния и до динамики цены в зависимости от места продажи и времени суток. Можно ли, анализируя массивы информации увеличивать конверсию в продажу? Можно и нужно!

Источник
Загрузка...
2 3

Авторизация

Пользователи

Андрей Подольский
Kumskov
Juan
Tutu
naikdij88
NewEXE
Георгiй Москвитинъ
Andpyxa Tutunnik
Andrey_fox

GeekBrains

КАРКАМ

Нетология